Alibaba Qwen представила новую ИИ-модель. Она превосходит решения от OpenAI и DeepSeek

2025-01-29 08:04:46

Генерация тезисов в процессе

Подразделение компании Alibaba Group — Alibaba Qwen — представило новую ИИ-модель под названием Qwen2.5-Max. В организации заявили, что она превосходит по показателям такие решения, как GPT-4o, DeepSeek-V3, Llama-3.1-405B и Claude 3.5 Sonnet

Согласно официальному релизу, это модель была обучена на более чем 20 трлн токенов с использованием методик supervised fine-tuning (SFT) и подкрепления на основе отзывов (RLHF)

Для оценки производительности решения разработчики использовали ряд бенчмарков. Это, в частности, MMLU-Pro, LiveCodeBench, LiveBench и Arena-Hard. Результаты оценки новой ИИ-модели представлены ниже:

Новая модель уже доступна в интерфейсе Qwen Chat. API решения можно использовать через сервис Alibaba Cloud Model Studio

Отметим, ранее компания представила еще одну модель — Qwen2.5-VL. Она предназначена для анализа текста и изображений. Она также доступна в Qwen Chat

Qwen2.5-Max уже не вызвала такой реакции фондового и криптовалютного рынков, как DeepSeek-R1. В частности, акции NVIDIA никак не отреагировали на событие после обвала 27 января 2025 года

При подготовке этого материала они торгуются по $129:

MAX-0.78%

GPT4.74%

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

Награда
лайк
комментарий
Репост
Поделиться

комментарий

0/400

Нет комментариев

Популярные темыПодробнее
#Joingrowthpointsdrawtowiniphone17
8.2K Популярность
#Gatelayerofficiallylaunches
4.7M Популярность
#BtcPriceAnalysis
121.9K Популярность
#AreYouBullishOrBearishToday?
79K Популярность
#ShowMyAlphaPoints
164.7K Популярность

Закрепить

Карта сайта