Alibaba Qwen представила новую ИИ-модель. Она превосходит решения от OpenAI и DeepSeek

robot
Генерация тезисов в процессе

Подразделение компании Alibaba Group — Alibaba Qwen — представило новую ИИ-модель под названием Qwen2.5-Max. В организации заявили, что она превосходит по показателям такие решения, как GPT-4o, DeepSeek-V3, Llama-3.1-405B и Claude 3.5 Sonnet

Согласно официальному релизу, это модель была обучена на более чем 20 трлн токенов с использованием методик supervised fine-tuning (SFT) и подкрепления на основе отзывов (RLHF)

Для оценки производительности решения разработчики использовали ряд бенчмарков. Это, в частности, MMLU-Pro, LiveCodeBench, LiveBench и Arena-Hard. Результаты оценки новой ИИ-модели представлены ниже:

Новая модель уже доступна в интерфейсе Qwen Chat. API решения можно использовать через сервис Alibaba Cloud Model Studio

Отметим, ранее компания представила еще одну модель — Qwen2.5-VL. Она предназначена для анализа текста и изображений. Она также доступна в Qwen Chat

Qwen2.5-Max уже не вызвала такой реакции фондового и криптовалютного рынков, как DeepSeek-R1. В частности, акции NVIDIA никак не отреагировали на событие после обвала 27 января 2025 года

При подготовке этого материала они торгуются по $129:

MAX-0.78%
GPT4.74%
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить