Alibaba Qwenは新しいAIモデルを発表しました。それはOpenAIやDeepSeekのソリューションを凌駕しています

robot
概要作成中

アリババグループの部門であるアリババクエンは、Qwen2.5-Maxという新しいAIモデルを発表しました。同社は、これがGPT-4o、DeepSeek-V3、Llama-3.1-405B、Claude 3.5 Sonnetなどのソリューションを上回っていると述べています。

公式リリースによれば、このモデルは、監視された微調整((SFT))およびフィードバックに基づく強化学習((RLHF))の手法を用いて、20兆以上のトークンで訓練されました。

開発者は、ソリューションのパフォーマンスを評価するために、複数のベンチマークを使用しました。具体的には、MMLU-Pro、LiveCodeBench、LiveBench、Arena-Hardなどがあります。新しいAIモデルの評価結果は以下の通りです:

新しいモデルはすでにQwen Chatインターフェースで利用可能です。ソリューションのAPIはAlibaba Cloud Model Studioサービスを介して使用することができます

以前に同社は別のモデルであるQwen2.5-VLを発表したことに注意してください。テキストと画像の分析用に設計されています。Qwen Chatでも利用できます

Qwen2.5-Maxは、DeepSeek-R1と同様に、株式市場や仮想通貨市場に対してあまり反応を示していません。特に、NVIDIAの株価は、2025年1月27日の暴落後も何の反応も示していません。

この資料の準備中に、彼らは$129で取引されています。

MAX-0.58%
GPT-0.17%
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン
いつでもどこでも暗号資産取引
qrCode
スキャンしてGateアプリをダウンロード
コミュニティ
日本語
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)