Alibaba Qwenは新しいAIモデルを発表しました。それはOpenAIやDeepSeekのソリューションを凌駕しています

2025-01-29 08:04:46

概要作成中

アリババグループの部門であるアリババクエンは、Qwen2.5-Maxという新しいAIモデルを発表しました。同社は、これがGPT-4o、DeepSeek-V3、Llama-3.1-405B、Claude 3.5 Sonnetなどのソリューションを上回っていると述べています。

公式リリースによれば、このモデルは、監視された微調整（(SFT)）およびフィードバックに基づく強化学習（(RLHF)）の手法を用いて、20兆以上のトークンで訓練されました。

開発者は、ソリューションのパフォーマンスを評価するために、複数のベンチマークを使用しました。具体的には、MMLU-Pro、LiveCodeBench、LiveBench、Arena-Hardなどがあります。新しいAIモデルの評価結果は以下の通りです:

新しいモデルはすでにQwen Chatインターフェースで利用可能です。ソリューションのAPIはAlibaba Cloud Model Studioサービスを介して使用することができます

以前に同社は別のモデルであるQwen2.5-VLを発表したことに注意してください。テキストと画像の分析用に設計されています。Qwen Chatでも利用できます

Qwen2.5-Maxは、DeepSeek-R1と同様に、株式市場や仮想通貨市場に対してあまり反応を示していません。特に、NVIDIAの株価は、2025年1月27日の暴落後も何の反応も示していません。

この資料の準備中に、彼らは$129で取引されています。

MAX-0.58%

GPT-0.17%

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

0/400

コメントなし