アリババは新しいAIモデルQwen2をリリースしました

2024-06-10 03:10:00

概要作成中

アリババは新しいAIモデルQwen2をリリースしました。

中国のテクノロジーギャングAlibabaは、新しい人工知能モデルQwen2のリリースを発表しました。

Alibaba Cloud によって開発され、Tongyi Qianwen (Qwen) の次世代です。これには、Tongyi Qianwen LLM(またはQwen)、Qwen-VL、Qwen-Audioが含まれます。

Qwen2ファミリーには、異なる業界のデータを使用して27の言語で訓練された0.5から72億のパラメータを持つ5つのモデルシリーズが含まれています。

AlibabaのQwen2シリーズのAIモデルの比較。データ：Qwen.Queen2-72Bサイト-シリーズで最も強力なモデルであり、3兆トークンでトレーニングされています。比較のために、MetaのLlama-2は2兆トークン、Llama-3は15兆トークンの値を持っています。

Qwen2は、OpenAIのGPT-4oと同様に、128,000トークンまでの長い対話コンテキストを処理できます。チームは、彼らのモデルがMetaのLLama3をほぼすべての重要な合成テストで上回っていると主張しています。

Queen2-72Bと競合他社の比較。データ：Qwenウェブサイト。独立したプラットフォームElo Arenaは、Qwen2-72B-InstructをGPT-4-0314よりも少し優れていると評価していますが、Llama3 70BとGPT-4-0125-previewよりは劣っています。

「オープンソースの現代の言語モデル、Qwen1.5を含む、Qwen2は多くのモデルを上回り、言語理解、言語生成、マルチ言語、プログラミング、数学、思考に焦点を当てた一連のテストで競争力を発揮しました」とQwenチームは述べました。

Qwen2モデルは長い文脈を理解する能力があります。 Qwen2-72B-Instructはどんな場所でも情報の抽出タスクをエラーなく実行し、「針の山に入る」テストをほぼ完全にパスしました。さまざまなモデルのパフォーマンスは、それとの相互作用が進むにつれて悪化する傾向があります。

テスト「針の中のヘイスタック」。データ：Qwenサイト。以前、Alibabaは人工知能チャットボットTongyi Qianwenの発行を発表しました

4月にMetaは、WhatsApp、Instagram、Facebook、Messengerのプラットフォームに無料のAIアシスタントMeta AIを立ち上げることを発表しました。これは、言語モデルLlama 3に基づいて作成されています。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

0/400

コメントなし