Alibaba發佈了新的AI模型Qwen2

2024-06-10 03:10:00

摘要生成中

阿里巴巴發佈了新的AI模型Qwen2

中國科技巨頭阿里巴巴宣佈推出新款人工智能模型Qwen2

它由阿里雲開發，是下一代通益千問（Qwen）。它包括 Tongyi Qianwen LLM（或 Qwen）、Qwen-VL 和 Qwen-Audio。

Qwen2系列包括五種模型，參數數量從0.5到720億不等，這些模型是通過使用來自27種語言不同行業的數據進行訓練的。

阿里巴巴Qwen2系列人工智能模型比較。數據：Qwen.Queen2-72B網站上，Queen2-72B是該系列中最強大的模型，使用3萬億令牌進行訓練。相比之下，Meta的Llama-2指標爲2萬億令牌，Llama-3爲15萬億令牌。01928374656574839201

Qwen2可以處理長對話上下文-最多128,000個令牌，與OpenAI的GPT-4o相當。團隊聲稱，他們的模型在幾乎所有最重要的合成測試中都優於Meta的LLama3。

將Queen2-72B與競爭對手進行比較。數據來源：Qwen網站。獨立平臺Elo Arena認爲Qwen2-72B-Instruct稍好於GPT-4-0314，但不如Llama3 70B和GPT-4-0125-preview。

*與包括之前發佈的Qwen1.5在內的現代開源語言模型相比，Qwen2在許多語言理解、語言生成、多語言、編程、數學和思維測試中表現出了競爭力。

Qwen2模型展示出對長篇上下文的良好理解。Qwen2-72B-Instruct可以在任何地方無誤地執行信息提取任務，並幾乎完美地通過了“大海撈針”測試。通常，不同模型的性能會隨着與其互動的次數而開始下降。

測試“乾草堆中的針”。“針”數據：Qwen網站。此前，阿里巴巴宣佈推出具有人工智能的聊天機器人Tongyi Qianwen。

請注意，今年四月，Meta 宣佈在 WhatsApp、Instagram、Facebook 和 Messenger 平臺上推出了免費的 Meta AI 智能助手。它基於 Llama 3 語言模型開發而成。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

留言

0/400

暫無留言