Alibaba發佈了新的AI模型Qwen2

robot
摘要生成中

阿里巴巴發佈了新的AI模型Qwen2

中國科技巨頭阿里巴巴宣佈推出新款人工智能模型Qwen2

它由阿里雲開發,是下一代通益千問(Qwen)。它包括 Tongyi Qianwen LLM(或 Qwen)、Qwen-VL 和 Qwen-Audio。

Qwen2系列包括五種模型,參數數量從0.5到720億不等,這些模型是通過使用來自27種語言不同行業的數據進行訓練的。

阿里巴巴Qwen2系列人工智能模型比較。數據:Qwen.Queen2-72B網站上,Queen2-72B是該系列中最強大的模型,使用3萬億令牌進行訓練。相比之下,Meta的Llama-2指標爲2萬億令牌,Llama-3爲15萬億令牌。01928374656574839201

Qwen2可以處理長對話上下文-最多128,000個令牌,與OpenAI的GPT-4o相當。團隊聲稱,他們的模型在幾乎所有最重要的合成測試中都優於Meta的LLama3。

將Queen2-72B與競爭對手進行比較。數據來源:Qwen網站。獨立平臺Elo Arena認爲Qwen2-72B-Instruct稍好於GPT-4-0314,但不如Llama3 70B和GPT-4-0125-preview。

*與包括之前發佈的Qwen1.5在內的現代開源語言模型相比,Qwen2在許多語言理解、語言生成、多語言、編程、數學和思維測試中表現出了競爭力。

Qwen2模型展示出對長篇上下文的良好理解。Qwen2-72B-Instruct可以在任何地方無誤地執行信息提取任務,並幾乎完美地通過了“大海撈針”測試。通常,不同模型的性能會隨着與其互動的次數而開始下降。

測試“乾草堆中的針”。“針”數據:Qwen網站。此前,阿里巴巴宣佈推出具有人工智能的聊天機器人Tongyi Qianwen。

請注意,今年四月,Meta 宣佈在 WhatsApp、Instagram、Facebook 和 Messenger 平臺上推出了免費的 Meta AI 智能助手。它基於 Llama 3 語言模型開發而成。

AUDIO1.98%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)