Alibaba发布了新的AI模型Qwen2

robot
摘要生成中

阿里巴巴发布了新的AI模型Qwen2

中国科技巨头阿里巴巴宣布推出新款人工智能模型Qwen2

它由阿里云开发,是下一代通益千问(Qwen)。它包括 Tongyi Qianwen LLM(或 Qwen)、Qwen-VL 和 Qwen-Audio。

Qwen2系列包括五种模型,参数数量从0.5到720亿不等,这些模型是通过使用来自27种语言不同行业的数据进行训练的。

阿里巴巴Qwen2系列人工智能模型比较。数据:Qwen.Queen2-72B网站上,Queen2-72B是该系列中最强大的模型,使用3万亿令牌进行训练。相比之下,Meta的Llama-2指标为2万亿令牌,Llama-3为15万亿令牌。01928374656574839201

Qwen2可以处理长对话上下文-最多128,000个令牌,与OpenAI的GPT-4o相当。团队声称,他们的模型在几乎所有最重要的合成测试中都优于Meta的LLama3。

将Queen2-72B与竞争对手进行比较。数据来源:Qwen网站。独立平台Elo Arena认为Qwen2-72B-Instruct稍好于GPT-4-0314,但不如Llama3 70B和GPT-4-0125-preview。

*与包括之前发布的Qwen1.5在内的现代开源语言模型相比,Qwen2在许多语言理解、语言生成、多语言、编程、数学和思维测试中表现出了竞争力。

Qwen2模型展示出对长篇上下文的良好理解。Qwen2-72B-Instruct可以在任何地方无误地执行信息提取任务,并几乎完美地通过了“大海捞针”测试。通常,不同模型的性能会随着与其互动的次数而开始下降。

测试“干草堆中的针”。“针”数据:Qwen网站。此前,阿里巴巴宣布推出具有人工智能的聊天机器人Tongyi Qianwen。

请注意,今年四月,Meta 宣布在 WhatsApp、Instagram、Facebook 和 Messenger 平台上推出了免费的 Meta AI 智能助手。它基于 Llama 3 语言模型开发而成。

AUDIO1.81%
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)