Alibaba发布了新的AI模型Qwen2

2024-06-10 03:10:00

摘要生成中

阿里巴巴发布了新的AI模型Qwen2

中国科技巨头阿里巴巴宣布推出新款人工智能模型Qwen2

它由阿里云开发，是下一代通益千问（Qwen）。它包括 Tongyi Qianwen LLM（或 Qwen）、Qwen-VL 和 Qwen-Audio。

Qwen2系列包括五种模型，参数数量从0.5到720亿不等，这些模型是通过使用来自27种语言不同行业的数据进行训练的。

阿里巴巴Qwen2系列人工智能模型比较。数据：Qwen.Queen2-72B网站上，Queen2-72B是该系列中最强大的模型，使用3万亿令牌进行训练。相比之下，Meta的Llama-2指标为2万亿令牌，Llama-3为15万亿令牌。01928374656574839201

Qwen2可以处理长对话上下文-最多128,000个令牌，与OpenAI的GPT-4o相当。团队声称，他们的模型在几乎所有最重要的合成测试中都优于Meta的LLama3。

将Queen2-72B与竞争对手进行比较。数据来源：Qwen网站。独立平台Elo Arena认为Qwen2-72B-Instruct稍好于GPT-4-0314，但不如Llama3 70B和GPT-4-0125-preview。

*与包括之前发布的Qwen1.5在内的现代开源语言模型相比，Qwen2在许多语言理解、语言生成、多语言、编程、数学和思维测试中表现出了竞争力。

Qwen2模型展示出对长篇上下文的良好理解。Qwen2-72B-Instruct可以在任何地方无误地执行信息提取任务，并几乎完美地通过了“大海捞针”测试。通常，不同模型的性能会随着与其互动的次数而开始下降。

测试“干草堆中的针”。“针”数据：Qwen网站。此前，阿里巴巴宣布推出具有人工智能的聊天机器人Tongyi Qianwen。

请注意，今年四月，Meta 宣布在 WhatsApp、Instagram、Facebook 和 Messenger 平台上推出了免费的 Meta AI 智能助手。它基于 Llama 3 语言模型开发而成。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

0/400

暂无评论