A subsidiária da Alibaba Group, Alibaba Qwen, apresentou um novo modelo de IA chamado Qwen2.5-Max. A organização afirmou que ela supera soluções como GPT-4o, DeepSeek-V3, Llama-3.1-405B e Claude 3.5 Sonnet em termos de desempenho.
De acordo com o lançamento oficial, este modelo foi treinado em mais de 20 trilhões de tokens usando técnicas de ajuste fino supervisionado SFT( e reforço baseado em feedback RLHF).
Para avaliar o desempenho da solução, os desenvolvedores utilizaram uma série de benchmarks. Estes incluem MMLU-Pro, LiveCodeBench, LiveBench e Arena-Hard. Os resultados da avaliação do novo modelo de IA são apresentados abaixo:
O novo modelo já está disponível na interface Qwen Chat. A API da solução pode ser utilizada através do serviço Alibaba Cloud Model Studio.
Observemos que anteriormente a empresa lançou outro modelo, o Qwen2.5-VL. Ele é projetado para análise de texto e imagens. Também está disponível no Qwen Chat.
Qwen2.5-Max não provocou a mesma reação nos mercados de ações e criptomoedas como o DeepSeek-R1. Em particular, as ações da NVIDIA não reagiram de forma alguma ao evento após a queda em 27 de janeiro de 2025.
Ao preparar este material, eles estão sendo negociados a $129:
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
Alibaba Qwen apresentou um novo modelo de IA. Supera as soluções da OpenAI e DeepSeek.
A subsidiária da Alibaba Group, Alibaba Qwen, apresentou um novo modelo de IA chamado Qwen2.5-Max. A organização afirmou que ela supera soluções como GPT-4o, DeepSeek-V3, Llama-3.1-405B e Claude 3.5 Sonnet em termos de desempenho.
De acordo com o lançamento oficial, este modelo foi treinado em mais de 20 trilhões de tokens usando técnicas de ajuste fino supervisionado SFT( e reforço baseado em feedback RLHF).
Para avaliar o desempenho da solução, os desenvolvedores utilizaram uma série de benchmarks. Estes incluem MMLU-Pro, LiveCodeBench, LiveBench e Arena-Hard. Os resultados da avaliação do novo modelo de IA são apresentados abaixo:
O novo modelo já está disponível na interface Qwen Chat. A API da solução pode ser utilizada através do serviço Alibaba Cloud Model Studio.
Observemos que anteriormente a empresa lançou outro modelo, o Qwen2.5-VL. Ele é projetado para análise de texto e imagens. Também está disponível no Qwen Chat.
Qwen2.5-Max não provocou a mesma reação nos mercados de ações e criptomoedas como o DeepSeek-R1. Em particular, as ações da NVIDIA não reagiram de forma alguma ao evento após a queda em 27 de janeiro de 2025.
Ao preparar este material, eles estão sendo negociados a $129: