La división de Alibaba Group, Alibaba Qwen, ha presentado un nuevo modelo de IA llamado Qwen2.5-Max. La organización afirmó que supera a soluciones como GPT-4o, DeepSeek-V3, Llama-3.1-405B y Claude 3.5 Sonnet en términos de rendimiento.
Según el lanzamiento oficial, este modelo fue entrenado con más de 20 billones de tokens utilizando la técnica de ajuste fino supervisado (SFT) y refuerzo basado en retroalimentación (RLHF).
Para evaluar el rendimiento de la solución, los desarrolladores utilizaron una serie de benchmarks. Estos incluyen MMLU-Pro, LiveCodeBench, LiveBench y Arena-Hard. A continuación se presentan los resultados de la evaluación del nuevo modelo de IA:
El nuevo modelo ya está disponible en la interfaz Qwen Chat. El API de la solución se puede utilizar a través del servicio Alibaba Cloud Model Studio
Cabe destacar que anteriormente la empresa presentó otro modelo, el Qwen2.5-VL. Está diseñado para analizar texto e imágenes. También está disponible en Qwen Chat
Qwen2.5-Max ya no ha provocado la misma reacción en los mercados de valores y criptomonedas como DeepSeek-R1. En particular, las acciones de NVIDIA no reaccionaron de ninguna manera al evento después del colapso del 27 de enero de 2025.
Al preparar este material, están negociando a $129:
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Alibaba Qwen presentó un nuevo modelo de IA. Supera las soluciones de OpenAI y DeepSeek
La división de Alibaba Group, Alibaba Qwen, ha presentado un nuevo modelo de IA llamado Qwen2.5-Max. La organización afirmó que supera a soluciones como GPT-4o, DeepSeek-V3, Llama-3.1-405B y Claude 3.5 Sonnet en términos de rendimiento.
Según el lanzamiento oficial, este modelo fue entrenado con más de 20 billones de tokens utilizando la técnica de ajuste fino supervisado (SFT) y refuerzo basado en retroalimentación (RLHF).
Para evaluar el rendimiento de la solución, los desarrolladores utilizaron una serie de benchmarks. Estos incluyen MMLU-Pro, LiveCodeBench, LiveBench y Arena-Hard. A continuación se presentan los resultados de la evaluación del nuevo modelo de IA:
El nuevo modelo ya está disponible en la interfaz Qwen Chat. El API de la solución se puede utilizar a través del servicio Alibaba Cloud Model Studio
Cabe destacar que anteriormente la empresa presentó otro modelo, el Qwen2.5-VL. Está diseñado para analizar texto e imágenes. También está disponible en Qwen Chat
Qwen2.5-Max ya no ha provocado la misma reacción en los mercados de valores y criptomonedas como DeepSeek-R1. En particular, las acciones de NVIDIA no reaccionaron de ninguna manera al evento después del colapso del 27 de enero de 2025.
Al preparar este material, están negociando a $129: