Le géant technologique chinois Alibaba a annoncé le lancement d'un nouveau modèle d'intelligence artificielle Qwen2
Elle a été développée par Alibaba Cloud et est la prochaine génération de Tongyi Qianwen (Qwen). Il comprend Tongyi Qianwen LLM (ou Qwen), Qwen-VL et Qwen-Audio.
La famille Qwen2 comprend une série de cinq modèles avec des tailles allant de 0,5 à 72 milliards de paramètres, qui ont été formés à l'aide de données provenant de différents secteurs dans 27 langues.
Comparaison des modèles d'IA de la série Qwen2 d'Alibaba. Données : le site Qwen.Queen2-72B est le modèle le plus puissant de la série, formé avec 3 billions de jetons. En comparaison, le modèle Llama-2 de Meta utilise 2 billions de jetons, et Llama-3 utilise 15 billions de jetons.
Qwen2 peut traiter un contexte de dialogue long - jusqu'à 128 000 jetons, ce qui est comparable à GPT-4o d'OpenAI. L'équipe affirme que leur modèle surpasse LLama3 de Meta dans presque tous les tests synthétiques les plus importants.
Comparaison de Queen2-72B avec ses concurrents. Données : site Qwen. La plateforme indépendante Elo Arena évalue Qwen2-72B-Instruct un peu mieux que GPT-4-0314, mais moins bien que Llama3 70B et GPT-4-0125-preview
*"Comparé aux modèles linguistiques open source modernes, y compris le précédent Qwen1,5, Qwen2 a surpassé la plupart des modèles et a démontré sa compétitivité dans plusieurs tests portant sur la compréhension du langage, la génération de langage, le multilinguisme, la programmation, les mathématiques et la pensée", a déclaré l'équipe Qwen.
Les modèles Qwen2 démontrent une bonne compréhension des longs contextes. Qwen2-72B-Instruct peut effectuer des tâches d'extraction d'informations sans erreur n'importe où et a presque parfaitement réussi le test de l'aiguille dans une botte de foin. Souvent, les performances de différents modèles commencent à se détériorer à mesure qu'ils interagissent avec.
Test "Aiguille dans une botte de foin". Données : site Qwen. Auparavant, Alibaba a annoncé l'émission d'un chatbot avec une intelligence artificielle Tongyi Qianwen.
Rappelons qu'en avril, Meta a annoncé le lancement de l'assistant Meta AI gratuit sur les plateformes WhatsApp, Instagram, Facebook et Messenger. Il est basé sur le modèle linguistique Llama 3.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Alibaba a lancé un nouveau modèle d'IA Qwen2
Alibaba a lancé le nouveau modèle d'IA Qwen2
Le géant technologique chinois Alibaba a annoncé le lancement d'un nouveau modèle d'intelligence artificielle Qwen2
Elle a été développée par Alibaba Cloud et est la prochaine génération de Tongyi Qianwen (Qwen). Il comprend Tongyi Qianwen LLM (ou Qwen), Qwen-VL et Qwen-Audio.
La famille Qwen2 comprend une série de cinq modèles avec des tailles allant de 0,5 à 72 milliards de paramètres, qui ont été formés à l'aide de données provenant de différents secteurs dans 27 langues.
Comparaison des modèles d'IA de la série Qwen2 d'Alibaba. Données : le site Qwen.Queen2-72B est le modèle le plus puissant de la série, formé avec 3 billions de jetons. En comparaison, le modèle Llama-2 de Meta utilise 2 billions de jetons, et Llama-3 utilise 15 billions de jetons.
Qwen2 peut traiter un contexte de dialogue long - jusqu'à 128 000 jetons, ce qui est comparable à GPT-4o d'OpenAI. L'équipe affirme que leur modèle surpasse LLama3 de Meta dans presque tous les tests synthétiques les plus importants.
Comparaison de Queen2-72B avec ses concurrents. Données : site Qwen. La plateforme indépendante Elo Arena évalue Qwen2-72B-Instruct un peu mieux que GPT-4-0314, mais moins bien que Llama3 70B et GPT-4-0125-preview
Les modèles Qwen2 démontrent une bonne compréhension des longs contextes. Qwen2-72B-Instruct peut effectuer des tâches d'extraction d'informations sans erreur n'importe où et a presque parfaitement réussi le test de l'aiguille dans une botte de foin. Souvent, les performances de différents modèles commencent à se détériorer à mesure qu'ils interagissent avec.
Test "Aiguille dans une botte de foin". Données : site Qwen. Auparavant, Alibaba a annoncé l'émission d'un chatbot avec une intelligence artificielle Tongyi Qianwen.
Rappelons qu'en avril, Meta a annoncé le lancement de l'assistant Meta AI gratuit sur les plateformes WhatsApp, Instagram, Facebook et Messenger. Il est basé sur le modèle linguistique Llama 3.