Google dévoile Gemma 4 comme son modèle d'IA ouverte le plus avancé pour le raisonnement et les tâches agentiques

Google a introduit Gemma 4, sa dernière famille de modèles d’intelligence artificielle open source, axée sur un raisonnement avancé et des workflows de type agent.

Résumé

  • Google lance Gemma 4, sa dernière famille de modèles d’IA open source axée sur un raisonnement avancé et des workflows de type agent.
  • Le modèle est disponible en quatre tailles, allant de variantes pour appareils en périphérie à des systèmes haute performance, et prend en charge plus de 140 langues.
  • Gemma 4 introduit des fonctionnalités telles que le raisonnement multi-étapes, des outils pour les agents et la génération de code hors ligne, avec des modèles accessibles via AI Studio et Edge Gallery.

Dans un billet du 2 avril sur X, Demis Hassabis, directeur général de Google DeepMind, a annoncé le lancement de Gemma 4, sa dernière famille de modèles d’intelligence artificielle open source axée sur un raisonnement avancé et des workflows agentic.

Les modèles open sont conçus pour être modifiés et adaptés par les développeurs, ce qui leur permet d’ajuster les systèmes à des cas d’usage spécifiques.

Le lancement intervient dans un contexte de forte adoption de l’écosystème Gemma. Depuis le lancement de la première version, les développeurs ont enregistré plus de 400 millions de téléchargements et créé plus de 100 000 variantes, selon Google.

Une famille de modèles à quatre niveaux ciblant du matériel et des cas d’usage variés

Hassabis a déclaré que Gemma 4 est disponible en quatre tailles, chacune adaptée à différents types de charges de travail et configurations matérielles, et peut être affinée pour des tâches spécialisées.

La plus grande version, 31B, est un modèle dense conçu pour une « excellente performance brute », donnant la priorité à la précision et à la profondeur de la sortie, même si elle nécessite des ressources informatiques haut de gamme.

À ses côtés se trouve le modèle 26B Mixture of Experts (MoE), conçu pour une latence plus faible. Il active moins de paramètres lors de l’inférence, ce qui permet des réponses plus rapides et une meilleure efficacité, avec toutefois certains compromis sur la qualité de la sortie.

Pour des cas d’usage plus légers, Google a introduit les modèles 2B et 4B. Ceux-ci sont optimisés pour des appareils en périphérie tels que les smartphones et des systèmes compacts, permettant une exécution directement sur l’appareil avec des exigences de calcul moindres.

Qu’est-ce que vous pouvez faire avec Google Gemma 4 ?

Gemma 4 introduit des capacités de raisonnement améliorées, lui permettant de traiter des tâches qui nécessitent une logique multi-étapes et une résolution de problèmes structurée. Elle a également montré de meilleures performances dans des benchmarks liés aux mathématiques et au respect des consignes.

Les modèles prennent en charge des workflows de type agent via l’appel natif de fonctions, des sorties JSON structurées et des instructions au niveau du système. Ces fonctionnalités permettent aux développeurs de construire des systèmes autonomes capables d’interagir avec des API, des outils et des services externes. Gemma 4 permet aussi une génération de code hors ligne de haute qualité, transformant les machines locales en assistants de codage avec l’IA.

Une autre fonctionnalité clé est sa fenêtre de contexte étendue. Les modèles en périphérie prennent en charge jusqu’à 128K tokens, tandis que les variantes plus grandes l’étendent à 256K tokens, permettant de traiter de longs documents ou des bases de code dans une seule requête. Les modèles sont entraînés sur plus de 140 langues, ce qui permet un déploiement à l’échelle mondiale.

Sundar Pichai a republié l’annonce, déclarant que Gemma 4 « regroupe une quantité incroyable d’intelligence par paramètre ».

Les modèles sont conçus pour fonctionner sur un vaste éventail de matériel, des smartphones et ordinateurs portables aux GPU et postes de travail des développeurs, avec des variantes plus petites capables de tourner en local sans accès Internet constant.

Les développeurs peuvent commencer à tester Gemma 4 sur plusieurs plateformes : les modèles 31B et 26B MoE sont disponibles sur Google AI Studio pour des cas d’usage nécessitant des performances plus élevées, tandis que les variantes plus petites E2B et E4B sont accessibles via Google AI Edge Gallery pour des applications sur appareil et légères.

Divulgation : Cet article ne représente pas un conseil en investissement. Le contenu et les supports présentés sur cette page sont fournis uniquement à des fins éducatives.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler