Google publie un agent de recherche approfondie amélioré avec une nouvelle API d'interactions pour les développeurs

En résumé

Google vient de publier une version améliorée de son agent Deep Research, désormais accessible aux développeurs via une nouvelle API Interactions — avec des déploiements grand public prévus bientôt pour Search, NotebookLM et l’application Gemini.

Google Releases Upgraded Deep Research Agent With New Interactions API For Developers

La société technologique Google a déclaré avoir lancé une version largement améliorée de son agent Deep Research, désormais accessible aux développeurs via une nouvelle API Interactions, avec une disponibilité pour le grand public prévue pour Search, NotebookLM et l’application Gemini.

Pour la première fois, les développeurs peuvent intégrer directement dans leurs propres applications les capacités de recherche autonome les plus avancées de Google. Gemini Deep Research est conçu pour des tâches prolongées de collecte et de synthèse d’informations, et son système de raisonnement est alimenté par Gemini 3 Pro, décrit comme le modèle le plus précis de la société à ce jour. Il a été entraîné pour réduire les hallucinations et améliorer la clarté et la fiabilité des rapports complexes. En élargissant l’apprentissage par renforcement multi-étapes pour la recherche, l’agent peut naviguer de manière autonome dans des environnements informationnels complexes avec une précision améliorée.

L’agent construit son flux de recherche étape par étape en générant des requêtes, en examinant les résultats, en identifiant les informations manquantes, et en poursuivant le processus jusqu’à ce qu’il termine son investigation. La nouvelle version comprend des améliorations majeures des performances de recherche sur le web, permettant une navigation plus approfondie sur les sites pour extraire des données très spécifiques.

Selon Google, la dernière version offre des performances de pointe sur Humanity’s Last Exam (HLE) et DeepSearchQA, tout en atteignant ses meilleurs résultats à ce jour sur BrowseComp. Elle est optimisée pour produire des rapports bien documentés à un coût nettement inférieur et sera bientôt intégrée à Google Search, NotebookLM, Google Finance, ainsi qu’à une version améliorée de l’application Gemini.

Les premiers tests montrent déjà des gains substantiels dans des domaines où la précision et la compréhension contextuelle détaillée sont essentielles. Dans le secteur des services financiers, les entreprises ont commencé à utiliser Gemini Deep Research pour rationaliser les premières phases de la due diligence en regroupant des indicateurs de marché, des insights concurrents, et des considérations de conformité issues de sources publiques et propriétaires. Cela a rendu l’agent un outil précieux pour les équipes d’investissement menant des workflows préliminaires.

Dans le secteur scientifique, l’agent est appliqué à des recherches complexes liées à la sécurité. Axiom Bio, une entreprise développant des systèmes d’IA pour prédire la toxicité des médicaments, a rapporté que Gemini Deep Research apportait une profondeur d’analyse initiale et une précision dans la littérature biomédicale, permettant à ses processus de recherche et de découverte de progresser plus rapidement.

Pour les développeurs construisant des systèmes de recherche automatisés, l’agent Gemini Deep Research offre une large gamme de fonctionnalités pour synthétiser l’information et produire des rapports détaillés et vérifiables. Il supporte une analyse unifiée des documents utilisateur tels que PDFs, CSVs et fichiers texte, en complément des sources web publiques, en combinant File Upload avec l’outil de recherche de fichiers.

Il gère efficacement un contexte étendu, permettant aux développeurs d’inclure une grande quantité de matière de fond directement dans l’invite. La structure de sortie peut être façonnée via des prompts, offrant un contrôle total sur la mise en page du rapport, les titres, et la présentation des données. Le système fournit des citations précises pour chaque affirmation, assurant la transparence quant à la provenance des données, et supporte des sorties structurées, notamment des schémas JSON, pour une intégration simplifiée dans des applications en aval.

Google open-sources DeepSearchQA pour faire progresser la recherche web multi-étapes

De plus, Google a annoncé l’open-sourcing d’un nouveau benchmark appelé DeepSearchQA, conçu pour évaluer l’efficacité des agents de recherche dans la gestion d’enquêtes complètes et multi-étapes sur le web. DeepSearchQA comprend 900 tâches de chaînes causales construites manuellement couvrant 17 domaines, chaque étape s’appuyant sur les conclusions de la précédente. Plutôt que de se limiter à des questions simples de récupération de faits, le benchmark mesure la capacité d’un agent à produire des ensembles de réponses exhaustifs et complets, permettant d’évaluer à la fois la précision de la recherche et la couverture de la récupération.

DeepSearchQA est également destiné à servir de ressource diagnostique pour étudier les effets d’un temps de raisonnement prolongé. Des tests internes ont montré que la performance s’améliore lorsque les agents ont plus d’opportunités pour effectuer des recherches et cycles de raisonnement supplémentaires, un domaine que Google prévoit d’étendre dans de futures versions.

Les matériaux du benchmark sont publiés pour encourager une progression continue vers des agents de recherche plus performants. Les développeurs et chercheurs peuvent consulter le jeu de données, le tableau de classement, et le Colab de démarrage, ainsi qu’étudier la méthodologie sous-jacente décrite dans le rapport technique associé.

Bien que le paysage de Deep Research soit déjà très concurrentiel, l’agent mis à jour par Google introduit des améliorations notables qui s’appuient sur les capacités des modèles Gemini 3 existants. La sortie marque également la première fois où les développeurs peuvent intégrer cette technologie directement dans leurs propres applications, offrant une avancée significative pour la fonctionnalité de recherche dans des produits tiers.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)