PANews a rapporté le 27 février que, selon Cointelegraph, le laboratoire d’IA open source Sentient a annoncé le lancement d’Arena, un environnement de test de qualité production pour évaluer les performances des agents IA dans les flux de travail au niveau des entreprises. Les divisions d’actifs numériques de Pantera Capital et Franklin Templeton ont rejoint la première cohorte de test d’Arena.
Sentient a indiqué qu’Arena n’est pas un test statique de modèle, mais teste plutôt l’agent IA sur une tâche standardisée en simulant les conditions d’entreprise avec de longs documents, des informations incomplètes et des sources contradictoires. La plateforme suit les catégories d’échecs telles que les hallucinations, les preuves manquantes, les erreurs de citation et les vulnérabilités de raisonnement afin d’aider les développeurs à diagnostiquer les problèmes. Arena prévoit de publier des indicateurs de performance comparatifs via des classements publics et de publier des rapports de test résumant les schémas de défaillance courants et les correctifs.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
MiniMax lance l’outil de ligne de commande multimodal complet MMX-CLI, conçu pour les agents IA
MiniMax a publié le 9 avril un outil de ligne de commande MMX-CLI, conçu pour les agents IA, entièrement multimodal, afin de simplifier l’appel des capacités IA de la plateforme MiniMax par les agents. Cet outil, en exécutant des commandes et en récupérant les résultats, améliore l’efficacité des flux de travail automatisés, et a fait trois améliorations de conception pour répondre aux problèmes des outils en ligne de commande dans des environnements d’automatisation.
GateNewsIl y a 12m
La plateforme d’IA Surf lance l’outil Surf Skill CLI, avec 200k $ de crédits d’API fournis gratuitement
Surf lance l’outil Surf Skill CLI, afin que les agents IA disposent de capacités de requête de données sur les crypto-monnaies, en remplaçant plus de 60 API distinctes. Les utilisateurs peuvent analyser en temps réel le marché, les tendances DeFi TVL et sociales, et bénéficier de 200k $ de crédits API gratuits, afin de simplifier le processus de développement.
GateNewsIl y a 30m
OpenClaw publie une mise à jour de version du 2026.4.9, introduisant la fonctionnalité « Rêverie » afin que les agents IA puissent créer des souvenirs
Actualités Gate News, le 9 avril, OpenClaw publie une mise à jour de version 2026.4.9. Cette mise à jour introduit officiellement la fonctionnalité « Rêverie » (Dreaming) : elle traite les données historiques par remplissage via REM et ajoute une interface UI de chronologie du journal, afin que les agents IA puissent rejouer les notes de l’utilisateur pour en faire de la mémoire. La mise à jour renforce également les protections de sécurité contre les attaques SSRF et l’injection d’exécution côté nœud, ajoute une évaluation QA de l’ambiance des rôles, et optimise entièrement le processus d’appairage Android.
GateNewsIl y a 37m
Polymarket clôture l’acquisition de Brahma pour mettre à l’échelle sa pile DeFi
Polymarket a achevé son acquisition entièrement en actions du démarrage DeFi Brahma, en intégrant sa pile de comptes intelligents pour accélérer l’exécution, approfondir la liquidité et défendre sa part alors que les marchés de prédiction explosent.
Résumé
Polymarket a achevé son acquisition du démarrage d’infrastructure DeFi Brahma.
Les activités de Brahma's f
CryptonewsIl y a 42m
SBI Ripple Asia déploie la création de jetons basée sur XRPL
SBI Ripple Asia a lancé une plateforme du XRP Ledger permettant des jetons prépayés réglementés dans le cadre du cadre juridique japonais.
Les API intègrent la blockchain aux applications existantes, permettant une utilisation transparente des jetons sans avoir à redessiner les interfaces utilisateur.
La plateforme vise les paiements dans le monde réel, offrant des transactions rapides et à faible coût
CryptoFrontNewsIl y a 44m
Trade.xyz lance des contrats sur l’indice Nikkei 225, avec un levier pouvant aller jusqu’à 20x
Actualités de Gate News, le 9 avril, sur le projet d’écosystème HIP-3 Trade.xyz, lancement de contrats sur l’indice Nikkei 225 (indice de référence du marché boursier japonais), avec un levier pouvant aller jusqu’à 20x.
GateNewsIl y a 1h