Pantera与Franklin Templeton加入Sentient Arena,共同测试企业级AI代理性能

PANews 2月27日消息,据Cointelegraph报道,开源AI实验室Sentient宣布推出Arena,这是一个用于评估AI代理在企业级工作流程中表现的生产级测试环境。Pantera Capital和Franklin Templeton的数字资产部门已加入Arena的首批测试队列。 Sentient表示,Arena并非静态模型测试,而是通过模拟包含长文档、不完整信息和冲突来源的企业条件,对AI代理进行标准化任务测试。平台会跟踪幻觉、证据缺失、引用错误和推理漏洞等失败类别,帮助开发者诊断问题。Arena计划通过公开排行榜发布对比性能指标,并发布总结常见失败模式和修复方案的测试报告。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

孙宇晨喊“我是 WLFI 最大受害者”列出四宗罪:智能合约藏后门、非法冻结钱包……

孙宇晨公开指控World Liberty Financial(WLFI)在智能合约中植入后门,声称其钱包在2025年遭非法冻结,并指出WLFI团队存在收取不合理费用、控制后门、冻结资金及操控治理等四大不当行为。他强调此行为违反基本投资者权利,呼吁WLFI恢复透明度。

動區BlockTempo59 分钟前

Cardano 硬分叉即将到来:最新进展在此 - U.Today

Cardano 正在为计划于 2026 年 6 月举行的范·罗塞姆(Van Rossem)硬分叉做准备,这将增强性能和安全性。然而,10.7.0 版本发布遭遇了内存问题的挫折,导致其推进至主网就绪状态被延迟,同时分析能力也在不断扩展。

UToday14小时前

Aave Labs 获得 SOC 2 Type II 合规认证

Aave Labs 已取得 SOC 2 Type II 合规认证,从而提升其在安全与数据保护方面的运营标准。这一里程碑增强了 DeFi 的信任度,推动机构参与,并使 Aave 为主流采用做好准备。它凸显了行业的成熟以及竞争优势。

Coinfomania15小时前

Bittensor 联创指责 Covenant AI 创始人背叛社区,拟推锁仓质押机制强化治理

Bittensor 联合创始人 Jacob Steeves 回应 Covenant AI 事件,指责其创始人背叛信任并致歉。Steeves 表示将推进锁仓质押机制,增强协议透明度与抗风险能力,继续推动开放 AI 发展。

GateNews15小时前

以太坊开发者称 Glamsterdam Devnet 将于下周启动,且升级进展持续推进 - U.Today

以太坊即将到来的升级 Glamsterdam 进展缓慢,开发者计划在下周启动其首个 devnet。关键特性包括 gas 重新定价和 EIP-7954。该升级预计将在 2026 年进行,而诸如 Hegotá 之类的未来升级也在进行中。

UToday16小时前

比特币开发者在测试网上发布重大更新,发生了什么变化?- U.Today

比特币开发者已发布用于测试的 v31.0rc4,通过 Tor 和 I2P 网络增强隐私性,改进内存池(mempool)设计,提高费用效率,并进行性能升级。此更新旨在优化交易管理并保护用户匿名性。

UToday17小时前
评论
0/400
暂无评论