Gate News 消息,3 月 17 日,Mistral AI 今日发布 Leanstral,这是首个专为形式化验证工具 Lean 4 设计的开源代码 Agent。该模型的核心创新在于,AI 生成代码的同时可输出可被 Lean 4 自动校验的形式化证明,从而绕开传统 AI 代码生成中人工审查的瓶颈环节。
Leanstral 采用稀疏 MoE 架构,拥有 120B 总参数和 6B 激活参数,以 Apache 2.0 协议开源,并针对 lean-lsp-mcp 进行了专项训练优化。用户可在 Mistral Vibe 中通过命令 /leanstall 零配置启动,或通过免费 API 端点 labs-leanstral-2603 调用,同时支持下载权重进行自部署。
Mistral 同步发布了新评估基准 FLTEval,以 Lean 4 社区的费马大定理形式化项目为测试场景。性能对比数据显示:Leanstral pass@2 以 36 美元成本得分 26.3,超过成本 549 美元的 Claude Sonnet 4.6(23.7 分);pass@16 以 290 美元成本得分 31.9,领先 Sonnet 8 分,而 Claude Opus 4.6 需 1,650 美元才能达到 39.6 分。在开源模型中,Qwen3.5-397B-A17B 需运行 4 次才能达到 25.4 分,仍低于 Leanstral pass@2 的表现。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
Hyperliquid 于 5 月 3 日在主网推出结算为每日 BTC 的结果市场
据 Odaily,Hyperliquid 今天在主网上以功能受限的初始版本上线 Outcome Markets(HIP-4)。Outcome Markets 是一种全额抵押的合约,结算在固定区间内,旨在用于预测市场和区间期权,不带杠杆或强平
GateNews30 分钟前
TON 将最低验证者质押门槛提高至 100 万枚代币
根据 TON 的官方更新,验证者的网络最低质押要求将在未来一段时间内提高至 100 万 TON 代币,较当前的 82.4 万 TON 上调。预计最高阈值将从 24.25亿 TON 提高至 300 万 TON,受驱动于增加
GateNews1小时前
Particle Network 发布通用账户路线图,推出 Universal Deposit SDK 和 AI 代理账户
据 ChainCatcher 称,Particle Network 今天发布了通用账户(Universal Accounts)的下一阶段路线图,未来几个月将推出两款新产品:Universal Deposit SDK,使开发者能够用大约 10 行代码添加多链存款,以及 Universal Agent Accounts,
GateNews1小时前
以太坊基金会完成关键的 Glamsterdam 升级里程碑,实现 2 亿 Gas 上限共识
根据以太坊基金会的说法,Glamsterdam 升级已达成关键里程碑,包括就 2 亿 Gas Limit 下限达成共识、稳定的 ePBS 外部构建器运行,以及最终确定 EIP-8037 的 gas 重新定价参数。此次升级旨在安全地提高 Gas Limit,并扩展以太坊
GateNews2小时前
eCash 提案因风险与分配问题引发开发者警告
开发者和行业人士对与 Paul Sztorc 相关的 eCash 提案提出担忧,称用户风险、分配不均以及理念上的紧张关系是关键问题。
该提案被描述为引入了危险因素,因此需要谨慎,置于加密货币共同体之中
Crypto Frontier2小时前
Wasabi Protocol 用户现在可以安全提取剩余资金
根据 Wasabi Protocol 在 X 上的官方声明,用户现在可以安全地与该协议的智能合约进行交互,并提取剩余资金。团队正在努力调查该事件,但目前尚未披露更多细节,并表示将在后续提供进一步更新 w
GateNews2小时前