Mistral AI meluncurkan Leanstral: Agent kode open-source Lean 4 pertama yang dapat secara otomatis menghasilkan bukti formal

Gate News melaporkan bahwa pada 17 Maret, Mistral AI hari ini merilis Leanstral, agen kode sumber terbuka pertama yang dirancang khusus untuk alat verifikasi formal Lean 4. Inovasi utama dari model ini adalah kemampuannya untuk menghasilkan kode AI sekaligus output bukti formal yang dapat diverifikasi secara otomatis oleh Lean 4, sehingga menghindari hambatan tradisional dalam proses peninjauan manual kode yang dihasilkan AI.

Leanstral menggunakan arsitektur MoE sparse, dengan total 120 miliar parameter dan 6 miliar parameter aktif, dirilis di bawah lisensi Apache 2.0, dan telah dioptimalkan melalui pelatihan khusus untuk lean-lsp-mcp. Pengguna dapat memulai tanpa konfigurasi melalui perintah /leanstall di Mistral Vibe, atau mengaksesnya melalui endpoint API gratis labs-leanstral-2603, serta mendownload bobot model untuk deployment mandiri.

Mistral juga merilis secara bersamaan standar evaluasi baru bernama FLTEval, yang menggunakan proyek formalisasi teorema besar Fermat dari komunitas Lean 4 sebagai skenario pengujian. Data perbandingan performa menunjukkan bahwa Leanstral pass@2 dengan biaya $36 mendapatkan skor 26,3, mengalahkan Claude Sonnet 4.6 yang biaya $549 dengan skor 23,7; pass@16 dengan biaya $290 mendapatkan skor 31,9, unggul 8 poin dari Sonnet 8, sementara Claude Opus 4.6 membutuhkan biaya $1.650 untuk mencapai skor 39,6. Di antara model sumber terbuka, Qwen3.5-397B-A17B perlu dijalankan 4 kali untuk mencapai skor 25,4, yang masih di bawah performa Leanstral pass@2.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Pemungutan Suara Tata Kelola Arbitrum untuk Melepas 30.765 ETH (71 Juta Dolar AS) yang Dibekukan Setelah Eksploit Kelp DAO

Hingga saat publikasi, tata kelola Arbitrum sedang melakukan pemungutan suara atas sebuah proposal untuk melepas 30.765 ETH (sekitar $71 juta) yang dibekukan oleh Arbitrum Security Council pada 21 April setelah eksploit Kelp DAO. Proposal tersebut, yang ditulis bersama oleh Aave Labs, Kelp DAO, LayerZero, EtherFi, dan Compound, telah

GateNews1jam yang lalu

AI Agent Manfred Membentuk Perusahaan, Mendapat Dompet Kripto Sebelum Peluncuran Perdagangan Mei

Agen AI Manfred telah membentuk perusahaannya sendiri dan memperoleh dompet kripto serta kredensial bisnis, meskipun belum akan mulai memperdagangkan cryptocurrency hingga akhir Mei. Kini agen tersebut sudah siap untuk merekrut staf, melakukan pembayaran, dan menjalankan bisnis

GateNews4jam yang lalu

Keamanan Aset Digital Melangkah Melampaui Kunci Saat Bitgo Menambahkan Pemeriksaan 5-Lapis

Bitgo mendorong keamanan aset digital melampaui private key dengan model transaksi berlapis lima yang dirancang untuk menghentikan manipulasi sebelum eksekusi. Sistem ini memeriksa intent, perangkat, identitas, perilaku, dan kebijakan, dengan menargetkan risiko sebelum transaksi diselesaikan. Poin-Poin Penting: Bitgo memperkenalkan lima

Coinpedia8jam yang lalu

Riot Melaporkan Pendapatan $33M Data Center Saat AMD Menggandakan Kapasitas

Riot Platforms melaporkan pendapatan pusat data perdana sebesar 33,2 juta dolar AS pada kuartal pertama 2026 dan mengumumkan bahwa Advanced Micro Devices memilih untuk melipatgandakan kapasitas yang dipesan menjadi 50 megawatt, menurut rilis pendapatan perusahaan pada Kamis. Tonggak ini menandai langkah penting bagi Riot

CryptoFrontier9jam yang lalu

Curve Meluncurkan Mekanisme Pemulihan Piutang Macet yang Memungkinkan Pengguna untuk Keluar atau Ikut dalam Perbaikan

Menurut Curve Finance, protokol ini telah memperkenalkan mekanisme pemulihan piutang macet berbasis pasar yang memungkinkan pemegang CRV yang terdampak gagal bayar di pasar pinjaman tertentu untuk memilih dari beberapa strategi pemulihan: menjual langsung klaim utang untuk keluar, menahannya untuk menunggu potensi perbaikan, atau

GateNews10jam yang lalu

SYNBO Mengungkap Protokol Investasi On-Chain dalam Tur di Shanghai Ethereum University

Menurut ChainCatcher, SYNBO meluncurkan protokol investasi on-chain-nya selama stasiun Shanghai dari Ethereum University Tour di Fudan University. Protokol ini bertujuan untuk mengatasi fragmentasi di pasar primer saat ini yang sangat bergantung pada perantara offline di empat bidang utama

GateNews10jam yang lalu
Komentar
0/400
Tidak ada komentar