GLM-5.1 mendapatkan peringkat pertama dalam kode sumber LMArena dan peringkat ketiga secara global

robot
Pembuatan abstrak sedang berlangsung

Menurut pemantauan 1M AI News, hari ini platform penilaian AI otoritatif global LMArena (dengan lebih dari satu juta pengguna yang berpartisipasi dalam pengujian buta) memperbarui daftar khusus Code Arena, dengan GLM-5.1 menduduki puncak sebagai model sumber terbuka nomor satu di dunia, dan menempati posisi ketiga secara global. GLM-5.1 tidak hanya mewarisi kemampuan pengkodean SOTA sumber terbuka dari generasi sebelumnya, tetapi juga mencapai terobosan dalam tugas jangka panjang (Long-Horizon Task), dengan pencapaian: 1. membangun desktop Linux dari nol dalam 8 jam; 2. 655 iterasi yang memecahkan hambatan optimisasi basis data vektor; 3. 1000 putaran optimisasi panggilan alat yang menyesuaikan beban model pembelajaran mesin nyata. Yang patut dicatat, di bawah standar evaluasi yang sama pada daftar METR, GLM-5.1 adalah satu-satunya model sumber terbuka yang mampu bekerja secara berkelanjutan selama 8 jam, dan termasuk dalam sedikit model di seluruh dunia selain Claude Opus 4.6 yang memiliki kemampuan ini.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan