GLM-5.1がLMArenaコードランキングでオープンソース第1位、世界第3位

robot
概要作成中

According to 1M AI News monitoring, today the global authoritative AI evaluation platform LMArena (with over one million users participating in blind tests) updated its Code Arena special ranking, with GLM-5.1 topping the global open-source model list and ranking third among all models worldwide.
GLM-5.1 not only inherits the previous generation model’s open-source SOTA coding capabilities but also makes breakthroughs in long-horizon tasks, achieving:

  1. Building a Linux desktop from scratch in 8 hours;
  2. 655 iterations breaking through the optimization bottleneck of vector databases;
  3. 1000 rounds of tool invocation optimizing real machine learning model loads.
    It is worth mentioning that under the same evaluation standards on the METR leaderboard, GLM-5.1 is the only open-source model capable of sustained work for 8 hours, and is one of the few models in the world besides Claude Opus 4.6 that possesses this capability.
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン