Gate News 消息,4 月 10 日,今日全球权威 AI 评测平台 LMArena(百万用户参与盲测的 AI 模型评测平台)更新 Code Arena 专项榜单,GLM-5.1 登顶全球开源模型第一,位列全球模型第三。

GLM-5.1 不仅继承了上一代模型的开源 SOTA 编码能力,还在长程任务(Long-Horizon Task)上取得突破,实现了:8 小时从零构建 Linux 桌面;655 次迭代打破向量数据库优化瓶颈;1000 轮工具调用优化真实机器学习模型负载。

值得一提的是,在 METR 榜单的同等评估标准下,GLM-5.1 是唯一达到 8 小时级持续工作的开源模型,也是全球范围内除 Claude Opus 4.6 外少数具备这一能力的模型。