1. GLM-5.1 开源震撼登场,SWE-Bench Pro 超越 Claude/GPT
Z AI(智谱AI)发布了开源模型 GLM-5.1,以 MIT 许可证开放权重,在 SWE-Bench Pro 上斩获 58.4% 的成绩,超过 Opus 4.6(57.3%)、GPT-5.4(57.7%)和 Gemini 3.1 Pro(54.2%)。这是迄今为止开源模型首次在编程基准上全面超越顶级闭源模型,技术亮点在于其能在 Terminal-Bench 和 NL2Repo 任务中"自主运行 8 小时、迭代数千次"。这条推文获得 16 万次浏览、1408 点赞,在 AI 圈引发强烈反响。社区普遍认为开源 vs 闭源的差距已缩短至约 6 个月,开源阵营正加速追赶。
🔗 https://twitter.com/i/web/status/2041559747065999664