1. Claude Opus 4.7 横空出世,编程能力全面反超 GPT-5.4
Anthropic 于近日正式发布 Claude Opus 4.7,这是目前 Claude 系列旗舰。在最难编程测试 SWE-bench Pro 上,Opus 4.7 得分跃升 11%,首次将 GPT-5.4 摁在地上,同时 SWE-bench 达到 64.3%,电脑操作控制(computer use)达到 78%。视觉能力也有重大突破,率先解决了业界长期存在的图像细节识别缺陷。API 已开放更高并发配额,主打长任务处理与自动验证输出准确性。社区评价普遍正面,认为这代 Opus 不再是"展示用",而是真正可投入生产的顶级编程 Agent。
🔗 https://twitter.com/i/web/status/2045448688307515626