1. Claude Opus 4.7 登顶 Text Arena 综合排名,成为最全能前沿模型
Artificial Analysis 发布最新 Text Arena 基准结果,Claude Opus 4.7 在几乎所有主要类别中蝉联第一,成为目前综合能力最强的前沿模型。紧随其后的是 Google DeepMind 的 Gemini(第二名)。这是迄今最系统的跨场景能力测评,涵盖代码、推理、创意写作、多语言等维度。同时 Cursor+Opus 4.7 组合在全栈 Coding Agent Benchmark 中也以 61 分拿下第一,超过 Codex+GPT 5.5(60 分)和 Claude Code+Opus 4.7(60 分)。这意味着"模型+工具链"组合已成为评估 AI 编程能力的新维度,单看模型参数不够,配套 IDE 的质量同样关键。社区对此讨论热烈,不少开发者表示正在切换到 Cursor+Opus 4.7 作为主力编程工具。
🔗 https://twitter.com/i/web/status/2054223408427372831