1. Claude Opus 4.8 正式发布:更诚实的 AI 工程师
Anthropic 发布 Claude Opus 4.8,价格与上一代 4.7 持平(输入 $5/M tokens,输出 $25/M tokens)。此次最核心的变化不是跑分,而是"模型诚实度"——面对代码或推理缺陷时,Opus 4.8 更愿意承认不确定性,而非硬凑答案。SWE-bench Pro 提升至 69.2%,在大多数榜单上超越 GPT-5.5 和 Gemini 3.1 Pro。同时上线的还有 fast 模式,适合长时间 Agent 任务。社区评价两极:有人认为这是迈向自主 Agent 的关键一步,也有人认为相比 4.7 只是小版本更新,真正的突破要等 Opus 5.0。
🔗 https://twitter.com/i/web/status/2060051148921323542