1. Anthropic Mythos Preview:代码优化速度达人类的 52 倍
Anthropic 发布了一项持续性基准测试结果,令业界震惊。测试方法是给模型一段训练小型 AI 的代码,要求其进行性能优化,完成任务需要熟练工程师 4-8 小时。2024 年 5 月,Claude Opus 4 平均实现约 3 倍加速;而今年 4 月,Mythos Preview 达到了约 52 倍加速。这一结果直观展示了 AI 编程能力在过去两年内的指数级跃升。对于需要大量工程优化的场景(高频交易、科学计算、推理加速),这意味着 AI 已经可以在小时内完成以前需要数天的优化工作。社区反应热烈,该推文获得超过 94 万次浏览和 3499 个点赞,成为本周 AI 圈最高互动推文之一。
🔗 https://twitter.com/i/web/status/2062568869240476050