1. Kimi K2.6 横空出世,开源模型登顶 SWE-Bench
月之暗面发布 Kimi K2.6,在 SWE-bench Verified 上拿下 80.2% 的成绩,与 Claude Opus 4.6(80.8%)并驾齐驱,同时在 BrowseComp 基准上以 83.2% 超越 GPT-5.4。更值得关注的是,这是一个完全开源的模型。K2.6 还配套发布了 300 个 Agent 并发协调框架,可将执行时间大幅压缩。这次发布意味着开源阵营正式跻身编码任务顶尖梯队,社区认为"开源与闭源之间的护城河正在快速收窄"。
🔗 https://twitter.com/i/web/status/2046319800352403686