AI 日报

ARTIFICIAL INTELLIGENCE DAILY
晚报
🐦

Twitter/X 热议

1. Anthropic 泄露下一代最强模型 Claude Mythos(代号 Capybara)

今天 AI 圈最大的炸弹:Anthropic 因 CMS 配置失误,意外公开了近 3000 份未发布的内部文档,Fortune 率先发现并核实。文件揭示了一款名为"Claude Mythos"的新模型,内部代号"Capybara"(水豚),代表着一个全新的模型层级——比目前最强的 Opus 系列还要更大、更强。根据泄露的草稿博客,Mythos 在编码、推理和网络安全三大核心基准上"显著超越"Opus 4.6。更引人注目的是,Anthropic 自己在文档中承认该模型"带来前所未有的网络安全风险",训练已完成但因安全顾虑尚未发布。消息在 X 上炸开,多条相关推文浏览量合计超 300 万次,引发了关于 AI 能力边界和安全发布策略的激烈讨论。

🔗 https://x.com/i/status/2037394888577216617

2. Google TurboQuant 算法引发内存股暴跌

Google 发表的 TurboQuant 算法研究论文引发了资本市场震动——该算法可将 AI 推理内存使用降低 6 倍、速度提升 8 倍。消息传出后,多家 RAM 内存公司股价暴跌,市值蒸发数百万美元。TurboQuant 的核心原理是优化大模型推理中的 KV 缓存(key-value cache),这个缓存是 AI 对话中的"工作记忆",通常占用大量显存。如果这项技术成熟落地,AI 推理的硬件门槛将大幅降低,但同时也意味着内存厂商的需求预期会被压缩。相关推文获得 5.2 万点赞和 170 万次浏览,成为今天 X 上最热 AI 话题之一。

🔗 https://x.com/i/status/2037484788286644603

3. GLM-5.1 正式发布并开放使用

智谱 AI 今天正式发布 GLM-5.1 模型,并向所有 GLM Coding Plan 用户开放。该模型延续了 GLM 系列在中文场景的优势,同时开源发布。用户可在 Claude Code 等工具中通过修改配置文件切换到 GLM-5.1 使用。公告推文在数小时内获得 2597 点赞和 19.5 万次浏览。Reddit r/LocalLLaMA 上的相关帖子也迅速获得 306 票,社区对这款开源模型表现出浓厚兴趣,认为它为中文场景提供了又一个有力选择。

🔗 https://x.com/i/status/2037490078126084514

4. Gemini 3.1 Pro + Claude Opus 4.6 组合开发获高度评价

一种新的 AI 协作编程范式正在形成:用 Claude Opus 4.6 做整体架构规划,Gemini 3.1 Pro 负责具体代码实现。多位开发者在 X 上分享了这种"双模型协作"的实践经验,推文获得 227 点赞和 5.3 万浏览。这种分工利用了 Claude 在推理规划方面的优势和 Gemini 在代码生成方面的性价比,形成互补。另有开发者分享了完整的模型分工策略:Claude Opus 做计划、Gemini 3.1 Pro 做开发、Kimi K2.5 写文档、GPT-5.3-Codex 修 Bug,将不同模型的优势最大化。

🔗 https://x.com/i/status/2036591365065453600

5. 三大开源语音 AI 模型同日发布

3 月 26-27 日成为开源语音 AI 的里程碑日:Cohere 发布 Transcribe(开放 ASR 排行榜第一)、Mistral 发布 Voxtral TTS(实时语音合成,支持 9 种语言)、腾讯发布 Covo-Audio(7B 参数集识别、推理、合成于一身)。三款模型均 100% 开源。这种"同一天三连发"的现象标志着语音 AI 正经历一场开源化浪潮——此前高质量语音处理几乎被 ElevenLabs、Whisper API 等商业服务垄断,现在从语音识别到合成再到理解的完整链路都有了开源方案。

🔗 https://x.com/i/status/2037355891855663464

6. Altman 声称曾试图在五角大楼冲突中"拯救" Anthropic

在 Anthropic 与五角大楼的法律战持续升级之际,The Information 独家报道称 Sam Altman 向 OpenAI 员工透露,他曾尝试在幕后调解这场冲突,试图"拯救"Anthropic 免于被彻底封杀。这一细节揭示了 AI 行业巨头之间微妙的竞合关系——尽管 OpenAI 和 Anthropic 是直接竞争对手,Altman 似乎意识到 Anthropic 被政府打压会为整个行业树立危险先例。该消息获得近 10 万次浏览,引发了对 AI 公司与政府关系走向的深度讨论。

🔗 https://x.com/i/status/2037311203383370028
🔥

GitHub 热榜

1

Yeachan-Heo/oh-my-claudecode ⭐ 13,456 (+1,402)

今日 GitHub 增长最快的项目,面向团队的 Claude Code 多代理编排框架。TypeScript 开发,支持团队协作场景下的多 Agent 并行工作、任务分配和结果汇总。相比早间报道的 12,711 星已暴涨近 750 星,说明开发者社区对团队级 AI 编码工具的需求极为旺盛。项目解决了 Claude Code 单人使用的局限性,让整个团队可以围绕 AI 编码构建协作流水线。

🔗 https://github.com/Yeachan-Heo/oh-my-claudecode
2

mvanhorn/last30days-skill ⭐ 11,843 (+2,824)

AI Agent 技能插件,当日增星 2824,增速惊人。可一键跨 Reddit、X、YouTube、Hacker News、Polymarket 和网页搜索进行主题研究并综合生成摘要。中文推特圈也在热议该项目,有独立开发者称其为"市场调研的作弊代码"——能快速判断一个产品方向是否已有大厂在做,或需求是否真实存在。对产品经理和独立开发者极具实用价值。

🔗 https://github.com/mvanhorn/last30days-skill
3

SakanaAI/AI-Scientist-v2 ⭐ 2,668 (+125)

Sakana AI 发布的"AI 科学家 v2"——一套基于代理树搜索的自动化科学发现系统。该系统能自主生成研究想法、编写代码、运行实验并撰写论文稿。重磅消息:v2 已通过人类同行评审,论文登上 Nature。研究发现了"科学发现的 Scaling Law"——随着计算资源增加,AI 科学家的发现质量也在按规律提升。这可能标志着 AI 辅助科研从概念走向了可靠实践。

🔗 https://github.com/SakanaAI/AI-Scientist-v2
4

microsoft/VibeVoice

微软开源前沿语音 AI 项目。在医疗音频的 STT 基准测试中,VibeVoice-ASR 9B 以 8.34% WER 成为新的开源领导者,几乎追平 Gemini 2.5 Pro 的 8.15%。但代价是模型参数量达 9B、需要约 18GB 显存。与 Mistral 的 Voxtral 和 Cohere 的 Transcribe 一起,标志着开源语音 AI 在 2026 年 Q1 迎来井喷式发展。

🔗 https://github.com/microsoft/VibeVoice
5

virattt/dexter ⭐ 19,403 (+673)

自主金融研究 Agent,用 TypeScript 构建。能自动进行深度金融分析,包括数据采集、财报解读、行业趋势研判等。日增 673 星显示金融领域对 AI Agent 自动化研究的需求正在爆发,项目为量化分析师和投资研究人员提供了可定制的 AI 研究助手方案。

🔗 https://github.com/virattt/dexter

📺

YouTube 热门

1. AI 如何重塑战场 | Bloomberg Tech: Asia

频道: Bloomberg Technology | 播放: 1,356 | 时长: 22:46 今天上线的最新深度报道,聚焦 AI 军事应用的最新进展。恰逢 Anthropic 与五角大楼的法律战白热化之际,Bloomberg 从技术和地缘政治角度分析了 AI 在军事领域的应用现状、各国军事 AI 策略差异,以及 AI 安全护栏在军事场景中的争议。节目探讨了当 AI 公司拒绝合作时政府的应对手段,以及这对 AI 行业自主权的长远影响。视频仅发布 8 小时,关注度正在快速上升。

🔗 https://www.youtube.com/watch?v=h9TqjOFceBk

2. 中国 AI 机器人突破人类技能壁垒 | AI Revolution

频道: AI Revolution | 播放: 210,396 | 时长: 14:31 4 天前发布,已获 21 万播放。详细报道了中国 AI 机器人的最新突破——多款机器人在精细操作、环境适应和人机协作方面展现出超越人类操作员的表现。视频分析了宇树科技、智元机器人等公司的最新产品,以及中国在具身智能(Embodied AI)领域的政策支持和资本投入。节目指出中国在人形机器人和工业 AI 领域正在形成与美国平行的技术路线。

🔗 https://www.youtube.com/watch?v=QDRzgF-8-50

3. NVIDIA GTC 2026 揭示 5 大 AI 与机器人拐点 | AI News

频道: AI News | 播放: 4,549 | 时长: 8:07 10 天前发布,总结了 NVIDIA GTC 2026 大会上最具影响力的五大公告。涵盖 Blackwell Ultra 架构升级、机器人 Foundation Model、AI 推理优化新范式、数字孪生扩展,以及 NVIDIA 与医疗和科研机构的新合作。视频将每个技术突破与实际应用场景对应,帮助观众理解这些进展对行业的实际影响。与今天的 TurboQuant 内存优化新闻形成技术关联。

🔗 https://www.youtube.com/watch?v=CzTIduXcXMA

4. 对 AI 和就业市场的诚实看法(2026,无炒作)| Tech With Tim

频道: Tech With Tim | 播放: 126,899 | 时长: 15:01 3 周前发布,已获近 13 万播放。Tim 以数据驱动的方式分析 AI 对程序员就业市场的实际影响——不是耸人听闻也不是盲目乐观。他引用了 Stack Overflow 调查、LinkedIn 数据和 GitHub Copilot 使用统计,得出结论:AI 确实减少了初级岗位需求,但创造了大量"AI 工程师"新角色;关键不是是否会被取代,而是需要多快适应新工具。视频评论区引发了大量开发者的经验分享。

🔗 https://www.youtube.com/watch?v=PEFso88LkC4

5. 2026 最佳 AI 视频生成器(最逼真)| Tube Sensei

频道: Tube Sensei | 播放: 28,825 | 时长: 10:24 3 天前发布,恰逢 OpenAI 关停 Sora 的消息发酵。视频全面横评了 Sora 退场后剩余的 AI 视频生成方案,包括 Runway Gen-4、Pika 2.0、Kling 2.5 和 Minimax Video-01-Pro。每个工具都用相同的提示词生成对比样本,从画面质量、动作连贯性、提示词遵循度等维度评分。结论是 Runway 和 Kling 在不同场景各有优势,但没有任何一个能完全替代 Sora 的商业定位。

🔗 https://www.youtube.com/watch?v=03UtpmLpJ08
💬

Reddit 精选

1. Mistral Voxtral TTS 开源,人类偏好测试超越 ElevenLabs (r/LocalLLaMA, ⬆️1544)

今天 r/LocalLLaMA 最热帖子。Mistral 发布的 3B 参数 TTS 模型获得了社区空前热情——1544 票证明本地语音合成是刚需。帖子详细讨论了模型的技术指标:约 3GB 内存占用、90ms 首音频延迟、支持 9 种语言(含印地语和阿拉伯语)、20 种预设声音。社区评论中已有多人完成本地部署并分享了体验,普遍反馈自然度超出预期。有开发者指出这让"完全本地化的语音助手"从理论变为现实——识别用 Whisper、合成用 Voxtral、推理用本地 LLM,无需任何云服务。

🔗 https://reddit.com/r/LocalLLaMA/comments/1s46ylj/mistral_ai_to_release_voxtral_tts_a/

2. DGX Spark 双机 vs Mac Studio M3 Ultra 512GB 本地推理深度对比 (r/LocalLLaMA, ⬆️320)

早间报道时 111 票,现已升至 320 票并成为热门。作者此前每月花 2000 美元使用 Claude API,决定各花 1 万美元购入两套硬件进行对比。核心发现:DGX Spark 双机在纯推理速度上碾压 Mac Studio(GPU 显存带宽优势),但 Mac Studio 在功耗比、日常使用便利性和生态整合上更好。帖子为"逃离 API"的本地推理用户提供了目前最详实的硬件选择参考。评论区有用户计算出两套硬件都能在约 5 个月内"回本"(相对 API 费用)。

🔗 https://reddit.com/r/LocalLLaMA/comments/1s4lmep/dual_dgx_sparks_vs_mac_studio_m3_ultra_512gb/

3. Apple 停售 512GB URAM Mac Studio (r/LocalLLaMA, ⬆️267)

内存供应危机持续发酵。帖子指出 Apple 官网已下架 M3 Ultra 512GB 版本,最大配置降至 256GB。社区反响强烈,许多用户指出这对本地运行 397B+ 参数模型是重大打击。有评论分析 HBM/URAM 产能正被 NVIDIA 和 AI 服务器大量占用,导致消费级市场供不应求。Apple 第三方渠道(沃尔玛、亚马逊)的高内存机型也几乎全面缺货。这与今天 Google TurboQuant 降低内存需求的新闻形成有趣对比。

🔗 https://reddit.com/r/LocalLLaMA/comments/1s4kev3/apple_stopped_selling_512gb_uram_mac_studios_now/

4. B200 GPU 上 Qwen 3.5 27B 实现 110 万 tok/s 吞吐 (r/LocalLLaMA, ⬆️190)

实战基准测试帖子。开发者使用 96 块 NVIDIA B200 GPU 和 vLLM v0.18.0,将 Qwen 3.5 27B(FP8 密集版)推到了 110 万 token/秒的吞吐量。关键优化:DP=8 比 TP=8 吞吐量提升近 4 倍(模型太小不适合张量并行)、上下文窗口从 131K 缩至 4K、FP8 KV 缓存、MTP-1 推测解码(这是最大功臣——没有 MTP 时 GPU 利用率接近 0%)。帖子附有完整配置文件开源在 GitHub,为大规模 LLM 部署提供了极有价值的参考。

🔗 https://reddit.com/r/LocalLLaMA/comments/1s4hudr/qwen_35_27b_at_11m_toks_on_b200s_all_configs_on/

5. 法官驳回五角大楼对 Anthropic 的"打压"企图 (r/artificial, ⬆️92)

r/artificial 热帖讨论了法官裁定的深层影响。评论区主流观点认为这是 AI 安全阵营的重要胜利——如果政府可以通过供应链风险标签惩罚拒绝降低安全标准的公司,那所有 AI 公司都会在军事合作中被迫放弃安全原则。有人指出法官使用了"奥威尔式"一词来形容五角大楼的做法,措辞异常严厉。另有帖子关注 OpenAI 关停 Sora、迪士尼退出 10 亿投资(95 票),以及 AI 沉迷导致婚姻破裂和经济损失的社会问题报道(131 票),反映出 AI 对社会的影响正在多维度显现。 *本期共收录 21 条资讯,覆盖 Anthropic 新模型泄露、Google 内存优化算法、GLM-5.1 发布、开源语音 AI 爆发等今日新增热点,与早间推送零重复。*

🔗 https://reddit.com/r/artificial/comments/1s4vsib/judge_rejects_pentagons_attempt_to_cripple/