AI 日报

ARTIFICIAL INTELLIGENCE DAILY
晚报
🐦

Twitter/X 热议

1. Codex + Claude Code 双 Agent 互审代码成为新范式

一位开发者展示了同一终端上方跑 Codex、下方跑 Claude Code 的工作流——Claude 写代码,Codex 做 Review,两者自动交互修改直到通过。这条推文获 465 赞和 13.2 万浏览量。多位开发者跟进分享了自己的双 Agent 实践,核心 prompt 极其简洁:"review 对方写的代码,有则改之无则加勉"。这代表 AI Coding 从"单模型写代码"进化到"多模型协作"的新阶段,本质是用不同模型的优势互补来提升代码质量。社区讨论也延伸到不同模型的架构差异——Codex 用 MoE 架构擅长精确 Review,Claude 擅长长上下文生成。

🔗 https://x.com/i/status/2037874969716429252

2. AI Coding 水平新标尺:"无人值守能跑多久?"

lifesinger 提出了一个引发 391 赞和 13.1 万浏览量讨论的问题:你能让 Codex、Claude Code、Gemini CLI 无人值守运行多长时间?意思是你去跑步、吃饭、睡觉,回来直接拿结果。这个问题精准地抓住了 AI Coding 当前的核心痛点——Agent 的自主性和可靠性。评论区回答从"几分钟就跑偏"到"用好 AGENTS.md 可以跑几小时"不等。这不再是关于模型能力的讨论,而是关于工程方法论(提示工程、上下文管理、错误恢复机制)的深度探索。

🔗 https://x.com/i/status/2037732126574186670

3. Karpathy AutoResearch 上线一个月,8 个意想不到的真实应用案例

Karpathy 发布 AutoResearch(AI 自动化研究循环系统)仅一个月,已有大量非预期应用场景涌现。有人用它做药物筛选自动化、有人跑材料科学实验、还有人用于金融市场模式发现。这条整理帖获 552 赞和 6 万浏览量,展示了 AutoResearch 的核心理念——让 AI 在睡觉时自主执行 100 个实验(每 5 分钟一个),每次实验失败自动调整假设并继续。这种"overnight self-improvement"模式正在从 AI 研究扩展到各个科学领域,标志着 AI 辅助科研从概念走向实用。

🔗 https://x.com/i/status/2037771361821532244

4. 美团开源多模态大模型 LongCat-Next

美团(Meituan)发布了开源多模态模型 LongCat-Next,支持文本、图像、音频和文档的统一理解。该推文获 188 赞,强调其完全免费和开源。LongCat-Next 的发布延续了中国 AI 公司在开源领域的强势表现——继 DeepSeek、GLM、Kimi 之后,又一个互联网巨头加入开源大模型阵营。外界关注的焦点在于,美团作为生活服务公司为何需要自研大模型——答案指向其海量多模态数据(菜品图片、用户评论、配送语音)提供了独特的训练优势。

🔗 https://x.com/i/status/2037956503701946875

5. TurboQuant 学术诚信争议持续发酵

Google Research 的 TurboQuant 论文虽然技术上获得广泛认可,但学术诚信争议在中文 AI 圈持续升温。苏黎世联邦理工高健扬博士后的批评获 110 赞和 1.4 万浏览量,指控 TurboQuant 对先行工作 RaBitQ "不只是引用不充分"——团队在充分了解甚至复现 RaBitQ 的基础上刻意回避关联并失实贬低。这种"说太委婉了"的评论暗示争议可能升级。事件折射出大厂论文与学术社区之间的张力:技术越好越需要诚实标注来源,否则会损害整个领域的信任基础。

🔗 https://x.com/i/status/2038132683080163832

6. AI 短剧产能被彻底颠覆:一个人 2 小时跑完 50 集

一个基于 OpenClaw 的 AI 短剧 Skill 引爆社区,获 2470 赞和 28.3 万浏览量。该 Skill 实现了从一句创意输入到完整剧本→角色设计→分镜→成片的全自动流水线,支持角色和场景复用实现批量连续生产。传统短剧制作需要编剧、导演、演员团队协作数周,而这个工具让个人创作者 2 小时即可产出 50 集。尽管质量与专业团队仍有差距,但对于低成本短视频赛道来说已经够用。这标志着 AI 内容生产从文字扩展到影视领域的重要里程碑。

🔗 https://x.com/i/status/2037137373994307903
🔥

GitHub 热榜

1

mvanhorn/last30days-skill ⭐ 14,730 (+1,680)

AI Agent 研究技能,可跨 Reddit、X、YouTube、Hacker News、Polymarket 和全网搜索任意主题过去 30 天的动态,然后用 AI 合成有依据的摘要报告。适合研究人员、投资者和内容创作者快速获取某个领域的最新全景,支持 Claude Code 直接调用。日增 1680 星,是今日 GitHub 最热门新项目之一。

🔗 https://github.com/mvanhorn/last30days-skill
2

Yeachan-Heo/oh-my-claudecode ⭐ 15,287 (+858)

面向团队的 Claude Code 多 Agent 编排框架。解决了 Claude Code 在团队协作场景下的痛点——多个 Agent 可以分工协作、共享上下文、互相 Review。TypeScript 构建,支持自定义 Agent 角色和工作流。与今日 Twitter 上的"Codex+Claude 双 Agent"话题高度呼应,反映社区对多 Agent 协作的强烈需求。

🔗 https://github.com/Yeachan-Heo/oh-my-claudecode
3

thedotmack/claude-mem ⭐ 42,167 (+389)

Claude Code 记忆插件,自动捕获编码会话中的所有操作,用 AI 压缩后注入未来会话。解决了 AI 编码助手"每次从零开始"的核心痛点,通过 agent-sdk 实现智能记忆管理。4.2 万星的规模说明长期记忆是 AI 开发工具的刚需功能。

🔗 https://github.com/thedotmack/claude-mem
4

shareAI-lab/learn-claude-code ⭐ 42,278 (+912)

"从零到一"构建类 Claude Code Agent 框架的教程项目,核心理念"Bash is all you need"。用 TypeScript 实现了一个精简但完整的 Agent 运行时,帮助开发者理解 AI 编码助手的底层原理。4.2 万星反映社区对"拆解黑盒"的强烈兴趣,也是学习 Agent 架构的最佳入门资源。

🔗 https://github.com/shareAI-lab/learn-claude-code
5

microsoft/VibeVoice 🆕

微软开源的前沿语音 AI 项目,定位为开源语音 AI 领域的新标杆。刚上线即登上 GitHub Trending,具体技术细节有待进一步披露。结合 Mistral 本周发布 Voxtral TTS,语音 AI 正成为本周最热的细分赛道。

🔗 https://github.com/microsoft/VibeVoice

📺

YouTube 热门

1. Google Just Dropped TurboQuant And Changes AI Forever

AI Revolution

48,602 次观看 · 11:20 · 2 天前

深入解读 Google Research 的 TurboQuant 向量量化算法。视频详细解释了该算法如何实现接近信息论最优的 4-bit 量化,使大型语言模型在消费级硬件上运行成为可能。同时讨论了其对 llama.cpp 等本地推理框架的潜在影响,以及与现有 GPTQ/AWQ 方案的对比优势。评论区讨论热烈,许多人期待 TurboQuant 的实际集成落地。

🔗 https://www.youtube.com/watch?v=GiVtPpEVdCY

2. How AI is changing the price of white-collar jobs

ABC News Australia

35,869 次观看 · 2:43 · 10 小时前

澳大利亚 ABC 新闻最新报道,聚焦 AI 对白领职业薪酬的冲击。报道引用了最新劳动力市场数据,显示法律助理、初级财务分析师和客服管理等岗位的薪资已出现明显下滑趋势。受访经济学家认为 AI 不会消灭这些岗位但会"压平薪资曲线"——初级岗位受冲击最大,高级专家反而可能涨薪。短片虽只有 2 分 43 秒但数据翔实,适合快速了解 AI 对就业市场的实际影响。

🔗 https://www.youtube.com/watch?v=fvItHlMsHtY

3. How AI Is Reshaping The Battlefield

Bloomberg Technology

19,505 次观看 · 22:46 · 2 天前

Bloomberg 长篇深度报道 AI 在军事领域的最新应用。覆盖自主无人机群协调、战场实时态势感知系统、AI 辅助指挥决策等前沿话题。采访了多位军事技术专家和政策制定者,讨论了 AI 武器化带来的伦理困境和国际法挑战。22 分钟的深度内容适合对 AI 安全和地缘政治感兴趣的观众。

🔗 https://www.youtube.com/watch?v=h9TqjOFceBk

4. NVIDIA GTC 2026 Reveals 5 AI & Robotics Inflection Points

AI News

4,605 次观看 · 8:07 · 12 天前

回顾 NVIDIA GTC 2026 大会上黄仁勋提出的 5 个 AI 与机器人拐点。视频整理了 GTC 的核心发布:新一代 GPU 架构、Robotics Foundation Model、以及 Omniverse 平台升级。老黄将 AI 行业发展分为三个阶段——Generative AI、Reasoning AI 和 Agentic AI,并特别提到 Physical AI 和农业 AI 正在进入拐点。8 分钟浓缩了 GTC 的关键信息。

🔗 https://www.youtube.com/watch?v=CzTIduXcXMA

5. My Honest Thoughts on AI and the Job Market in 2026

Tech With Tim

128,388 次观看 · 15:01 · 3 周前(持续热播)

Tech With Tim 从开发者视角坦诚分析 AI 对程序员就业市场的影响。视频没有贩卖焦虑也没有盲目乐观,而是基于实际招聘数据和自身经历进行务实分析。核心观点:AI 不会取代程序员但会彻底改变入门门槛——"会用 AI 的初级开发者"比"不会用 AI 的中级开发者"更有竞争力。12.8 万播放量说明就业焦虑仍是开发者社区最关心的话题。

🔗 https://www.youtube.com/watch?v=PEFso88LkC4
💬

Reddit 精选

1. TurboQuant 核心原理通俗解析(r/LocalLLaMA · 1,244↑)

今日 r/LocalLLaMA 最高赞帖子(1244 票),作者对 TurboQuant 做了堪称教科书级别的通俗解释。核心澄清:很多人误以为 TurboQuant 的关键是"极坐标",但实际上最重要的创新与极坐标无关——它是一种向量量化算法,通过近最优失真控制实现 4-bit 精度下几乎无损的推理。文章还解释了为什么 Google 的博客强调极坐标导致了社区的普遍误解。这篇帖子是目前全网对 TurboQuant 最清晰的非论文级别解读。

🔗 https://reddit.com/r/LocalLLaMA/comments/1s62g5v/

2. Kimi K2.6 两周内发布,K3 正在研发

有人透露从 Moonshot AI 内部获悉:Kimi K2.6 将在 10-15 天内发布,定位为 K2.5 的小幅迭代升级;更重要的是 K3 已在研发中,目标是在参数规模上对齐美国头部模型。这一消息对本地 LLM 社区意义重大——Kimi 系列以开源闻名,K3 如果实现参数对齐,将为开源阵营带来真正与 GPT-5 级别模型竞争的选手。社区对 K3 的多模态和长上下文能力特别期待。

(r/LocalLLaMA · 32↑)

🔗 https://reddit.com/r/LocalLLaMA/comments/1s6stgl/

3. Voxtral TTS 开源语音克隆缺失模块被补全

Mistral 本周发布的 Voxtral TTS 虽然技术惊艳,但开源版缺少 codec encoder 权重,导致无法使用语音克隆功能。社区开发者找到了缺失的编码器权重并公开分享,使得完整的 ref_audio 语音克隆管线可以正常工作。这是典型的开源社区自助精神——官方有所保留时社区自行补全。不过评论区也指出 Voxtral 的许可证不允许商业使用,这限制了其在生产环境中的应用。

(r/LocalLLaMA · 53↑)

🔗 https://reddit.com/r/LocalLLaMA/comments/1s6rmoi/

4. Linux 推理速度是 Windows 的两倍实测

一位用户用同一台机器(i9-9900K + RTX 8000 48GB)对比 Linux Ubuntu 22.04 和 Windows 10 的 Ollama 推理速度,结果 Linux 快了近一倍。帖子获 164 票,验证了本地 LLM 社区的长期经验。差异主要来自 Linux 更高效的内存管理、CUDA 驱动优化和更低的系统开销。评论区建议如果认真做本地推理,应该把 Windows 分区完全让给 Linux,或至少用 WSL2 作为折中方案。

(r/LocalLLaMA · 164↑)

🔗 https://reddit.com/r/LocalLLaMA/comments/1s6hb1h/

5. 给 AI 接入 200 万篇论文后,它找到了自身知识库中不存在的技术

实验对比了两个相同的 Claude Code Agent:一个仅凭内置知识优化小型语言模型(提升 3.67%),另一个可搜索 200 万+ 计算机科学论文,在检索 520 篇相关论文后尝试了 25 种技术,最终性能提升远超前者。这证明了 RAG(检索增强生成)在实际科研场景中的巨大价值——模型的内置知识有明确边界,外部知识检索可以突破这个边界。社区讨论延伸到论文搜索引擎的构建方法和检索策略优化。 > 📊 本期共 21 条资讯 | 数据采集时间:2026-03-29 21:00 CST

(r/artificial · 33↑)

🔗 https://reddit.com/r/artificial/comments/1s6afwm/