AI 日报 · 2026-03-31 早报

🐦

Twitter/X 热议

1. Karpathy 警告：litellm PyPI 供应链攻击事件

Andrej Karpathy 发推揭露了一起严重的 Python 供应链攻击：简单执行 `pip install litellm` 就可能导致 SSH 密钥、AWS/GCP/Azure 凭证、Kubernetes 配置、Git 密钥、所有 API Key、Shell 历史、加密钱包、SSL 私钥、CI/CD 密钥和数据库凭证被窃取。这一事件再次凸显了开源生态中的安全风险，尤其是 AI 开发者高度依赖的 Python 包管理器。Karpathy 此推获得了 2.8 万赞和 6600 万次浏览，引发社区对供应链安全的广泛讨论。开发者应立即审查依赖项并启用包签名验证。

🔗 https://x.com/karpathy/status/2036487306585268612

2. Karpathy 谈 LLM 的"两面性"：AI 同时能正反论证同一观点

Karpathy 分享了一个有趣的实验：他花 4 小时用 LLM 精心打磨一篇博客论点，觉得论证无懈可击。然后让 LLM 论证相反观点——LLM 直接把原论点全面摧毁，甚至说服他相反才是正确的。此推获 3 万赞和 316 万浏览。这揭示了当前 LLM 的一个根本特性：它们并非真正"理解"论点，而是极其擅长在任何方向上构建有说服力的论证。这对依赖 AI 做决策的用户是重要警示——AI 的说服力不等于正确性。

🔗 https://x.com/karpathy/status/2037921699824607591

3. Sam Altman：Stargate 密歇根数据中心开建 + Codex 增长迅猛

Sam Altman 宣布 OpenAI 与 Oracle 合作的 Stargate 密歇根数据中心已开始安装第一批钢梁，标志着 AI 基础设施建设进入实质阶段。同时 Altman 大力推广 Codex，称其团队是"hardcore builders"，用户增长非常快，并确认 GPT-5.4 在编码、知识工作和计算机操作方面表现出色。他还透露了一个暖心故事：有人用 ChatGPT 和 LLM 设计了 mRNA 疫苗方案来救自己的狗，Altman 称"聊天机器人赋予个人以研究机构的力量"。

🔗 https://x.com/sama/status/2037610000122839116

4. 宝玉：OpenAI 发布 Claude Code 插件，竞合关系升级

宝玉(@dotey)报道了一个颇具戏剧性的产业动态：OpenAI 官方发布了 codex-plugin-cc 插件，让开发者可以在 Claude Code 中直接调用 Codex 进行代码审查、对抗性审查，甚至将任务移交给 Codex 执行。这意味着 OpenAI 主动进入 Anthropic 的地盘，AI 工具生态的边界正在模糊化。此推获 1045 赞和 12.5 万浏览。同时宝玉还报道了 Claude Code 新增"computer use"功能——写完代码后可以自动编译、启动应用、点击按钮、截图验证。

🔗 https://x.com/dotey/status/2038682622180634793

5. ARC-AGI-3 基准测试：所有顶级模型集体翻车

最新 ARC-AGI-3 基准测试结果公布，所有主流模型表现惨淡：Grok 零分，GPT-5 正确率仅 0.26%，Claude 仅 0.25%。这一结果与人们日常使用中感受到的 AI 能力形成巨大反差，说明当前 LLM 在真正的抽象推理和泛化能力上仍有根本性不足。社区讨论认为 Claude 在编程场景下的优异表现更多是模式匹配而非真正智能。AGI 仍然遥遥无期，但这不妨碍 AI 在特定场景下创造巨大价值。

🔗 https://x.com/i/status/2038775299350151360

6. Google Gemini 推出"记忆导入"功能，直接挖 ChatGPT 和 Claude 的墙角

Google Gemini 新增记忆导入功能，用户可以直接将 ChatGPT 和 Claude 的对话历史导入 Gemini。提供两种方式：一是预设提示词发给其他 AI 生成记忆摘要，二是直接导入其他平台的 Zip 数据包。此推获 848 赞和 23 万浏览，被视为 Google 在 AI 竞争中的一步妙棋——直接降低用户迁移成本，打用户留存的主意。

🔗 https://x.com/i/status/2037363169207935307

🔥

GitHub 热榜

microsoft/VibeVoice ⭐ 30,348 (+2,492)

微软开源的语音 AI 模型套件，包含三个核心模型：VibeVoice-ASR（语音转文本，支持一次性处理 60 分钟长音频，输出包含说话人、时间戳和内容的结构化转录），VibeVoice-Realtime-0.5B（实时文本转语音），以及多语言支持超过 50 种语言。已被 Hugging Face Transformers v5.3.0 集成，社区基于它构建了 Vibing 语音输入法。适合需要长音频转录、多语言语音处理、实时 TTS 的开发者和企业。

🔗 https://github.com/microsoft/VibeVoice

luongnv89/claude-howto ⭐ 9,882 (+4,232)

今日增星最快的项目，提供从基础概念到高级 Agent 编排的可视化教程。包含可直接复制粘贴的模板，覆盖 Slash 命令、Hooks、Memory、Subagents 等功能的组合使用。解决了 Claude Code 官方文档只描述功能但不教如何组合的痛点。适合所有 Claude Code 用户，尤其是想从"能用"进阶到"高效"的开发者。

🔗 https://github.com/luongnv89/claude-howto

NousResearch/hermes-agent ⭐ 18,609 (+1,851)

Nous Research 打造的自我改进 AI Agent，最大亮点是内置学习闭环：从经验中创建 Skills、使用中自我优化、主动持久化知识、搜索历史对话、构建用户画像。支持任意模型（OpenAI/Claude/Gemini/Grok），多平台接入（Telegram/Discord/Slack/WhatsApp），可运行在 $5 VPS 到 GPU 集群。兼容 agentskills.io 开放标准，具有真正的跨会话记忆能力。

🔗 https://github.com/NousResearch/hermes-agent

OpenBB-finance/OpenBB

开源金融数据平台，为量化分析师和 AI Agent 提供统一的金融数据接口。支持股票、债券、期权、加密货币等多资产类别，内置可视化和数据探索工具。随着 AI Agent 在金融领域的应用加速，这类基础设施项目的价值越发凸显。适合量化交易团队、金融科技开发者、需要接入金融数据的 AI 应用。

🔗 https://github.com/OpenBB-finance/OpenBB

hacksider/Deep-Live-Cam

实时人脸替换和一键视频 Deepfake 工具，只需一张照片即可实现实时换脸。虽然技术令人印象深刻，但也引发了对 Deepfake 滥用的安全和伦理担忧。项目持续在 GitHub 热榜上，反映了社区对实时视频生成技术的高度关注。

🔗 https://github.com/hacksider/Deep-Live-Cam

📺

YouTube 热门

1. Lex Fridman Podcast #490：2026 年 AI 全景对话（79 万播放，4h25m）

Lex Fridman 的最新长篇播客深入探讨了 2026 年 AI 全景，涵盖 LLM 现状、AI 编程工具、Scaling Laws 的走向、中国 AI 竞争、Agent 生态、GPU 供需，以及 AGI 时间线预测。嘉宾对 Scaling Laws 是否已触顶进行了激烈辩论，同时探讨了 AI Agent 从"会说话"到"能干活"的范式转变。播放量近 80 万，是本月最受关注的 AI 深度内容之一，适合想全面了解行业走向的观众。

🔗 https://www.youtube.com/watch?v=EV7WhVT270Q

2. Jeff Su：定义 2026 年的 6 大 AI 趋势（38.6 万播放，13:13）

Jeff Su 基于数据分析总结了 2026 年最值得关注的 AI 趋势，包括 Agentic AI 的崛起、多模态模型的融合、AI 编程工具的爆发式增长、AI 在企业工作流的深度嵌入、开源模型的追赶以及 AI 安全监管的加速。视频条理清晰、数据翔实，是快速把握年度 AI 大趋势的优质入门内容。

🔗 https://www.youtube.com/watch?v=B23W1gRT9eY

3. IBM Technology：量子计算 + Agentic AI + 智能自动化（37.5 万播放，11:39）

IBM Technology 频道的年度趋势分析，重点关注三个方向：量子计算与 AI 的交叉、Agentic AI 架构的企业落地，以及智能自动化对传统工作流的颠覆。IBM 从企业服务商视角出发，讨论了如何将这些前沿技术转化为实际商业价值，对 B2B 领域从业者特别有参考意义。

🔗 https://www.youtube.com/watch?v=zt0JA5rxdfM

4. Tech With Tim：AI 与就业市场的诚实对话（13 万播放，15:01）

Tim 以"没有炒作"为主题，从程序员视角真实分析了 AI 对就业市场的影响。他认为 AI 编程工具（Codex、Claude Code）正在重塑初级开发岗位，但中高级工程师的价值在于架构能力和业务理解。视频强调了"学会与 AI 协作"比"害怕被 AI 替代"更重要，3 周内获得 13 万播放，反映了技术社区对职业前景的焦虑和关注。

🔗 https://www.youtube.com/watch?v=PEFso88LkC4

5. Matt Wolfe：令人震惊的视频生成模型（11.1 万播放，30:53）

Matt Wolfe 深度测评了最新的 AI 视频生成模型，包括效果对比、使用技巧和行业影响分析。视频展示了当前视频生成技术的惊人进步，尤其在一致性、物理仿真和创意表达方面。30 分钟的深度内容帮助观众快速了解视频生成领域的最新水平。

🔗 https://www.youtube.com/watch?v=msrbd-d6lWk

💬

Reddit 精选

1. llama.cpp 达成 10 万 Star 里程碑（r/LocalLLaMA，588 赞）

Georgi Gerganov 的 llama.cpp 项目在 GitHub 上达到 10 万 Star，成为开源 AI 推理领域最重要的项目之一。llama.cpp 让大语言模型可以在普通 CPU 和消费级 GPU 上高效运行，是整个本地 LLM 生态的基石。从最初支持 LLaMA 到现在覆盖几乎所有主流开源模型，它推动了 AI 民主化的重要进程。社区评论中充满了对 ggml 团队的感谢，许多人表示没有 llama.cpp 就没有今天的本地 AI 运动。

🔗 https://reddit.com/r/LocalLLaMA/comments/1s7z7hj/llamacpp_at_100k_stars/

2. Qwen 3.6 被发现！（r/LocalLLaMA，382 赞）

有用户在 OpenRouter 上发现了 Qwen 3.6 Plus Preview 的 API 端点，表明阿里通义千问团队正在准备新一代模型。Qwen 系列在开源模型中一直保持竞争力，3.5 版本已在多个基准上逼近闭源模型。社区对 3.6 版本充满期待，讨论焦点集中在是否会在推理能力和长上下文处理上有重大突破。如果延续之前的升级幅度，Qwen 3.6 可能进一步缩小与 GPT-5/Claude 的差距。

🔗 https://reddit.com/r/LocalLLaMA/comments/1s7zy3u/qwen_36_spotted/

3. TurboQuant 论文争议：RaBitQ 作者公开质疑 Google（r/LocalLLaMA，532 赞 + r/MachineLearning，237 赞）

RaBitQ 论文第一作者 Jianyang Gao 公开发帖，详细说明 Google 的 TurboQuant 论文存在的问题：未充分引用 RaBitQ 的贡献，且进行了不公平的性能对比（单核 CPU vs GPU）。这在学术界引发了广泛关注，涉及学术诚信和大公司利用影响力"借鉴"小团队工作的争议。社区大多站在 RaBitQ 作者一边，呼吁 Google 正式回应并修正论文。

🔗 https://reddit.com/r/LocalLLaMA/comments/1s7nq6b/technical_clarification_on_turboquant_rabitq_for/

4. World Models 将成下一个大方向（r/artificial，133 赞）

一位参加 NVIDIA GTC 大会的开发者分享了他的核心感悟：世界模型（World Models）正在从小众学术概念变成 AI 研究的核心方向。与 LLM 的纯文本理解不同，世界模型试图构建对物理世界的理解和模拟能力。在 GTC 上，多个演讲和 demo 展示了世界模型在机器人、自动驾驶和游戏环境中的突破性进展。帖子认为世界模型可能会成为继 LLM 之后的下一波 AI 浪潮。

🔗 https://reddit.com/r/artificial/comments/1s828dj/world_models_will_be_the_next_big_thing_byebye/

5. Claude 的"秘密调料"是什么？为什么没人能复制？（r/LocalLLaMA，277 赞）

一个引发热烈讨论的帖子：为什么 Claude 的对话风格如此独特，而且即使用相同 system prompt 也无法在其他模型上复制？作者尝试将 Sonnet 4.5 的 system prompt 喂给 Qwen3.5 27B，效果完全不同。社区讨论认为 Claude 的差异化来自训练数据策展、RLHF 调优策略和 Constitutional AI 框架的深度结合，而非简单的 prompt 工程。这解释了为什么"蒸馏"Claude 风格到其他模型的尝试总是令人失望。 📊 **今日要点速览：** - 🔒 Karpathy 曝光 litellm 供应链攻击，浏览量 6600 万 - 🏗️ OpenAI Stargate 密歇根数据中心动工 - 🤝 OpenAI 发布 Claude Code 插件，竞合关系新篇章 - 🎤 微软 VibeVoice 语音 AI 开源，30K+ Star - 🧠 NousResearch hermes-agent：自我进化 Agent - 📊 ARC-AGI-3 测试：所有顶级模型集体翻车 - 🎯 Qwen 3.6 被发现，开源模型竞争加剧 - ⭐ llama.cpp 达成 10 万 Star 里程碑

🔗 https://reddit.com/r/LocalLLaMA/comments/1s7pxie/what_is_the_secret_sauce_claude_has_and_why_hasnt/