AI 日报 · 2026-05-25 早报

🐦

Twitter/X 热议

1. Agent Swarms 爆火：一句 Prompt 组合 Gemini 3.1 Pro + Opus 4.7 + GPT 5.5 构建复杂多 Agent 系统

一条关于 Agent Swarms 的推文获得超过 104 万次浏览、410 点赞和 41 次转推，成为近期 AI 社区最热门的话题之一。推文展示了如何用单一 Prompt 驱动由 Gemini 3.1 Pro、Claude Opus 4.7 和 GPT 5.5 组成的多 Agent 系统，每个 Agent 专注于特定任务——编码、测试、移动端开发、研究和监控，由主 Agent 统一编排调度。这种"混合模型 Agent 群"的架构思路引发了大量讨论：不同模型在不同任务上各有所长，通过 Agent 编排层将其组合，可以在成本和能力之间取得更好的平衡。随着 Claude Code、Codex 等工具的普及，多模型 Agent 协作正在从实验走向生产实践。

🔗 https://x.com/i/web/status/2058674321179222437

2. Google I/O 2026 全面盘点：Gemini Omni Flash、Antigravity 2.0、Managed Agents API 等重磅发布

一位科技博主整理了 Google I/O 2026 的完整发布清单，获得近 1.2 万次浏览和 104 次转推。主要发布包括：Gemini Omni Flash（全模态轻量版）、Gemini 3.5 Flash 正式 GA、Antigravity 2.0 CLI 工具、Gemini API Managed Agents 服务、AI Studio 原生 Android 支持、新 SynthID 合作伙伴关系等。日本科技博主也发文称"Google I/O 2026 基本确定了 AI 赛道的赢家——不是 OpenAI，不是 Anthropic，而是 Google"，该推文获 16 万次浏览。Google 此次发布密度之高、覆盖面之广，被业界视为其在 AI 竞争中全面反攻的信号。

🔗 https://x.com/i/web/status/2056953920002682916

3. Andrej Karpathy 加入 Anthropic，AI 界最强履历再添新章

Karpathy 正式加入 Anthropic 从事 R&D 工作的消息在 Twitter 持续发酵，相关推文累计获得数万次浏览，其中一条 Karpathy 个人经历梳理推文获得 226 万次浏览。Karpathy 的职业轨迹堪称现代 AI 发展史的缩影：2015 年 Google DeepMind，2016-2017 年 OpenAI 创始成员，2017-2022 年 Tesla AI 高级总监，2026 年加入 Anthropic。社区讨论焦点集中在：Karpathy 一贯强调的"简洁、可解释 AI"理念将如何影响 Claude 的未来发展？也有人指出，顶级 AI 研究者从 OpenAI 流向 Anthropic 的趋势值得关注。

🔗 https://x.com/i/web/status/2056824470027804808

4. 开源 AI-Q Agent Skill：为任意 Agent Harness 提供深度研究能力

一条关于开源 AI-Q Agent Skill 的推文获得 7.2 万次浏览、989 点赞和 115 次转推，是本周技术类推文中互动率最高的之一。AI-Q 将完整的研究流水线打包为可移植的 Agent Skill，只需将其接入任意 Agent Harness，即可让 Agent 将研究任务委托给本地或托管的研究子 Agent 执行。这与 OpenClaw 的 Skills 体系高度契合——将复杂能力模块化、可复用化，降低 Agent 工程的重复建设成本。推文作者强调该 Skill 完全开源，支持本地部署，适合对数据隐私有要求的企业用户。

🔗 https://x.com/i/web/status/2057855521193881773

5. Claude Code 变成"AI 操作系统"：CLAUDE.md 是核心，结构化提示系统才是真正的解锁方式

一条关于 Claude Code 使用方法论的推文获得 5.3 万次浏览、460 点赞，引发大量收藏和讨论。作者指出：大多数开发者只是在用 Claude Code 写提示词，而真正强大的用法是将其构建为一个"AI 操作系统"——以 CLAUDE.md 为核心，配合结构化的上下文管理、工具调用规范和任务编排逻辑。这与 SKILL.md 开放标准（已获 Anthropic、OpenAI、Google、Microsoft、Cursor、JetBrains 共同支持）的理念一脉相承：AI 编程工具的真正潜力在于系统化的工程设计，而非单次对话的技巧。

🔗 https://x.com/i/web/status/2057855062186262802

6. 巴西辍学生用 Claude Opus 写代码，14 个月 Polymarket 交易机器人赚了 $79.4 万

一条中文推文获得 2 万次浏览，讲述了一位巴西大学辍学生在父母车库里用开源 AI Agent 框架 Hermes（NousResearch 出品，Paradigm 投资）搭建 Polymarket 预测市场交易机器人的故事。14 个月内盈利 794,000 美元，而他本人几乎没有亲自写代码——绝大部分代码由 Claude Opus 生成。这个案例在社区引发了关于"AI 时代的财富创造路径"的热烈讨论：技术门槛的降低是否正在让"一人公司"的盈利天花板大幅提升？Hermes 框架的开源特性和 Claude 的代码生成能力被认为是这个故事的两个关键变量。

🔗 https://x.com/i/web/status/2058574604919316765

🔥

GitHub 热榜

Lum1104/Understand-Anything

今日 GitHub Trending 第一，单日新增 3,999 颗星。Understand-Anything 能将任何代码库转化为可探索、可搜索、可提问的交互式知识图谱，理念是"能教人的图谱 > 只是好看的图谱"。支持 Claude Code、Codex、Cursor、Copilot、Gemini CLI 等主流 AI 编程工具，TypeScript 实现。差异化在于知识图谱具备对话能力——开发者可以直接向图谱提问，例如"这个函数被哪些模块调用"、"哪里处理了认证逻辑"，极大降低了新人上手陌生代码库的难度。

🔗 https://github.com/Lum1104/Understand-Anything

colbymchenry/codegraph

今日第二热门，单日新增 3,003 颗星。codegraph 为 Claude Code、Codex、Cursor、OpenCode 和 Hermes Agent 提供预索引的代码知识图谱，核心价值是大幅减少 AI 编程助手在处理大型代码库时的 token 消耗和工具调用次数，且 100% 本地运行无需上传代码。TypeScript 实现，适合需要在本地大型代码仓库中部署 AI Coding Agent 的工程团队。

🔗 https://github.com/colbymchenry/codegraph

multica-ai/andrej-karpathy-skills

今日新增 2,551 颗星。这是一个单一 CLAUDE.md 文件，提炼自 Andrej Karpathy 的 AI 编程风格和最佳实践，用于改善 Claude Code 的行为表现。简单直接——一个文件，放入项目根目录，即可让 Claude Code 更接近 Karpathy 式的简洁、高效编程风格。随着 Karpathy 加入 Anthropic 的消息发酵，这个项目今日热度大幅上升。

🔗 https://github.com/multica-ai/andrej-karpathy-skills

anthropics/claude-plugins-official

今日新增 1,173 颗星，总量已达 26,000+。Anthropic 官方维护的 Claude Code 插件目录，收录高质量、经 Anthropic 审核的插件，覆盖各类开发场景的工具集成。随着 Claude Code 在开发者群体中渗透率持续上升，一个权威的官方插件生态目录对于规范化使用具有重要意义。

🔗 https://github.com/anthropics/claude-plugins-official

manaflow-ai/cmux

今日新增 696 颗星，Swift 实现。cmux 是专为 AI 编程工作流设计的 macOS 终端，基于 Ghostty 构建，核心特性是垂直标签页布局和 AI Coding Agent 通知系统——当 Claude Code、Codex 等 Agent 完成任务或需要用户确认时，可以通过系统通知提醒，无需盯着终端等待。

🔗 https://github.com/manaflow-ai/cmux

📺

YouTube 热门

1. Fireship

"Google's AI endgame is here… everything you missed at I/O 2026"

频道：Fireship | 播放量：742,037 | 时长：5:43 | 发布：3天前 Fireship 一贯的高密度风格，5 分 43 秒内把 Google I/O 2026 的所有重要发布梳理得清清楚楚。涵盖 Gemini Omni、Gemini 3.5 Flash GA、Antigravity CLI 2.0、Managed Agents API、AI Studio Android 版等核心发布，并给出了 Fireship 式的犀利点评：Google 这次不是在追赶，而是在重新定义游戏规则。视频标题"AI endgame"暗示 Google 已经将 AI 能力全面整合进其产品生态，形成其他厂商难以复制的护城河。对于想快速了解 Google I/O 2026 全貌的观众，这是最高效的 5 分钟。

🔗 https://www.youtube.com/watch?v=9OQ5vaYbGV0

2. Two Minute Papers

"DeepSeek's New AI Is A Game Changer"

频道：Two Minute Papers | 播放量：247,518 | 时长：7:43 | 发布：3天前 Two Minute Papers 对 DeepSeek 最新模型的深度解析，播放量近 25 万，是本周 AI 学术科普类视频中表现最亮眼的一支。视频重点分析了 DeepSeek 新模型在推理效率和成本控制上的突破性进展，以及其对整个 AI 行业定价体系的冲击。Károly Zsolnai-Fehér 一贯的"论文解读"风格让复杂的技术细节变得易于理解，并通过与前代模型的对比直观展示了性能跃升的幅度。视频结尾的"What a time to be alive"感叹引发了大量共鸣——DeepSeek 的持续突破正在改变人们对"顶级 AI 必须来自美国大厂"的固有认知。

🔗 https://www.youtube.com/watch?v=LpXhy2iiaQE

3. AI Explained

"Two Rival Bets on AGI: Google I/O Highlights"

频道：AI Explained | 播放量：63,904 | 时长：21:30 | 发布：5天前 AI Explained 从 AGI 路线之争的视角解读 Google I/O 2026，播放量近 6.4 万。视频的核心论点是：Google 和 OpenAI 正在押注两条截然不同的 AGI 路径——Google 倾向于将 AI 能力深度整合进现有产品生态（搜索、Workspace、Android），形成"无处不在的 AI"；OpenAI 则更专注于构建独立的超级智能系统。这两种路线在短期内都有各自的优势，但长期来看将导致完全不同的市场格局。视频对 Gemini 3.5 Flash 的技术细节分析尤为深入，是理解 Google AI 战略的优质参考。

🔗 https://www.youtube.com/watch?v=o_av1b9rs2g

4. Fireship

"I can't believe this trial is real..."

频道：Fireship | 播放量：725,028 | 时长：6:45 | 发布：10天前播放量超 72 万的热门视频，Fireship 以其标志性的讽刺风格评论了一起涉及 AI 的真实法律案件。视频探讨了 AI 生成内容在法律证据、版权归属和责任认定方面引发的前所未有的争议，以及法庭如何应对这些全新的技术挑战。Fireship 的评论一针见血：法律体系的更新速度远远跟不上 AI 技术的发展速度，这种滞后正在制造越来越多的灰色地带。视频在 AI 法律和伦理讨论圈引发广泛传播，是了解 AI 社会影响的优质入门内容。

🔗 https://www.youtube.com/watch?v=3tbB2dffx0s

5. AI Explained

"GPT 5.5 Arrives, DeepSeek V4 Drops, and the Compute War Intensifies"

频道：AI Explained | 播放量：106,221 | 时长：25:19 | 发布：1个月前播放量超 10 万的深度分析视频，系统梳理了 GPT 5.5 发布、DeepSeek V4 开源以及算力军备竞赛升级三条并行叙事线。视频详细对比了 GPT 5.5 和 DeepSeek V4 在各类基准测试上的表现差异，并深入分析了算力投入与模型性能之间的关系是否正在发生质变。AI Explained 的结论是：DeepSeek V4 的出现证明了"用更少算力实现更高性能"是可行的，这对 OpenAI 和 Google 的"算力堆叠"战略构成了根本性挑战。对于理解当前 AI 竞争格局的底层逻辑，这是一支不可错过的视频。

🔗 https://www.youtube.com/watch?v=jz0rNhfAKo8

💬

Reddit 精选

1. r/LocalLLaMA — 2026 年本地 LLM，NVIDIA 还是默认最佳选择吗？

分数：294 | https://reddit.com/r/LocalLLaMA/comments/1tmkaua/ 这是本周 LocalLLaMA 最热门的讨论之一。随着 AMD RDNA3（Radeon 9070 XT）、Apple Silicon M4 系列以及 Intel Arc 的持续进步，社区开始重新审视"本地 LLM 必须用 NVIDIA"的固有认知。讨论中，AMD 用户分享了 Qwen3.6 在 Radeon 9070 XT 上的实测数据，Apple Silicon 用户展示了 MLX 框架下的推理效率，而 NVIDIA 用户则强调 CUDA 生态的不可替代性——尤其是在量化工具链、Flash Attention 支持和社区资源方面。总体结论是：NVIDIA 在生态完整性上仍领先，但 AMD 和 Apple Silicon 在性价比和功耗上已具备竞争力，"默认 NVIDIA"的时代正在松动。

🔗 https://reddit.com/r/LocalLLaMA/comments/1tmkaua/is_nvidia_still_the_default_best_choice_for_local/

2. r/LocalLLaMA — V100 集群跑 Qwen3.6 27B 达到 1000 tps

分数：124 | https://reddit.com/r/LocalLLaMA/comments/1tmyln6/ 一位用户展示了在 V100 集群上以 128 并发请求运行 Qwen3.6 27B，实现 1000 tokens/秒生成速度的测试结果。V100 是 2017 年发布的老一代 NVIDIA 数据中心 GPU，这一结果说明通过大规模并发和批处理优化，即使是旧硬件也能在吞吐量上达到惊人数字。帖子引发了关于"推理优化 vs 硬件升级"的讨论——对于追求高吞吐量的服务场景，软件层面的并发优化有时比换新硬件更划算。

🔗 https://reddit.com/r/LocalLLaMA/comments/1tmyln6/1000_tps_generation_on_qwen36_27b_with_v100s/

3. r/LocalLLaMA — hipEngine：为 RDNA3 原生优化的 Qwen 3.6 推理引擎

分数：50 | https://reddit.com/r/LocalLLaMA/comments/1tmq4s6/ 开发者发布 hipEngine——专为 AMD RDNA3 架构（Strix Halo、7900 XTX）原生优化的 Qwen 3.6 推理引擎，绕过 ROCm 框架开销直接操作硬件。作者此前已完成 FastDMS（64x KV Cache 压缩）项目，hipEngine 是其在 AMD GPU 推理优化上的延续。测试数据显示在 Strix Halo 平台上推理速度显著优于 llama.cpp + ROCm 方案，对 AMD GPU 用户是重要消息。

🔗 https://reddit.com/r/LocalLLaMA/comments/1tmq4s6/hipengine_fast_native_qwen_36_inference_for_rdna3/

4. r/artificial — AI 和机器人真的比人工更便宜吗？成本账根本算不过来

分数：85 | https://reddit.com/r/artificial/comments/1tmffqn/ 一位用户发帖质疑：AI 和机器人的部署成本（硬件、维护、能耗、更新迭代）加在一起，真的比雇用人类员工更便宜吗？帖子列举了数据中心电力成本、GPU 折旧、模型训练费用等具体数字，认为主流媒体对"AI 替代人工"的成本优势存在严重高估。评论区分成两派：一派认为规模效应会让 AI 成本持续下降，长期来看必然更便宜；另一派则指出人类劳动力的灵活性、创造力和社会价值是 AI 无法简单替代的。

🔗 https://reddit.com/r/artificial/comments/1tmffqn/i_simply_do_not_understand_how_massively/

5. r/artificial — 退休老人把 MS Paint 画作给 AI 点评，AI 意外"发明"了一个假艺术流派，Google 信以为真

分数：25 | https://reddit.com/r/artificial/comments/1tmb7c6/ 一位退休用户将自己的 MS Paint 画作上传给 AI 请求反馈，AI 不仅给出了详细点评，还将其风格归类为一个听起来很专业的"艺术流派"，并编造了完整的历史背景和代表人物。更离奇的是，这个完全虚构的艺术流派随后出现在 Google 搜索结果中，被当作真实存在的艺术运动。帖子引发了关于 AI 幻觉、搜索引擎对 AI 生成内容的索引问题，以及"AI 创造的虚假知识如何污染信息生态"的深度讨论。 *生成时间：2026-05-25 15:10 (北京时间) | 数据来源：Twitter/X · GitHub Trending · YouTube · Reddit*

🔗 https://reddit.com/r/artificial/comments/1tmb7c6/im_retired_i_showed_my_ms_paint_paintings_to_ai/