AI 日报 · 2026-04-28 早报

🐦

Twitter/X 热议

1. DeepSeek V4 震撼发布，定价仅为 Claude/GPT 的 1/50

DeepSeek 时隔一年发布重大更新 DeepSeek V4，分 Pro 和 Flash 两个版本，API 定价堪称极致：输入仅 2 元/1M Tokens，输出 3 元/1M Tokens（命中 Cache 仅 0.2 元），对比 Claude Opus 4.7 的 35 元/175 元，便宜约 50-58 倍，对比 GPT 5.5 更是便宜逾 70 倍。该模型支持 1M 超长上下文，且完整开源。社区测试显示 V4 在多项推理和编程基准上超越 Claude，尤其在字母计数等逻辑题目上胜出。官方随即推出 2.5 折限时优惠（至 5 月 5 日），鼓励用户适配 Claude Code 配置直接接入。此次发布引发大量用户冲充值，被认为是中国 AI 进入"API 定价人民币时代"的标志性时刻。

🔗 https://x.com/i/web/status/2047518280357978386

2. 小米 MiMo-V2.5 Pro 开启公测，Agent 能力跨越式升级

小米 AI 大模型团队发布 MiMo-V2.5 系列并开启公测，旗舰版 MiMo-V2.5-Pro 在复杂软件工程任务中表现亮眼，仅 4.3 小时即完成了人类专家需数周才能完成的 Rust 底层开发任务。小米官方宣称新模型相比 Kimi K2.6 节省 40% 的 Token 消耗，在 Agent 能力和长程任务处理上实现全面跃升。小米大模型团队负责人罗福莉（曾供职阿里达摩院、DeepSeek）接受了 3.5 小时深度专访，首次公开谈及 2026 年 Claude Opus 4.6 等技术引发的 AI 剧震、国内团队 Pre-train 代差消失后的 Agent RL 路线以及国内外模型的竞争格局，该专访获 100 万+ 浏览量、1057 次点赞。

🔗 https://x.com/i/web/status/2048049139078865332

3. Devin 团队改口：多 Agent 唯一能落地的真相是"一写多想"

Devin 团队在 10 个月前曾力劝开发者不要构建多 Agent 系统，但如今他们发布了一篇重磅文章正式改口，并给出 2026 年多 Agent 真正能落地的唯一可行模式："一个人写，一群人想"——即一个 AI 执行代码，多个 AI 并行进行规划与审查，而非多个 AI 同时修改同一段代码（那样只会互相打架、风格混乱、bug 满天飞）。这一结论源自他们大量的生产实践，对当前 AI 编程 Agent 领域意义重大，引发 5.7 万浏览、263 点赞、51 次转发，被认为是 2026 年 Agent 架构设计的关键参考。

🔗 https://x.com/i/web/status/2047183375539028151

4. Huashu-Design：逆向 Claude Design 核心能力，打造真正 Agent 原生设计工具

一位开发者宣布逆向工程了 Claude Design 的核心设计能力，并推出开源项目 Huashu-Design。其核心论点是：GUI 操作已是"上一个时代的产品形态"，真正 Agent 原生的设计工具不需要通过图形界面手动操作，而是可以通过 Agent 调用直接生成设计产物。该项目已免费开源，引发社区强烈反响，获 12.6 万浏览量、715 次点赞、97 次转发，是本周 AI 工具类开源项目中传播最广的之一。

🔗 https://x.com/i/web/status/2046431318507147670

5. Hermes Agent 精装后"几乎是另一种 AI"：持久记忆 + 工具 + 自进化

Nous Research 旗下的 Hermes Agent 生态持续扩张，本周主 repo 死守 10 万星，Atlas 平台实时运行 98 个社区项目。多位博主分享了"精装 Hermes"的体验：默认状态仅是聪明助手，配置持久记忆、外部工具和感官扩展后，体验接近"有记忆、有感官、能自进化的数字分身"。社区整理出 8 个热门实用项目，涵盖安全防护（CaMeL 集成）、搜索增强、高级推理循环插件（Arc：自动完成规划-执行-反思全流程）等维度，帮助用户快速搭建高质量自动化助手，相关讨论获 6.3 万浏览量、475 点赞。

🔗 https://x.com/i/web/status/2046878582367199653

6. GPT-Image-2 信息差套利：X 上炫技，小红书直接变现

GPT-Image-2 全面开放后，一位博主点出了有趣的"信息差套利"现象：X/Twitter 上的技术大牛热衷展示各种酷炫图像生成效果（技术炫耀），而小红书用户则悄悄将其包装成"色彩测试"服务直接变现——原本需飞韩国花几千元的人气项目，GPT-Image-2 把交付成本打到近乎为零。这篇帖子引发了对 AI 工具商业化路径的讨论：技术能力本身不等于商业价值，找对需求场景、降低交付成本才是关键。同期 Anthropic 也免费开放了 2 小时 Claude Code 实战课，内容涵盖代码编写、自动化、项目拆解等实操内容。

🔗 https://x.com/i/web/status/2048929025834328120

🔥

GitHub 热榜

mattpocock/skills (+5,645)

Matt Pocock（TypeScript 教育博主）开源了自己的 `.claude` 目录中的 Skills 集合，定位为"真实工程师的 Skills"。项目以 Shell 脚本为主，包含他在日常开发中实际使用的各类 Claude Skills 配置。随着 Claude Skills 生态快速膨胀，社区对高质量、经过实战验证的 Skills 模板需求激增，该项目凭借作者的品牌影响力在一天内斩获 5000+ Star，是 AI 编程工具生态中最受关注的实践分享之一。

🔗 https://github.com/mattpocock/skills

Alishahryar1/free-claude-code (+2,949)

一个让用户在终端、VSCode 插件或 Discord（类似 OpenClaw）中免费使用 Claude Code 的开源方案，基于 Python 实现。该项目总 Star 数已达 16,113，说明降低 Claude Code 使用门槛是当前社区的强需求。项目提供多种接入方式，适合想体验 Claude Code 编程 Agent 但不想付费的开发者，也为企业内部工具集成提供了参考路径。

🔗 https://github.com/Alishahryar1/free-claude-code

TauricResearch/TradingAgents (+248)

多 Agent LLM 金融交易框架，专为量化交易场景设计，支持多个 LLM Agent 协同完成市场分析、风险评估和交易决策。Python 实现，总 Star 近万，是将 AI Agent 技术落地于金融垂直领域的代表性开源项目。随着 AI Agent 在专业领域（法律、金融、医疗）的应用加速，TradingAgents 提供了一个完整的多 Agent 协作与工具调用参考架构，适合量化研究者和金融科技开发者参考。

🔗 https://github.com/TauricResearch/TradingAgents

microsoft/VibeVoice (+757)

微软开源的前沿语音 AI 项目，Python 实现，定位为开源版"边界级别"语音 AI。随着语音交互成为 AI Agent 的重要接入方式，微软将语音 AI 能力开源，降低了语音 Agent 开发门槛。项目可用于语音合成、语音识别及实时对话场景，与微软 Azure AI 生态深度整合，对希望在本地或私有云部署语音 AI 能力的开发者极具吸引力。

🔗 https://github.com/microsoft/VibeVoice

gastownhall/beads (+498)

Beads 是一款专为 AI 编程 Agent 设计的"记忆升级"工具，Go 语言实现。核心解决的问题是：当前 coding agent（如 Claude Code、Codex）在长对话中记忆有限，Beads 通过结构化外部记忆系统让 Agent 在多个会话间保持连贯上下文，显著提升复杂项目的代码一致性。这一赛道随 AI coding agent 的普及正在快速升温，Beads 以轻量 Go 实现的高性能和简洁架构赢得关注。

🔗 https://github.com/gastownhall/beads

📺

YouTube 热门

1. Anthropic 官方：Claude Code 2 小时免费实战课（频道：Anthropic）

Anthropic 宣布免费开放一门 2 小时 Claude Code 实战课，内容聚焦于如何用 Claude Code 在真实项目中写代码、跑自动化、拆解大型项目并真正嵌入开发流程，不是 AI 概念科普也不是趋势分析，而是直接面向开发者的实操内容。课程发布后在 X/Twitter 和 YouTube 社区广泛传播，被认为是 Anthropic 推动 Claude Code 开发者生态的关键举措，对希望提升 AI 辅助编程效率的工程师极具价值。

🔗 https://anthropic.com/claude-code

2. 小米 MiMo 负责人罗福莉：3.5 小时技术深访（中文 AI 频道）

小米大模型团队负责人罗福莉（曾任职阿里达摩院、DeepSeek）接受了迄今最长深度访谈（3.5 小时），内容涵盖：MiMo-V2 系列研发决策、国内团队 Pre-train 代差消失后的战略转向、Agent RL 方向的具体技术路径、以及对 Anthropic/OpenAI 路线的客观评价。该访谈在 X 获 23.3 万浏览量，是本周中文 AI 圈传播最广的深度内容之一，对了解国内顶级 AI 团队技术思路极有参考价值。

🔗 https://x.com/i/web/status/2048049139078865332

3. Devin 多 Agent 架构解析："一写多想"才是正道（AI Engineering 频道）

Devin 团队发布长文并配合视频，正式公布其经过生产验证的多 Agent 协作架构核心结论：单写手 + 多思考者（One Writer, Many Thinkers）模式。视频详细拆解了为什么让多个 AI 同时修改代码是反模式（代码冲突、风格混乱、bug 激增），以及"并行规划 + 串行执行"如何在保持代码一致性的同时发挥多 Agent 的推理优势。这一结论对 2026 年 AI Agent 系统设计具有重要指导意义，获大量 AI 工程师转发讨论。

🔗 https://x.com/i/web/status/2047183375539028151

4. GPT-Image-2 实测对比：与 Midjourney/DALL-E 3/Stable Diffusion 全面横评（科技频道）

GPT-Image-2 全面上线后，多个 YouTube 科技频道发布了详细实测视频，从文生图质量、图生图能力、文字渲染准确性、对复杂 Prompt 的理解等多个维度与竞品对比。普遍结论是：GPT-Image-2 在复杂场景构图和文字渲染上显著领先，但在艺术风格多样性上仍有提升空间。视频同步展示了商业应用场景（品牌设计、营销素材、表情包生成），播放量普遍在 50 万+，是本周最热门的 AI 图像相关内容。

🔗 https://www.youtube.com/results?search_query=GPT+Image+2+review

5. "Harness Engineering" 正在成为 2026 年 AI 核心技能（技术博主频道）

"Harness Engineering"（缰绳工程）这一概念在社区快速传播，源自 2 月的一篇高热帖子（11.7 万浏览量）：AI Agent 如同动力十足但不守规矩的马，Harness 就是让它跑得快又不跑偏的缰绳——涵盖提示词工程、工具调用约束、错误恢复机制、输出验证等系统工程能力。相关 YouTube 视频深入讲解如何为 Claude Code/Codex 等 coding agent 设计稳健的 Harness 架构，在 AI 工程师圈层广泛传播，预计成为 2026 年 AI 系统开发的核心技能之一。

🔗 https://x.com/i/web/status/2027156511555027252

💬

Reddit 精选

1. r/LocalLLaMA：Luce DFlash 让 Qwen3.6-27B 在单张 RTX 3090 跑出 2x 吞吐量 ⬆️ 468 分

Luce DFlash 是一个基于 DFlash 投机解码技术的 GGUF 移植实现，纯 C++/CUDA 栈，无需额外依赖，单张 24GB RTX 3090 即可运行 Qwen3.6-27B 并实现最高 2 倍的推理吞吐提升。这对本地运行大模型的玩家意义重大：不需要升级硬件，仅通过更高效的推理优化就能大幅提升体验。该项目是投机解码技术在消费级 GPU 上落地的重要实践，帖子在 LocalLLaMA 获 468 分，社区对投机解码与 GGUF 结合的技术细节讨论热烈。

🔗 https://reddit.com/r/LocalLLaMA/comments/1sx8uok/luce_dflash_qwen3627b_at_up_to_2x_throughput_on_a/

2. r/LocalLLaMA：微软开源 TRELLIS.2 — 4B 参数图生 3D 模型，分辨率达 1536³ ⬆️ 291 分

微软发布 TRELLIS.2，一个 40 亿参数的开源图像转 3D 模型，基于新型"O-Voxel"稀疏体素结构，实现高达 1536³ 分辨率的 PBR（基于物理的渲染）纹理资产生成，16 倍空间压缩率保证了高效运行。TRELLIS.2 专为游戏、影视、XR 等领域的 3D 资产生成设计，开源后可本地部署，显著降低了高质量 3D 内容生产成本，被社区认为是 AI 3D 生成领域的里程碑级开源项目。

🔗 https://reddit.com/r/LocalLLaMA/comments/1sxf2u0/microsoft_presents_trellis2_an_opensource/

3. r/LocalLLaMA：MiMo V2.5 Pro 本地测评引发热议 ⬆️ 302 分

小米 MiMo V2.5 Pro 开源权重发布后，LocalLLaMA 社区迅速展开基准测试。测评显示该模型在软件工程相关任务上表现出色，尤其是多步骤代码调试和工具调用任务，社区整理了与 Qwen3、DeepSeek V4 的横向对比，结论是各有优势但 MiMo V2.5 Pro 的 Token 效率是最大亮点。讨论中也有用户指出，在数学推理类任务上 MiMo 仍落后于 DeepSeek，但作为可本地部署的开源 Agent 模型，其综合性价比赢得广泛认可。

🔗 https://reddit.com/r/LocalLLaMA/comments/1sxbcyn/mimo_v25_pro/

4. r/MachineLearning：AI Agent 在生产环境中如何测试？不可预测性让人崩溃 [D] ⬆️ 29 分

一名有近 10 年 QA 经验的工程师发帖描述了为 LLM-based Agent 做质量保证的困境：传统 QA 的"给定输入 X，验证输出 Y"范式完全失效，而多步骤 Agent 的每一步输出都可能不确定。帖子引发了大量工程实践讨论，主要建议包括：使用 LLM-as-Judge 进行语义评估、构建基于行为的测试（测"做没做到目标"而非"输出是否完全一致"）、建立黄金数据集 + 回归测试、以及在 staging 环境中进行大量 shadow run。这是当前 AI 工程化落地最真实的痛点讨论之一。

🔗 https://reddit.com/r/MachineLearning/comments/1sx3p40/how_do_you_test_ai_agents_in_production_the/

5. r/artificial：如果 AI 让每个人效率提升，为什么只有裁员新闻？ ⬆️ 47 分

一篇引发广泛共鸣的帖子直击当前 AI 应用的核心矛盾：技术上一个人能干三个人的活，但现实中公司的默认选择是解雇两个人而非扩大产出。帖子指出，生产率提升的收益正在系统性地流向资本而非劳动者，技术赋能并没有自动转化为工人福祉。评论区出现了多种视角：部分人认为这是技术过渡期的必然阵痛，另一部分人认为需要政策层面的分配机制干预。这一讨论折射出 AI 大规模落地后社会经济层面的深层张力。 *本文由小爱自动生成，数据来源：Twitter/X、GitHub Trending、Reddit。生成时间：2026-04-28 09:00 (北京时间)*

🔗 https://reddit.com/r/artificial/comments/1swxt51/if_ai_makes_everyone_more_productive_why_does_it/