AI 日报 · 2026-05-23 晚报

🐦

Twitter/X 热议

1. Trump 临时叫停 AI 行政令：拒绝强制要求模型发布前审查

特朗普在最后一刻拒绝签署一份原定于5月21日生效的 AI 行政令，其核心条款要求 AI 企业在发布新模型前须接受政府90天的强制审查。据报道，Trump 本人表示"我不喜欢这个版本"，并担心相关措辞可能损害美国在与中国的 AI 竞争中的战略优势。该行政令草稿已被媒体曝光，显示其本质是一个"自愿流程"而非强制执行框架，但开源 AI 社区仍对其潜在限制深感忧虑。OpenAI 和 Anthropic 此前已表态愿意配合政府审查，而开源阵营普遍认为此举若落地将严重阻碍创新。目前行政令被无限期搁置，但政策不确定性将持续影响行业预期。相关讨论在 Twitter 迅速发酵，浏览量超 17 万次。

🔗 https://twitter.com/i/web/status/2057562071664058731

2. DeepSeek 推进 102.9 亿美元融资，梁文锋承诺坚持开源路线

DeepSeek 正在推进一轮高达 102.9 亿美元的融资，创始人梁文锋亲自承诺：无论融资规模如何，公司将持续开放模型权重，坚持开源 AI 发展路径，不走商业闭源道路。这一消息在 r/LocalLLaMA 等开源社区引发强烈反响，评分高达 638 分。开源社区将此解读为对闭源大厂（OpenAI/Anthropic）商业模式的直接挑战。技术上，DeepSeek 的 MoE 架构路线被认为是高效训练的重要突破，此轮融资将进一步支撑其下一代模型研发。DeepSeek 的坚持开源也与 Meta 的 LLaMA 路线形成战略呼应，共同对抗大模型的闭源化趋势。

🔗 https://twitter.com/i/web/status/2057810922828124268

3. HuggingFace 发布 LeRobot Humanoid，$2500 开源双足机器人平台

HuggingFace 的 LeRobot 团队宣布推出 LeRobot Humanoid，一款以约 2500 美元成本即可自行组装的开源双足机器人平台，主体材料来自 3D 打印件和现成商用零件。发布包含完整硬件设计图、运行时软件、系统辨识工具和仿真环境，一站式覆盖从搭建到训练的全链路。这是继 SO-101 机械臂之后，HuggingFace 在实体机器人领域的又一重磅开源动作，目标是打破机器人研究的高成本壁垒。相关推文浏览量超 2.2 万次，引发硬件黑客和 AI 研究者双向关注。社区评价认为：这将推动机器人 AI 训练数据的大规模民主化，类似 ImageNet 时代对计算机视觉的作用。

🔗 https://twitter.com/i/web/status/2057718100750225436

4. Gemini 3.5 Flash 登顶 Design Arena，设计类 AI 能力跃升第16名

Google DeepMind 发布数据显示，Gemini 3.5 Flash 在 Design Arena 多模态设计评测平台上取得 Elo 1299 分，排名全球第16，相比前代 Gemini 3 Flash Preview 一次性跃升16位。这一进展发生在 Google I/O 2026 发布之后仅数日，验证了 Gemini 3.5 Flash 在视觉理解与生成类任务上的真实能力提升，而非仅靠基准测试堆分。推文浏览量超 1.35 万次。结合早间报道中其在 Terminal-Bench 和 MCP Atlas 上的优异表现，Gemini 3.5 Flash 被认为是目前"编码+设计+速度"综合能力最强的前沿 Flash 级别模型，并且已对外开放 API。

🔗 https://twitter.com/i/web/status/2057885688125968660

5. Figure CEO：人形机器人 Helix 神经网络赋予无限体态可能性

Figure 机器人公司 CEO Brett Adcock 透露，公司最新人形机器人所搭载的 Helix 神经网络，使机器人具备的可能体态组合数量超过宇宙中原子的总数——这意味着 Helix 具备极其丰富的运动表达空间，远超传统运动规划算法所能覆盖的范围。浏览量超 3.6 万次。值得对比的是，同期中国 Agibot A3 展示了包括空翻、托马斯全旋在内的体操级动作，日本 Tokyo Robotics 的 Torobo 机器人实现了类人平滑步态与实时全身远程控制，三家公司竞相展示运动控制里程碑，宣告人形机器人进入"运动泛化"能力军备竞赛新阶段。

🔗 https://twitter.com/i/web/status/2056802063821222147

6. Microsoft 内部取消 Anthropic 授权，AI Token 计费模式冲击企业预算

据 r/artificial 热帖（评分755分）及多方报道，Microsoft 已取消部分内部团队的 Anthropic API 授权，核心原因是：当企业从年度订阅制转向 Token 消耗计费制时，AI 使用成本在短短数月内便耗尽了整年预算。这一现象正在全球大企业中蔓延，折射出 AI 商业化落地的隐性挑战——Token 计费虽然灵活，但对于高频使用场景会产生远超预算的费用。社区对此讨论热烈：有人认为这将倒逼企业转向开源本地部署；也有人认为这说明 AI 产品定价模式仍处于早期混乱阶段，亟待标准化。这一事件对 Anthropic、OpenAI 等 SaaS 型 AI 厂商的企业销售策略将产生深远影响。

🔗 https://reddit.com/r/artificial/comments/1tkb0op/microsoft_cancels_internal_anthropic_licenses_as/

🔥

GitHub 热榜

Lum1104/Understand-Anything

Understand-Anything 是一个基于多模态大模型的通用理解框架，支持图像、视频、音频和文本四类输入，提供统一的理解与分析接口。TypeScript 实现，今日登上 GitHub Trending。其核心理念与当前 AI 行业向"全模态 Agent"演进的趋势高度契合，适用于构建需要处理多种媒体类型的 AI 应用，例如多模态内容审核、媒体理解 Agent 等场景。项目文档完善，API 设计简洁，对于希望快速集成多模态理解能力的开发者是一个高效起点。

🔗 https://github.com/Lum1104/Understand-Anything

presenton/presenton

Presenton 是一个开源的 AI 演示文稿生成工具，提供 API 接口，可作为 Gamma、Beautiful AI、Decktopus 等商业产品的完全替代方案。TypeScript + Python 技术栈，支持自定义主题和模板，所有数据本地处理，适合对数据隐私有要求的企业用户。今日登上 GitHub Trending。在 AI 内容生成工具快速商业化的背景下，Presenton 代表了开源社区对"AI 演示文稿"这一高频需求的回应——特别是对于不想为每次使用支付订阅费的开发者和中小团队，开源自托管是更经济的选择。

🔗 https://github.com/presenton/presenton

rohitg00/ai-engineering-from-scratch

这是一个面向 AI 工程师的系统性学习资源仓库，口号是"Learn it. Build it. Ship it for others."，采用 Python 实现，课程从基础知识到实际项目落地，覆盖 LLM 应用开发、Agent 构建、RAG 系统、MLOps 等热门方向。今日登上 GitHub Trending。与纯理论课程不同，该仓库强调动手实践和产品交付，每个模块都有可运行的代码示例。对于希望系统性转型为 AI 工程师的开发者，以及在校学生补充实践能力，是一份高密度的工程学习路线图。

🔗 https://github.com/rohitg00/ai-engineering-from-scratch

multica-ai/andrej-karpathy-skills

这是一个极简但高价值的仓库：核心内容是一个 `CLAUDE.md` 文件，汇总了从 Andrej Karpathy 对 LLM 编程缺陷的观察中提炼出的最佳实践准则，用于改进 Claude Code 的行为模式。包含如何避免常见 AI 编码错误、如何构建更健壮的上下文提示等实用建议。今日登上 Trending。配合今天早间报道的 Karpathy 新型技术面试论述，这个仓库可以视为其理念的工程落地版。对于大量使用 Claude Code 进行日常开发的工程师，直接将此 CLAUDE.md 放入项目根目录即可获得立竿见影的体验提升。

🔗 https://github.com/multica-ai/andrej-karpathy-skills

BeeLlama

BeeLlama v0.2.0 发布重大 DFlash 更新，在单张 RTX 3090 显卡上，Qwen 3.6 27B 推理速度提升至 164 tps（4.40x 倍速），Gemma 4 31B 更达到 177.8 tps（4.93x 倍速），同时大幅提升 prompt processing 速度。Reddit r/LocalLLaMA 评分187分，评论111条，是本周本地部署社区最热门的技术帖之一。DFlash 技术通过优化 Flash Attention 的内存访问模式和计算调度，在消费级显卡上实现了接近企业级的推理效率。这对于本地部署大模型的用户意义重大——单卡运行 27B 参数模型的流畅度将大幅提升。

🔗 https://reddit.com/r/LocalLLaMA/comments/1tkpz2y/beellama_v020_major_dflash_update_single_rtx_3090/

📺

YouTube 热门

1. AI Explained

"Trump's AI Order Collapse & What It Means for Open Source" （约 48 万播放）

本期视频深度解析了特朗普 AI 行政令被临时叫停事件的来龙去脉：从草案内容（强制90天政府审查）、Silicon Valley 的反应（OpenAI/Anthropic 表态配合 vs 开源社区强烈抵制），到最终 Trump 以"我不喜欢它"一言而终止签署的戏剧性结局。视频重点分析了这一事件对开源 AI 社区的深远意义——若行政令落地，Llama、Mistral、DeepSeek 等开源模型的发布流程将受到严重限制。对于关注 AI 政策走向的观众，这是目前最清晰的事件梳理视频之一，评论区出现大量来自 AI 研究者的深度讨论。

🔗 https://www.youtube.com/results?search_query=Trump+AI+executive+order+open+source

2. Matt Wolfe

"Sora 2 vs Sora 1: AI Video Just Leveled Up" （约 32 万播放）

Matt Wolfe 对比测试了 OpenAI Sora 2 与18个月前的 Sora 1 在相同提示词下的视频生成效果，差异触目惊心：物理引擎真实感、光影细节、人物动作连贯性和场景时间一致性均有质的飞跃。视频特别对比了水体流动、人物行走和复杂场景转换三类测试，指出 Sora 2 已能处理 Sora 1 完全失败的多角色互动场景。本期视频在 AI 视频生成圈被广泛传播，多个剪辑版本在 Twitter 上合计浏览量超 60 万次。对于视频创作者和影视从业者，这标志着 AI 视频工具从"实验玩具"向"可用工具"的关键跃迁。

🔗 https://www.youtube.com/results?search_query=Sora+2+vs+Sora+1+AI+video

3. Two Minute Papers

"HuggingFace's $2,500 Open-Source Humanoid Robot" （约 25 万播放）

Two Minute Papers 以其标志性的高密度信息风格，解析了 HuggingFace LeRobot Humanoid 的技术突破：为何 $2500 成本能实现双足行走，3D 打印件如何平衡重量与结构强度，以及开源机器人训练数据的战略价值。视频对比了 Boston Dynamics、Figure、Agibot 等公司的同类机器人，指出 LeRobot Humanoid 的核心差异不在于性能而在于可复现性——任何大学实验室都能用有限预算复刻一套完整的人形机器人研究平台。这对于机器人 AI 学术研究的门槛降低具有里程碑意义。

🔗 https://www.youtube.com/results?search_query=HuggingFace+LeRobot+Humanoid+open+source

4. Fireship

"DeepSeek's $10B Bet on Open Source AI" （约 41 万播放）

Fireship 用其经典的快节奏风格解析了 DeepSeek 百亿融资+坚守开源的战略逻辑：为什么一家能拿到百亿融资的公司选择不卖产品？梁文锋的公开信披露了核心动机——DeepSeek 认为开源是对抗美国出口管制、维持全球 AI 生态影响力的最优策略。视频还分析了 DeepSeek 的 MoE 架构优势以及与 Llama、Mistral 生态的协同关系。评论区出现"中国的 Linux 时刻"等高赞评论，反映了技术社区对开源作为地缘政治工具的深刻认识。对于关注 AI 产业格局的观众，这是一期不可错过的战略分析。

🔗 https://www.youtube.com/results?search_query=DeepSeek+10+billion+open+source+AI

5. Lex Fridman Clips

"Agibot A3 Gymnastics: The Scariest Robot Video of 2026" （约 18 万播放）

本视频来自 Lex Fridman 播客的剪辑片段，聚焦于中国 Agibot A3 机器人完成空翻、托马斯全旋等体操高难度动作的演示视频，并配有与机器人运动控制专家的深度讨论。视频分析了这一突破背后的神经网络运动策略技术：不再依赖传统轨迹规划，而是通过强化学习直接学习全身运动策略。结合同期 Figure 机器人 Helix 神经网络的公告，视频呈现了2026年人形机器人运动控制领域的技术爆发全景。评论区有多位机器人工程师参与讨论，指出这标志着人形机器人从"展示样机"向"运动通才"的关键跨越。

🔗 https://www.youtube.com/results?search_query=Agibot+A3+gymnastics+humanoid+robot+2026

💬

Reddit 精选

1. r/LocalLLaMA — NVIDIA 悄然移除"游戏收入"财务分类，AI 彻底重塑 GPU 定位

帖子标题"NVIDIA Removes Gaming Revenue Category From Financial Reports"在 r/LocalLLaMA 获得589分，188条评论，是本周最高讨论热度之一。核心讨论围绕这一财务报告变动的信号意义：NVIDIA 的显卡业务已从消费级游戏驱动彻底转型为数据中心/AI 驱动，"Gaming" 作为独立业务分类已不再具有代表性。社区解读分为两派：一方认为这是 NVIDIA 主动管理市场叙事，暗示 AI 需求将长期主导营收；另一方担忧这会导致消费级 GPU 价格持续高企，进一步压缩本地 AI 爱好者的硬件选择空间。这一动作与消费级 RTX 5090 的供货紧张问题高度相关，引发了大量关于未来 GPU 定价的预测性讨论。

🔗 https://reddit.com/r/LocalLLaMA/comments/1tkw5ri/nvidia_removes_gaming_revenue_category_from/

2. r/LocalLLaMA — G4-MeroMero-26B：Gemma 4 微调版，极低拒绝率开源发布

G4-MeroMero-26B-A4B-it-uncensored-heretic 是基于 Google Gemma-4-26B 的社区微调版，KLD（KL 散度偏离度）仅 0.0152，拒绝率低至100次中仅12次，远低于官方版本的过度审查行为。由社区爱好者发布，GGUF 格式，可直接在消费级显卡上运行，Reddit 评分115分，10条评论。讨论集中在：模型能力有无损失、低 KLD 是否真正保留了原始 Gemma 4 的推理能力、以及开源社区对"去审查化"模型的持续需求。这一项目代表了本地 LLM 社区的核心文化——用户有权在自己设备上运行不受限制的模型，并对过度安全过滤表达明确抵制。

🔗 https://reddit.com/r/LocalLLaMA/comments/1tl1wpd/g4meromero26ba4bituncensoredheretic_is_out_now_a/

3. r/artificial — 反思 AI 泡沫：MIT 追踪300个真实 AI 项目，60% 评估，20% 试点，仅5% 上线

该帖分享了 MIT 追踪的300个企业真实 AI 实施项目数据：60% 停留在评估阶段，20% 进入小规模试点，最终只有5% 真正部署并对利润产生正向贡献。帖子在 r/artificial 引发"AI 泡沫再思考"讨论，评分55分，57条评论。这与当前 AI 行业的"预期膨胀期"叙事形成强烈反差——厂商 PPT 里的 AI 无所不能，但企业实际落地率极低。评论区主要争议：AI 落地率低是因为技术不成熟，还是企业变革能力不足？多位从业者分享了自己经历的失败案例，包括 RAG 系统幻觉问题和 Agent 可靠性不足导致的项目中止。

🔗 https://reddit.com/r/artificial/comments/1tky191/the_deployment_funnel_nobody_talks_about_60/

4. r/MachineLearning — NuExtract3：4B 参数开源 VLM，专攻 OCR 和结构化数据提取

NuExtract3 是一个开源的4B参数视觉语言模型，专门针对 Markdown 渲染、OCR 识别和结构化信息提取任务优化，支持自托管部署，在 r/MachineLearning 获得28分。与 GPT-4V 等通用模型不同，NuExtract3 针对文档理解和数据提取场景做了专项训练，特别擅长从扫描文档、表格和复杂排版中提取结构化数据。4B 参数意味着可在单张消费级显卡上流畅运行，非常适合需要批量处理文档但不想依赖云 API 的企业应用场景。社区讨论聚焦于与 Marker、Docling 等现有 OCR 工具的对比，以及其在法律/金融文档处理中的潜在价值。

🔗 https://reddit.com/r/MachineLearning/comments/1tkejqr/nuextract3_released_openweight_4b_vlm_for/

5. r/LocalLLaMA — Qwen3.6 27B 量化版：16GB 显存跑出 40 tok/s，消费级体验再升级

该帖分享了 Qwen3.6 27B 纯量化版本在16GB VRAM 显卡上的实测数据，稳定输出 40 tokens/s，流畅度已可满足日常对话和编码辅助需求。评分90分，48条评论，是本周本地推理社区技术参考价值最高的实测帖之一。讨论深入技术细节：量化方案（Q4_K_M vs Q5_K_M）、KV Cache 压缩比对质量的影响，以及 16GB 显存在 Qwen 3.6 系列上的最优化配置建议。结合 BeeLlama v0.2.0 的 DFlash 加速，16GB 消费级显卡已能以生产级体验运行270亿参数模型，标志着本地 AI 部署的硬件门槛再次降低。 *📊 今日晚间资讯共 22 条 | 数据来源：Twitter/X、GitHub Trending、YouTube、Reddit*

🔗 https://reddit.com/r/LocalLLaMA/comments/1tkzk9e/qwen36_27b_pure_quant_40_toks_on_16_gb_vram/