AI 日报

ARTIFICIAL INTELLIGENCE DAILY
早报
🐦

Twitter/X 热议

1. Karpathy 自曝"AI精神病":12月以来没手写过一行代码

Andrej Karpathy 在最新播客中坦承,自去年12月起就再也没有手写一行代码,每天对着 Agent 说话16小时,同时开十几个 Agent 并行跑任务,token 没花完就焦虑。他把这种状态称为"AI精神病"。更重要的是他提出了一个产品预言:App 应该消失,智能家居不需要六个 App,设备只需暴露 API,让 Agent 统一调度。他之前开源的 autoresearch 项目也在社区爆火——能在单 GPU 上一夜跑100个 ML 实验,Agent 自动写代码、训练、迭代,人类只需维护一个 Markdown 策略文件。社区已有人将其移植到量化金融领域,衍生出 Autoquant(135个自主 agent),在推特上获得近2000赞。

🔗 https://x.com/i/status/2035385904634699950

2. Sam Altman 力挺 Codex:称 GPT-5.3→5.4 升级体感明显

Sam Altman 连发多条推文力挺 OpenAI Codex 团队,称其为"hardcore builders",并表示认识的硬核开发者都已经切换到 Codex。他还评价 GPT-5.4 的能力提升不仅是更聪明,更是体感上的质变。当有用户担忧 OpenAI 产品被砍时,Altman 明确回应"不会关闭,反而相反",暗示团队正在构建令人期待的新功能。Codex 使用量正在快速增长,显示出 OpenAI 在编码 Agent 赛道上的强势布局。

🔗 https://x.com/i/status/2033660522961502288

3. Yann LeCun 离开 Meta 创办 AMI Labs,拿下10.3亿美元欧洲史上最大种子轮

图灵奖得主 LeCun 正式离开 Meta,创立 AMI Labs,仅用4个月就拿下10.3亿美元种子轮融资——创下欧洲史上最大种子轮记录。他的目标极为大胆:证明整个 LLM 自回归路线走错了,要构建能真正理解现实世界、具备长期记忆和规划能力的智能系统。这是对 GPT/Claude/Gemini 等主流架构的直接挑战。推特上相关讨论热度极高(7万+浏览),AI 研究方向之争再次成为焦点。

🔗 https://x.com/i/status/2032016233172992083

4. Jim Fan 团队两大机器人突破:SONIC 人形控制 + 灵巧手装配

NVIDIA Jim Fan 团队接连发布重磅成果。第一个是 SONIC——仅42M参数(半个GPT-1大小)的 transformer 控制人形机器人全身运动(深蹲、转身、爬行、冲刺),捕捉人类"System 1"快速反应能力。第二个更惊艳:训练22自由度灵巧手人形机器人完成汽车模型装配、注射器操作、扑克牌分类、衬衫折叠等精细任务,主要从2万+小时人类第一视角视频中学习,完全不需要机器人参与训练数据采集。这标志着"人类是最可扩展的具身数据源"这一理念的重大验证。

🔗 https://x.com/i/status/2026709304984875202

5. Xiaomi MiMo-V2-Pro 悄然登顶开源模型前列

小米旗下 MiMo-V2-Pro(代号 Hunter Alpha)悄然出现在 Artificial Analysis 排行榜上,排名介于 Kimi K2.5 和 GLM-5 之间。参数规模309B(MoE架构,~15B活跃),支持100万 token 上下文窗口。同时 MiMo-V2-Flash 开源版在 SWE-Bench 上以73.4%拿下开源模型第一,推理成本仅 $0.10/M input tokens——约为 Claude Sonnet 的3.5%。社区惊呼"AI定价格局要变"。小米正式从手机厂商跻身一线 AI 模型实验室行列。

🔗 https://x.com/i/status/2034305821241475167

6. Dario Amodei 发布万字长文《The Adolescence of Technology》谈 AI 国安风险

Anthropic CEO Dario Amodei 发布长篇文章《技术的青春期》,深入讨论强大 AI 对国家安全、经济体系和民主制度构成的风险,并提出防御策略。这篇文章在推特上获得1.5万赞、268万浏览,是近期 AI 安全领域最受关注的单篇内容。Amodei 的核心论点是:当前的 AI 就像一个青少年——能力在快速增长,但相应的治理框架和安全机制还远未成熟,需要全社会共同应对。

🔗 https://x.com/i/status/2015833046327402527
🔥

GitHub 热榜

1

bytedance/deer-flow ⭐ 37 (+1,690)

字节跳动开源的 SuperAgent 框架,从 Deep Research 工具成长为通用 Agent 底座。支持子 Agent、Memory、Sandbox、Skills 系统,可挂载 MCP 工具,接入多种模型和搜索/爬取能力。能处理从几分钟到几小时不等的复杂任务。Twitter 上有用户评价"这是偏工程化的 Agent 底座,不是玩具"。适合需要构建多层级 Agent 系统的团队。

🔗 https://github.com/bytedance/deer-flow
2

Crosstalk-Solutions/project-nomad ⭐ 11 (+2,300)

今日 GitHub 涨星最快的项目——一个完全自包含的离线生存计算机。集成关键工具、知识库和 AI 能力,断网环境下仍可运行。TypeScript 构建,适用于应急准备、野外探险、灾难响应等场景。项目定位独特:将 AI 的实用性延伸到无网络覆盖的极端环境。

🔗 https://github.com/Crosstalk-Solutions/project-nomad
3

TauricResearch/TradingAgents ⭐ 38 (+1,051)

多智能体 LLM 金融交易框架,最新 v0.2.1 支持 GPT-5.4、Claude 4.6、Gemini 3.1 等前沿模型。采用三层架构,包含市场分析、风险管理和执行专用 Agent。Star 增长曲线自去年7月起飞至今已超34K,被社区称为"散户的机构级武器"。中文增强版 TradingAgents-CN 也同步上榜。

🔗 https://github.com/TauricResearch/TradingAgents
4

vxcontrol/pentagi

完全自主的 AI Agent 渗透测试系统,能执行复杂的安全测试任务。项目展示了 Agent 在网络安全领域的前沿应用:不需要人工干预即可完成漏洞扫描、利用和报告全流程。对安全团队而言,这可能改变渗透测试的工作模式。

🔗 https://github.com/vxcontrol/pentagi
5

NousResearch/hermes-agent

NousResearch 发布的新型 Agent 框架,主打"与用户共同成长"的理念。区别于一次性对话,hermes-agent 强调持续性学习和个性化适应。结合 NousResearch 在开源模型训练方面的积累,这个项目有望成为个人 Agent 领域的重要参考实现。

🔗 https://github.com/NousResearch/hermes-agent

📺

YouTube 热门

1. 中国 AI 机器人突破人类技能壁垒

本周机器人领域进展密集:韩国展示了能跑、跳、踢球、甚至太空步的人形机器人;中国多家公司也发布了各自的突破性演示。视频详细分析了各团队的技术路线差异,包括强化学习 vs 模仿学习、仿真到真实的迁移挑战。社区评论认为人形机器人正在从"展示性表演"快速转向"实用技能"阶段,2026年可能是人形机器人商业化的起始年。

🔗 https://www.youtube.com/watch?v=QDRzgF-8-50

2. NVIDIA GTC 2026 揭示 5 大 AI 与机器人转折点

Jensen Huang 在 GTC 2026 主题演讲中发布多项重磅消息:新一代 GPU 架构、AI 工厂概念升级、机器人基础模型平台、以及 NemoClaw(基于 OpenClaw 的企业级安全 Agent 框架)。视频提炼了五个关键转折点,包括物理AI从研究走向生产、Agent 框架标准化、以及 AI 芯片从训练向推理的重心转移。GTC 被认为标志着"AI 操作系统时代"的正式开启。

🔗 https://www.youtube.com/watch?v=CzTIduXcXMA

3. Matt Wolfe:这个视频模型让所有人震惊了

Matt Wolfe 的周度 AI 新闻汇总,重点报道了新一代视频生成模型的突破——在连贯性、物理真实感和可控性方面都有显著提升。视频还覆盖了多个被忽略的重要新闻:新的文本到3D工具、AI音乐生成的版权争议进展、以及几个值得关注的开源项目。30分钟的深度汇总,信息密度极高,适合追踪 AI 产品层面的最新动态。

🔗 https://www.youtube.com/watch?v=msrbd-d6lWk

4. Tech With Tim:2026年 AI 与就业市场的诚实观察

作为技术内容创作者,Tim 从亲身经历出发分析 AI 对开发者就业市场的真实影响。他的核心观点是:初级开发岗位确实在萎缩,但高级工程和 AI 工程岗位需求反而增加。视频基于 LinkedIn 和 Indeed 的最新数据,避免了常见的恐慌或过度乐观,给出了务实的职业建议。评论区的讨论也很有价值——许多开发者分享了自己被 AI 改变工作方式的真实案例。

🔗 https://www.youtube.com/watch?v=PEFso88LkC4

5. IBM Technology:2026 AI 趋势

— 量子计算、Agentic AI 与智能自动化

IBM 的技术趋势分析视频,37万+播放量证明其内容价值。重点阐述了三大趋势:量子计算与 AI 的融合可能在特定优化问题上产生突破、Agentic AI 正在从概念验证进入企业生产环境、智能自动化将从"替代人力"转向"增强人力"。视频结合 IBM 自身的 watsonx 平台案例进行讲解,企业视角的分析对 To-B 从业者特别有参考价值。

🔗 https://www.youtube.com/watch?v=zt0JA5rxdfM
💬

Reddit 精选

1. Alibaba 确认将持续开源 Qwen 和 Wan 系列模型 [r/LocalLLaMA ⬆️991]

阿里巴巴通过 ModelScope 官方账号正式确认将持续开源新的 Qwen(通义千问)和 Wan(万象)系列模型。这条消息在 LocalLLaMA 获得近千赞,社区反响热烈。阿里的开源策略一直是业内最激进的之一——从 Qwen 系列文本模型到 Wan 系列多模态模型全面覆盖。这种承诺意味着开源社区将持续获得高质量的基座模型供微调和部署,对降低 AI 应用门槛意义重大。

🔗 https://reddit.com/r/LocalLLaMA/comments/1s0pfml/alibaba_confirms_they_are_committed_to/

2. MiniMax M2.7 将开放权重 [r/LocalLLaMA ⬆️643]

MiniMax 宣布其最新旗舰模型 M2.7 将以开放权重形式发布。此前 MiniMax M2.5 已在多个 benchmark 上与 Claude Sonnet 4.5 打平,成本却只有十分之一。社区将此消息与 Cursor 确认 Kimi K2.5 为最佳开源基座模型的新闻放在一起讨论,认为2026年Q1正在成为开源模型的"黄金季度"——多家中国 AI 公司几乎同时释放前沿级开源模型,闭源模型的成本优势正在被快速侵蚀。

🔗 https://reddit.com/r/LocalLLaMA/comments/1s0mnv3/minimax_m27_will_be_open_weights/

3. Cursor 承认 Kimi K2.5 是最佳开源模型 [r/LocalLLaMA ⬆️215]

Cursor 联合创始人 Aman Sanger 详细回应了 Kimi K2.5 事件:团队评估了大量基座模型,Kimi K2.5 在困惑度指标上表现最强,Cursor 在其基础上进行了持续预训练和4倍算力规模的强化学习。Kimi K2.5 为1T总参数、32B活跃MoE架构,被认为是首个在实际编码任务中媲美 Claude Opus 4.6 的开源模型。这一事件引发了关于闭源 vs 开源模型在 Agent/编码场景中差距快速缩小的广泛讨论。

🔗 https://reddit.com/r/LocalLLaMA/comments/1s19ik2/so_cursor_admits_that_kimi_k25_is_the_best_open/

4. 学术 ML 研究在2026年是否已被工业界"杀死"? [r/MachineLearning ⬆️130]

一个引发激烈讨论的帖子:发帖者指出几乎所有能想到的 ML 研究主题现在都在工业界做得更好,因为算力和人才完全不对等。留在学术界的只剩下深度细分的小众方向和理论证明。50条评论中观点两极分化——有人同意学术界需要重新定位(更偏基础理论和跨学科),也有人反驳说许多重要突破仍然来自高校(如 Flow Matching 就是 MIT 的课程内容)。

🔗 https://reddit.com/r/MachineLearning/comments/1s0hcit/d_has_industry_effectively_killed_off_academic/

5. MoMA 画家将50年作品发布为开放 AI 数据集 [r/artificial ⬆️230]

一位作品收藏于 MoMA 和大都会博物馆的画家,将自己从1970年代至今50年的全部创作发布为开放 AI 训练数据集。这是艺术界主动拥抱 AI 的罕见案例。他在帖子中分享了整个过程的反思——包括版权考量、对 AI 生成艺术的态度转变、以及作为一个具象艺术家如何看待 AI 将改变创作本身。61条评论展现了从艺术家、开发者到法律专家的多元视角,是近期 AI 与创意产业交叉领域最有深度的讨论之一。 📊 **今日趋势总结**:开源模型进入"黄金季度"——阿里、MiniMax、小米、月之暗面(Kimi)密集释放前沿级模型;Karpathy 的 autoresearch 正在催生自主研究 Agent 生态;LeCun 的 AMI Labs 挑战 LLM 路线引发方向之争;AI Agent 框架(DeerFlow、TradingAgents)从概念验证加速走向生产部署。

🔗 https://reddit.com/r/artificial/comments/1s0bxvq/i_am_a_painter_with_work_at_moma_and_the_met_i/