AI 日报

ARTIFICIAL INTELLIGENCE DAILY
晚报
🐦

Twitter/X 热议

1. DeepSeek-V4 正式上线,百万上下文+开源最强

DeepSeek 今日发布 V4,推出 V4-Pro(最强性能)和 V4-Flash(极致速度)两个版本,最大亮点是支持百万(1M)token 超长上下文,创新注意力机制让长文本处理效率大幅提升。在 Agent 能力、世界知识、推理性能三个维度均宣称达到开源最优水平。同时有传言 DeepSeek 正在与投资者洽谈首轮融资,估值不低于 100 亿美元,计划募集至少 3 亿美元,但官方既未确认也未否认。这次发布对开源 AI 生态意义重大,普惠级长上下文能力将推动 Agent 场景大爆发。

🔗 https://twitter.com/i/web/status/2047514319928361302

2. Kimi K2.6 开源:万亿参数 MoE,Agent 能力炸场

月之暗面开源 Kimi K2.6,号称 1 万亿参数 MoE 架构,激活参数仅 32B,原生支持多模态输入。Agent 能力尤为突出:支持 300 个子智能体并行运行、协调高达 4000 步任务,可自动处理文档、网站、表格全流程,无需人工干预。跑分上与 GPT-5.4、Claude Opus 4.6 正面竞争,部分指标反超。Kimi 团队还用 K2.6 让其基于 Zig 语言自主开发推理引擎,经 4000+ 次工具调用、12 小时连续执行,推理速度提升 20%,展示了极强的 long-horizon Agent 能力。

🔗 https://twitter.com/i/web/status/2046403559848358287

3. 多模型横向评测:非顶级模型排位战

圈内流传一份针对 GLM-5.1、Kimi K2.6、DeepSeek V4-Pro、Qwen3.6 等模型的实际编程体感评测。过 entry 梯队(接近主流生产可用):glm-5.1 ≈ kimi-k2.6 > deepseek-v4-pro > qwen-3.6-max-preview。未过 entry 梯队:mimo-v2.5-pro > qwen-3.6-plus > hy-3 > grok-4.20。同时有测评指出 Qwen3.5 系列(27B 和 35B A3B)存在严重过度思考问题,某些数学题思考 token 超 10k,而 Gemma4 26B A4B 某些问题则直接 0 思考。这份评测为开发者选型提供了真实参考。

🔗 https://twitter.com/i/web/status/2047845768560783634

4. LLM 杂交玩法:Qwopus-GLM-18B 击败 Qwen3.6-35B

社区出现 Qwopus-GLM-18B-Merged-GGUF,一个融合实验产物——底层叠加了两个分别蒸馏 Claude Opus 4.6 和 GLM-5.1 的 Qwen3.5 9B 模型,最终 18B 体积,12GB 显存即可运行。令人惊讶的是,该模型在多项测试中击败了 Qwen3.6-35B-A3B,性能/体积比极为突出。这种"杂交蒸馏"的玩法展示了开源社区的创造力,也引发了对知识蒸馏和模型合并边界的热议。GGUF 格式已发布,社区可直接下载测试。

🔗 https://twitter.com/i/web/status/2045686130147041587

5. OpenAI Workspace Agent 开源替代版上线

有开发者发布了 OpenAI Workspace Agent 的开源平替版,支持 Claude / GPT / Gemini / Kimi / DeepSeek 任意模型接入,可部署在自己服务器(最低 €4/月),每个会话配备独立 Docker 沙箱,终端用户凭证隔离,子 Agent 调用全程可观测。这与 OpenAI 的闭源商业方案形成直接竞争,为希望自主可控的企业和开发者提供了可行替代。84k+ 浏览量说明市场对企业级 Agent 平台的强烈关注。

🔗 https://twitter.com/i/web/status/2047521587122106376

6. 将完整 AI 运行环境打包进 U 盘,跨平台离线即插即用

一个开源项目将 Python 环境、Ollama 引擎、GGUF 模型打包到移动硬盘,支持 Windows/Mac/Linux/Android 共用同一份模型文件,无需重复下载,内置暗色 Web 界面,离线运行未经审查的本地 LLM。53k+ 浏览量体现了社区对数据隐私和本地部署的持续需求。这类"便携 AI 工作站"方案对于无网络环境部署、企业内网安全场景、以及追求极致隐私的用户极具价值。

🔗 https://twitter.com/i/web/status/2045859963877077071
🔥

GitHub 热榜

1

Alishahryar1/free-claude-code ⭐ 10,658 (+3,975)

让开发者无需付费即可在终端、VSCode 插件或 Discord(类似 OpenClaw)中使用 Claude Code 的 Python 工具。今日新增 3975 星,是今天 GitHub 全站涨星最快的项目。背后反映了 Claude Code 高昂订阅费($100+/月)的市场压力,以及开发者对低成本 AI 编程辅助的强烈需求。技术上通过代理接入 Anthropic API,适合个人开发者和小团队。

🔗 https://github.com/Alishahryar1/free-claude-code
2

huggingface/ml-intern ⭐ 5,902 (+1,236)

HuggingFace 出品的开源 ML 工程师 Agent,可自主阅读论文、训练模型、部署 ML 模型,是 HuggingFace 向 Agentic AI 方向迈出的重要一步。Python 实现,由 HuggingFace 核心团队维护。对于 ML 研究者和工程师来说,这意味着 AI 可以自动完成从论文复现到模型发布的完整工作流,大幅降低实验迭代成本。开源特性使其可深度定制和私有化部署。

🔗 https://github.com/huggingface/ml-intern
3

deepseek-ai/DeepEP ⭐ 9,420 (+189)

DeepSeek 开源的高效专家并行通信库,专为 MoE(Mixture of Experts)架构的大模型训练和推理优化设计,使用 CUDA 实现底层算子,解决多 GPU 专家并行中通信成本高的痛点。与 DeepSeek V4 发布同步,是 DeepSeek 开源技术生态的重要基础设施组件。对于训练千亿以上 MoE 模型的团队来说,DeepEP 可显著降低通信开销,提升训练效率。

🔗 https://github.com/deepseek-ai/DeepEP
4

RooCodeInc/Roo-Code ⭐ 23,400

在 VS Code 编辑器内提供整支 AI 开发团队能力的 TypeScript 插件,支持多 Agent 协作完成代码生成、审查、重构等复杂任务。由 TypeScript 实现,社区活跃(3,114 forks),是目前 AI 编程助手领域中最受欢迎的开源项目之一。与 Cursor、GitHub Copilot 等商业方案相比,完全开源可自定义模型后端,适合希望掌控数据的团队。

🔗 https://github.com/RooCodeInc/Roo-Code
5

ComposioHQ/awesome-codex-skills ⭐ 1,237 (+174)

面向 Codex CLI 和 API 的实用技能(Skills)精选集,涵盖各类工作流自动化场景,由 Composio 团队策划维护,Python 实现。随着 OpenAI Codex CLI 生态的快速扩张,这类技能库成为开发者快速上手 Agent 自动化的捷径。今日新增 174 星,说明 Codex 生态正在加速成熟,开发者社区的参与热情高涨。

🔗 https://github.com/ComposioHQ/awesome-codex-skills

📺

YouTube 热门

1. The 7 Skills You Need to Build AI Agents(IBM Technology)

频道:IBM Technology | 播放量:262,297 | 时长:14:37 | 发布:11天前 IBM Technology 出品的 AI Agent 构建技能指南,系统梳理了成为 AI Agent 开发者必备的 7 项核心技能,涵盖提示工程、工具调用、记忆管理、多步规划、错误处理等关键能力。IBM 作为企业级 AI 方案提供商,视角偏向生产环境落地,内容实用性强。26 万播放量说明 Agent 开发已成为开发者最热门的学习方向。视频适合有 LLM 基础但想进入 Agent 工程领域的开发者。

🔗 https://youtube.com/watch?v=mtiOK2QG9Q0

2. What AI Agent Skills Are and How They Work(IBM Technology)

频道:IBM Technology | 播放量:105,672 | 时长:12:25 | 发布:5天前 IBM Technology 对 AI Agent Skills 概念的深度解析,详细说明 Skill 如何作为 Agent 的能力模块被组合调用、如何与工具链集成、以及不同 Skill 类型(推理、执行、检索)的边界划分。5 天内突破 10 万播放,是近期 YouTube AI 频道中热度增长最快的内容之一。对于正在构建自己 Agent 系统架构的工程师来说,这是概念层面的重要参考。

🔗 https://youtube.com/watch?v=Lg-meK5IU8Q

3. Building a Team of AI Agents: Roles, Feedback & Teamwork Explained(IBM Technology)

频道:IBM Technology | 播放量:29,177 | 时长:9:59 | 发布:4天前 聚焦多 Agent 协作系统的角色分工、反馈机制和团队协调策略,是 IBM 系列 Agent 教程的进阶篇。4 天近 3 万播放,话题契合当前 Multi-Agent 框架(如 AutoGen、CrewAI、LangGraph)的社区热度。内容以实际工程场景为例,讨论 Supervisor-Worker 架构、Agent 间通信协议和任务分发策略,对构建企业级 AI 工作流有直接参考价值。

🔗 https://youtube.com/watch?v=kqj22mWIdjU

4. Intel Delivers Strong AI-Fueled Outlook | Bloomberg Tech 4/24/2026(Bloomberg Technology)

频道:Bloomberg Technology | 播放量:4,328 | 时长:46:08 | 发布:17小时前 Bloomberg Technology 昨日最新财经直播,聚焦 Intel 公布的 AI 驱动业务展望。Intel 在 AI 推理芯片市场展现出强势复苏迹象,Gaudi 系列 AI 加速器出货量超预期,与 NVIDIA 的竞争格局正在松动。这对整个 AI 硬件供应链是重要信号——替代性算力方案的成熟将有效缓解 AI 算力短缺,并对 GPU 价格产生下行压力。46 分钟深度报道覆盖了 Intel AI 战略的多个维度。

🔗 https://youtube.com/watch?v=DtCNGpeEZxM

5. Is AI Trending Up or Down in 2026?(Cal Newport)

频道:Cal Newport | 播放量:16,329 | 时长:1:13:04 | 发布:1天前 知名学者/作家 Cal Newport 对 2026 年 AI 趋势的长篇深度分析,从"深度工作"和认知科学视角重新审视 AI 对知识工作者的实际影响。1 小时 13 分完整剖析 AI 热度是否已达峰值、LLM 能力瓶颈在哪里、以及个人和组织应如何理性应对 AI 时代。16k 播放量和 1 天发布时间说明反主流视角同样引发广泛共鸣,是泡沫期中难得的冷静声音。

🔗 https://youtube.com/watch?v=BRr3pAPsQAk
💬

Reddit 精选

1. This is where we are right now, LocalLLaMA(r/LocalLLaMA, score: 2205)

r/LocalLLaMA 置顶讨论帖,以"the future is now"为题,汇聚了社区对当前本地 AI 能力边界的集体感叹。Qwen3.6-27B 在单张 RTX 5090 上实现 80 tokens/秒 + 218k 上下文窗口(vllm 0.19),小米 MiMo V2.5 Pro 在 Artificial Analysis 智能指数排名第 54 位且权重即将开源,DeepSeek V4 百万上下文……社区普遍认为本地推理能力正以超预期速度逼近云端大模型,"本地 AI"已不再是性能受限的代名词。2200+ 赞是今日 LocalLLaMA 最高分帖子。

🔗 https://reddit.com/r/LocalLLaMA/comments/1suqfba/

2. Deepseek V4 AGI confirmed(r/LocalLLaMA, score: 1473)

一篇半开玩笑半认真的热帖,起因是 DeepSeek V4 在多项基准测试中表现异常出色,社区用"AGI confirmed"的梗来调侃其实力,但评论区也展开了严肃讨论:V4 的 1M 上下文+开源生态是否标志着 AGI 路径上的重要里程碑?多数技术向评论认为 V4 是工程上的重大突破,但 AGI 的定义仍存争议。帖子折射出社区对 DeepSeek 持续超预期的惊讶和兴奋情绪。

🔗 https://reddit.com/r/LocalLLaMA/comments/1suolda/

3. AI swarms could hijack democracy without anyone noticing(r/artificial, score: 286)

引用 Science 期刊政策论坛文章:大规模 AI 生成虚拟人格可以逼真模仿人类行为,渗透数字社区、参与讨论、以极快速度影响舆论走向。与传统 bot 网络不同,这类 AI 群体可以实时协调、动态调整信息策略,并通过数百万次微实验找出最具说服力的论点。一个操作者理论上可管理数千个不同声音。论文作者和评论区专家普遍认为这是民主制度面临的全新系统性威胁,亟需监管框架跟进。

🔗 https://reddit.com/r/artificial/comments/1su3976/

4. There Will Be a Scientific Theory of Deep Learning(r/MachineLearning, score: 181)

14 位作者联合发表的雄心勃勃的 arXiv 论文,主张深度学习正在形成系统性科学理论,整理了 5 条证据线:可解析的玩具设置、有洞察力的极限分析、简单的经验规律、超参数理论、以及普遍现象。论文类比物理学发展路径,认为正在涌现的深度学习理论将帮助我们真正理解这些庞大学习系统为何有效。这是近年来深度学习理论领域罕见的系统综述,对研究界具有重要指引意义。

🔗 https://arxiv.org/abs/2604.21691

5. Qwen3.6-27B at ~80 tps with 218k context on 1x RTX 5090(r/LocalLLaMA, score: 64)

实测报告:单张 RTX 5090 通过 vllm 0.19 服务 Qwen3.6-27B,实现约 80 tokens/秒推理速度 + 218k 超长上下文窗口。这一配置对个人和小团队极具参考价值——RTX 5090 约 $2000,可实现接近企业级的本地推理性能。评论区有人补充 MoE 架构(35B A3B)在同硬件上的量化表现,以及 vllm 0.19 关键优化点。整体显示 2026 年消费级硬件的 AI 推理能力已达到新台阶。 *本期共 21 条,涵盖 Twitter/X 6 条 · GitHub 5 条 · YouTube 5 条 · Reddit 5 条* *存档时间:2026-04-25 21:00 (Asia/Shanghai)*

🔗 https://reddit.com/r/LocalLLaMA/comments/1sv8eua/