1. NVIDIA 开源 PersonaPlex 7B:真正实时全双工语音 AI
NVIDIA 开源了 PersonaPlex 7B,这是一款能实现真正实时全双工对话的语音 AI 模型,彻底解决了传统语音 AI"轮流说话"的生硬问题。它支持随时打断、自然插话、重叠对话,和真人交流的自然度几乎没有区别。最关键的技术突破是:它把 ASR(语音识别)、LLM 推理、TTS(语音合成)三个模块全部融合进一个 7B 参数模型中,实现了极低延迟。这对语音 AI 助手、电话客服、实时翻译等应用场景具有颠覆性意义。开源意味着开发者可以本地部署,不再依赖云端 API,大幅降低了隐私风险和使用成本。该推文获得了超过 14 万次浏览、1758 个点赞,社区反应极为热烈。
🔗 https://twitter.com/i/web/status/2040512739739881714