microsoft/VibeVoice ⭐ 28 (+2509)
微软开源前沿语音 AI ⭐ 28.6K(今日 +2509) 微软正式开源的前沿语音 AI 项目,今日新增 2509 stars,是 GitHub 全站最热项目。包含三个核心模型:VibeVoice-ASR-7B(语音识别,可一次性处理 60 分钟音频)、VibeVoice-TTS(高保真语音合成)和 VibeVoice-Dialog(多轮语音对话)。Python 实现,由微软研究团队维护。这是开源语音 AI 领域的一个里程碑式项目,直接挑战了 OpenAI 的 Whisper 和 ElevenLabs 的商业方案。适合需要构建语音交互应用的开发者。
🔗 https://github.com/microsoft/VibeVoice