MOSS-TTS

Feb 13 2026

GitHub: https://github.com/OpenMOSS/MOSS-TTS

⭐ 星星數： 250

摘要： 這是一個開源的高保真語音和聲音生成模型家族，專為高表現力和複雜現實場景設計，支援長篇語音、多說話者對話、角色聲音設計和實時串流語音合成。

技術堆疊： PyTorch, Transformers, TorchAudio, Gradio, Librosa, Safetensors, Flash-Attn

架構： 專案採用模組化架構，包含本地推理(moss_tts_local)、實時串流(moss_tts_realtime)和延遲處理(moss_tts_delay)等獨立模組，並提供CLI工具和文檔支援，顯示其專注於不同部署場景的靈活性。