MOSS-TTS
MOSS-TTS
GitHub: https://github.com/OpenMOSS/MOSS-TTS
⭐ 星星數: 250
摘要: 這是一個開源的高保真語音和聲音生成模型家族,專為高表現力和複雜現實場景設計,支援長篇語音、多說話者對話、角色聲音設計和實時串流語音合成。
技術堆疊: PyTorch, Transformers, TorchAudio, Gradio, Librosa, Safetensors, Flash-Attn
架構: 專案採用模組化架構,包含本地推理(moss_tts_local)、實時串流(moss_tts_realtime)和延遲處理(moss_tts_delay)等獨立模組,並提供CLI工具和文檔支援,顯示其專注於不同部署場景的靈活性。