tts

tts

GitHub: https://github.com/inworld-ai/tts

⭐ 星星數: 624

摘要: 這是一個基於凍結音頻編解碼器和大型語言模型的神經文本轉語音系統,專注於高品質語音合成。

技術堆疊: PyTorch, Transformers, DeepSpeed, Lightning, PEFT, TRL, Librosa, Silero-VAD, Faster-Whisper

架構: 專案採用模組化設計,包含核心編解碼器、數據處理、訓練(含RLHF)和推理模組,使用PyTorch Lightning進行訓練管理,並支援DeepSpeed優化和PEFT微調技術。