CosyVoice
CosyVoice
GitHub: https://github.com/FunAudioLLM/CosyVoice
⭐ 星星數: 19515
摘要: 這是一個多語言大型語音生成模型,提供完整的推理、訓練和部署能力。
技術堆疊: PyTorch, ONNX Runtime, DeepSpeed, Diffusers, FastAPI, Gradio, ModelScope, TensorRT
架構: 專案採用模組化設計,包含語音生成流程、LLM整合、HiFiGAN聲碼器、資料集處理等核心模組,並提供CLI工具和Web介面(Gradio/FastAPI)進行推理部署。