GLM-TTS

GLM-TTS

GitHub: https://github.com/zai-org/GLM-TTS

⭐ 星星數: 882

摘要: 這是一個基於多獎勵強化學習的可控制且能表達情感的零樣本文字轉語音系統,能夠生成具有情感表現力的語音。

技術堆疊: PyTorch, Transformers, DeepSpeed, Gradio, FastAPI, ONNX Runtime, WeTextProcessing, FunASR

架構: 專案採用模組化設計,包含語音合成核心(cosyvoice)、強化學習訓練(grpo)、前端介面(frontend)和配置管理(configs)。依賴顯示使用Transformer架構進行語音生成,並整合多種中文文本處理工具。