F5-TTS
F5-TTS
GitHub: https://github.com/SWivid/F5-TTS
⭐ 星星數: 13963
摘要: 這是一個基於流匹配技術的文本轉語音模型,能夠生成流暢且忠實於文本的語音合成系統。
技術堆疊: PyTorch, Gradio, Hydra, Accelerate, bitsandbytes, TorchAudio, TorchDiffEq
架構: 專案採用模組化設計,包含模型、推理、評估和運行時等核心模組,支援Triton推理伺服器部署,並提供中英文混合語音合成功能。