F5-TTS

F5-TTS

GitHub: https://github.com/SWivid/F5-TTS

⭐ 星星數: 13963

摘要: 這是一個基於流匹配技術的文本轉語音模型,能夠生成流暢且忠實於文本的語音合成系統。

技術堆疊: PyTorch, Gradio, Hydra, Accelerate, bitsandbytes, TorchAudio, TorchDiffEq

架構: 專案採用模組化設計,包含模型、推理、評估和運行時等核心模組,支援Triton推理伺服器部署,並提供中英文混合語音合成功能。