BreezyVoice

BreezyVoice

GitHub: https://github.com/mtkresearch/BreezyVoice

⭐ 星星數: 277

摘要: 這是一個基於深度學習的語音合成系統,整合了多種語音處理模型和工具,能夠實現高品質的語音生成和轉換功能。

技術堆疊: PyTorch, Gradio, FastAPI, Diffusers, Deepspeed, Whisper, HuggingFace Datasets, ONNX Runtime

架構: 專案採用模組化設計,包含語音合成流程(flow)、語音模型(hifigan)、語言模型(llm)、資料處理(dataset)和工具(utils)等核心模組,支援GPU加速和分散式訓練,並提供Web介面和命令行工具。