ComfyUI-VoxCPM
ComfyUI-VoxCPM
GitHub: https://github.com/wildminder/ComfyUI-VoxCPM
⭐ 星星數: 367
摘要: 這是一個ComfyUI節點插件,用於實現高度表達性的語音合成和真實的零樣本語音克隆功能。
技術堆疊: PyTorch, Transformers, Diffusers, Hugging Face Hub, bitsandbytes, safetensors
架構: 專案採用模組化設計,核心模型位於src/voxcpm目錄下,包含多個子模組如audiovae、locdit、locenc等,顯示其語音合成管線的分層架構。依賴關係表明這是一個基於擴散模型和變分自編碼器的TTS系統。