VoxCPM
VoxCPM
GitHub: https://github.com/OpenBMB/VoxCPM
⭐ 星星數: 4275
摘要: 這是一個無需分詞器的文本轉語音系統,專注於上下文感知語音生成和逼真語音克隆的AI模型。
技術堆疊: PyTorch, torchaudio, transformers, einops, torchcodec
架構: 採用模組化設計,包含音頻變分自編碼器、位置編碼、MiniCPM4等核心模組,支援多版本配置,具有清晰的訓練和工具程式碼結構。
GitHub: https://github.com/OpenBMB/VoxCPM
⭐ 星星數: 4275
摘要: 這是一個無需分詞器的文本轉語音系統,專注於上下文感知語音生成和逼真語音克隆的AI模型。
技術堆疊: PyTorch, torchaudio, transformers, einops, torchcodec
架構: 採用模組化設計,包含音頻變分自編碼器、位置編碼、MiniCPM4等核心模組,支援多版本配置,具有清晰的訓練和工具程式碼結構。