WenetSpeech-Yue

WenetSpeech-Yue

GitHub: https://github.com/ASLP-lab/WenetSpeech-Yue

⭐ 星星數: 256

摘要: 這是一個大規模粵語語音語料庫專案,提供多維度標註的語音數據集,用於訓練粵語語音處理模型。

技術堆疊: Python

架構: 專案採用模組化設計,包含語音處理流程(flow)、語音合成模型(hifigan)、語言模型(llm)、數據集處理(dataset)和詞彙處理(tokenizer)等核心模組,顯示完整的語音AI處理管線架構。