Qwen3-ASR
Qwen3-ASR
GitHub: https://github.com/QwenLM/Qwen3-ASR
⭐ 星星數: 852
摘要: 這是一個由阿里巴巴Qwen團隊開發的開源自動語音辨識模型系列,支援多語言語音/音樂/歌曲識別、語言檢測和時間戳預測。
技術堆疊: transformers, accelerate, gradio, flask, vllm, librosa, soundfile
架構: 專案採用模組化設計,核心分為轉換器後端和vLLM後端,包含推理、CLI和微調模組,支援多種部署方式(Gradio網頁介面、Flask API、Docker容器)。