Qwen3-ASR

Jan 19 2026

GitHub: https://github.com/QwenLM/Qwen3-ASR

⭐ 星星數： 852

摘要： 這是一個由阿里巴巴Qwen團隊開發的開源自動語音辨識模型系列，支援多語言語音/音樂/歌曲識別、語言檢測和時間戳預測。

技術堆疊： transformers, accelerate, gradio, flask, vllm, librosa, soundfile

架構： 專案採用模組化設計，核心分為轉換器後端和vLLM後端，包含推理、CLI和微調模組，支援多種部署方式（Gradio網頁介面、Flask API、Docker容器）。