ComfyUI-QwenASR

ComfyUI-QwenASR

GitHub: https://github.com/1038lab/ComfyUI-QwenASR

⭐ 星星數: 25

摘要: 這是一個為ComfyUI設計的輕量級自定義節點套件,使用Qwen3-ASR模型提供語音轉文字功能,支援本地模型快取和時間戳輸出。

技術堆疊: PyTorch, Transformers, HuggingFace Hub, ModelScope, Accelerate, TorchAudio, NumPy

架構: 專案採用模組化設計,核心包含transformers和vllm兩種推理後端,獨立inference模組處理語音識別邏輯,web層提供前端介面,符合ComfyUI自定義節點的標準架構模式。