sam-audio

Jan 19 2026

GitHub: https://github.com/facebookresearch/sam-audio

⭐ 星星數： 3116

摘要： 這是Meta開發的Segment Anything Audio模型，用於音訊分割和語音處理的AI模型推理框架。

技術堆疊： PyTorch, Transformers, ImageBind, CLAP, DACVAE, TorchAudio, NumPy

架構： 專案採用模組化設計，包含核心模型、評估指標和範例應用。依賴多個Meta研究專案（ImageBind、DACVAE）和音訊處理庫，顯示其專注於音訊分割任務的深度學習架構。