sam-audio

sam-audio

GitHub: https://github.com/facebookresearch/sam-audio

⭐ 星星數: 3116

摘要: 這是Meta開發的Segment Anything Audio模型,用於音訊分割和語音處理的AI模型推理框架。

技術堆疊: PyTorch, Transformers, ImageBind, CLAP, DACVAE, TorchAudio, NumPy

架構: 專案採用模組化設計,包含核心模型、評估指標和範例應用。依賴多個Meta研究專案(ImageBind、DACVAE)和音訊處理庫,顯示其專注於音訊分割任務的深度學習架構。