LongCat-Video

LongCat-Video

GitHub: https://github.com/meituan-longcat/LongCat-Video

⭐ 星星數: 1929

摘要: 這是一個基於深度學習的影片生成AI模型,專注於生成長貓相關的影片內容,整合了音訊處理、注意力機制和並行計算等技術。

技術堆疊: PyTorch, Transformers, Diffusers, Flash-Attn, Streamlit, OpenCV, FFmpeg

架構: 專案採用模組化設計,包含音訊處理、稀疏注意力、上下文並行等核心模組,並提供Web介面展示功能。依賴關係顯示這是一個結合擴散模型和Transformer架構的影片生成系統。