LongCat-Video
LongCat-Video
GitHub: https://github.com/meituan-longcat/LongCat-Video
⭐ 星星數: 1929
摘要: 這是一個基於深度學習的影片生成AI模型,專注於生成長貓相關的影片內容,整合了音訊處理、注意力機制和並行計算等技術。
技術堆疊: PyTorch, Transformers, Diffusers, Flash-Attn, Streamlit, OpenCV, FFmpeg
架構: 專案採用模組化設計,包含音訊處理、稀疏注意力、上下文並行等核心模組,並提供Web介面展示功能。依賴關係顯示這是一個結合擴散模型和Transformer架構的影片生成系統。