Step-3.5-Flash
Step-3.5-Flash
GitHub: https://github.com/stepfun-ai/Step-3.5-Flash
⭐ 星星數: 472
摘要: 這是一個基於llama.cpp的快速、高效能AI推理框架,專為智慧代理系統設計,提供可靠且低延遲的模型執行能力。
技術堆疊: C++, llama.cpp
架構: 專案採用llama.cpp作為核心推理引擎,檔案結構顯示完整的CI/CD工作流程和跨平台支援,包含CUDA、Vulkan、ROCm等硬體加速後端,專注於高效能模型部署和測試基準。