llama-cpp-python

llama-cpp-python

GitHub: https://github.com/abetlen/llama-cpp-python

⭐ 星星數: 9910

摘要: 提供Python綁定介面,讓開發者能夠在Python環境中直接使用llama.cpp的LLM推理功能。

技術堆疊: Python, llama.cpp, FastAPI, Uvicorn, NumPy, Jinja2, Pydantic

架構: 核心是C++/Python綁定層,提供低階和高階API,並包含可選的FastAPI伺服器模組,支援多種部署方式(Docker、筆記本、Gradio等)。