DeepSeek-OCR

Jan 19 2026

GitHub: https://github.com/deepseek-ai/DeepSeek-OCR

⭐ 星星數： 22080

摘要： 這是一個基於深度學習的光學字元辨識系統，專門用於文件圖像的文字識別與壓縮處理。

技術堆疊： transformers, PyMuPDF, Pillow, numpy, tokenizers, img2pdf

架構： 專案採用模組化設計，包含Hugging Face和vLLM兩種推理框架版本，vLLM版本進一步分為深度編碼器和處理模組，顯示支援高效能推理和文件處理流程。