DeepSeek-OCR

DeepSeek-OCR

GitHub: https://github.com/deepseek-ai/DeepSeek-OCR

⭐ 星星數: 22080

摘要: 這是一個基於深度學習的光學字元辨識系統,專門用於文件圖像的文字識別與壓縮處理。

技術堆疊: transformers, PyMuPDF, Pillow, numpy, tokenizers, img2pdf

架構: 專案採用模組化設計,包含Hugging Face和vLLM兩種推理框架版本,vLLM版本進一步分為深度編碼器和處理模組,顯示支援高效能推理和文件處理流程。