DeepSeek-OCR-2

DeepSeek-OCR-2

GitHub: https://github.com/deepseek-ai/DeepSeek-OCR-2

⭐ 星星數: 1524

摘要: 這是一個基於深度學習的光學字元辨識系統,專門用於從圖像中提取和辨識文字內容。

技術堆疊: transformers, PyMuPDF, Pillow, numpy, einops, tokenizers

架構: 專案採用模組化設計,包含Hugging Face和vLLM兩種推理框架版本,並有專門的圖像處理和深度編碼器模組,顯示其專注於高效能的OCR模型部署。