chandra

chandra

GitHub: https://github.com/datalab-to/chandra

⭐ 星星數: 4507

摘要: 這是一個OCR模型,專門處理複雜表格、表單、手寫文字和完整版面佈局,並將文件轉換為Markdown、HTML或JSON格式。

技術堆疊: PyTorch, Transformers, Flask, Streamlit, OpenAI, Qwen-VL, Pillow, Pydantic

架構: 專案採用模組化設計,包含核心模型層、腳本層和Web介面。依賴PyTorch和Transformers進行深度學習推理,使用Flask和Streamlit提供Web服務,並支援命令行介面。檔案結構顯示了完整的測試和範例資料組織。