pdfplumber
pdfplumber
GitHub: https://github.com/jsvine/pdfplumber
⭐ 星星數: 9544
摘要: 這是一個Python工具庫,用於深入解析PDF文件,提取每個字符、矩形、線條等詳細資訊,並能輕鬆提取文字和表格內容。
技術堆疊: pdfminer.six, Pillow, pypdfium2, Python
架構: 專案採用模組化設計,核心功能位於pdfplumber目錄,包含utils工具模組。提供豐富的範例和測試檔案,支援Jupyter筆記本展示。依賴多個PDF解析庫實現不同層級的PDF內容提取功能。