pdfplumber

pdfplumber

GitHub: https://github.com/jsvine/pdfplumber

⭐ 星星數: 9544

摘要: 這是一個Python工具庫,用於深入解析PDF文件,提取每個字符、矩形、線條等詳細資訊,並能輕鬆提取文字和表格內容。

技術堆疊: pdfminer.six, Pillow, pypdfium2, Python

架構: 專案採用模組化設計,核心功能位於pdfplumber目錄,包含utils工具模組。提供豐富的範例和測試檔案,支援Jupyter筆記本展示。依賴多個PDF解析庫實現不同層級的PDF內容提取功能。