OSS Insight JP

ispras/dedoc

★ 648 Python Apache-2.0 スコア: 77.95 GitHub →

概要

Dedoc is a library (service) for automate documents parsing and bringing to a uniform format. It automatically extracts content, logical structure, tables, and meta information from textual electronic documents. (Parse document; Document content extraction; Logical structure extraction; PDF parser; Scanned document parser; DOCX parser; HTML parser

リポジトリ情報

スター数★ 648
フォーク数51
言語Python
ライセンスApache-2.0
作成日2020/12/7
最終更新2026/3/4
Issue数6

トピック

docdocument-analysisdocument-content-extractiondocumentsdocxdocx-parserexcelhtmlhtml-parserlogical-structure-extractionocrodtpdfpdf-parserscanned-documentstable-of-contentstable-recognitiontxt

関連サービス

このOSSの運用に役立つサービス