PDF2JSON - PDFをJSONとして抽出するツール (github.com) 6 ポイント 投稿者 xguru 2020-03-04 | 1件のコメント | WhatsAppで共有 XPDFベースの、Cコードで書かれた高速変換オープンソースライブラリ Windows / Mac / Linux向けの実行ファイルを提供 フォントを含めて、PDF内部のテキストを x,y 座標で抽出 関連記事 Documind - PDF文書を構造化データに変換するオープンソースAIツール 26 ポイント · 5件のコメント · 2024-11-21 JSONの可視化・編集ツール 46 ポイント · 15件のコメント · 2025-08-19 Markdown → PDF変換、どのツールを使っていますか? 2 ポイント · 4件のコメント · 2022-12-01 jc - CLIツールの出力をJSON化するツール 11 ポイント · 0件のコメント · 2022-11-05 「PDFをテキストに変換する」のは難しい問題 4 ポイント · 1件のコメント · 2025-05-15 1件のコメント xguru 2020-03-04 既存の pdf.js を利用した JavaScript 版の pdf2json もありますが、こちらは XPDF を使います。 https://github.com/mozilla/pdf.js/ https://github.com/modesty/pdf2json 一般的な PDF 機能は Apache PDFBox を使えばよいです。 https://pdfbox.apache.org/ PDFBox は Java ライブラリで、PDF の生成、抽出、分割・結合、画像への変換などがすべて可能です。
1件のコメント
既存の pdf.js を利用した JavaScript 版の pdf2json もありますが、こちらは XPDF を使います。
https://github.com/mozilla/pdf.js/
https://github.com/modesty/pdf2json
一般的な PDF 機能は Apache PDFBox を使えばよいです。
https://pdfbox.apache.org/
PDFBox は Java ライブラリで、PDF の生成、抽出、分割・結合、画像への変換などがすべて可能です。