OCRmyPDF - スキャンされたPDFファイルにOCRテキストレイヤーを追加
(github.com)<p>- 通常のPDFから検索可能なPDF/Aファイルを生成<br />
- OCRした文字列を画像の下に挿入してコピー&ペーストをサポート <br />
- 既存の埋め込み画像の解像度はそのまま維持<br />
- ファイルを損なうことなくOCR情報を挿入 <br />
- PDF画像は最適化してファイルサイズを削減 <br />
- すべてのCPUコアを活用して分散処理 <br />
- Tesseract OCRを利用して100以上の言語をそのままサポート(韓国語を含む)<br />
- 数千ページ規模のファイルでも適切にスケールして処理 <br />
- 数百万件のファイルでテスト済み <br />
- Linux/macOS/Windows(WSL)</p>
2件のコメント