Documind - PDF文書を構造化データに変換するオープンソースAIツール
(github.com/DocumindHQ)- PDF変換、情報抽出、結果をユーザー指定のスキーマに従ってフォーマットする機能を提供
- PDFを画像に変換 することで、より詳細なAI処理を可能にする
- OpenAIのAPIを活用して情報を抽出し、構造化
- さまざまな文書形式に対する抽出スキーマをユーザーがカスタマイズ可能
- ローカルおよびクラウド環境の両方で柔軟にデプロイできるよう設計されている
- Zerox ベースで開発された
5件のコメント
とにかくオープンソースではあるものの、最近はAIにばかり突き進んでいて、軽量で無料で使えるツールがなかなか出てこないのが残念ですね…。
超先端のAIベースのソフトウェアが、40年前からあるGhostscriptに依存しているなんて……なんとも微妙ですね(笑)
文字をPDFに変えて、PDFを画像に変えて、画像を文字に変えるんですね。
社内サービスとして開発中のサービスですが…これがオープンソースとして公開されるんですね(笑)
もしかして会社は
ㅎㅋですか?