borb - PDFの読み取り・書き込み・編集向けPythonオープンソースライブラリ

(github.com)

6 ポイント投稿者 xguru 2021-09-19 | 1件のコメント | WhatsAppで共有

→ ネストされたリスト、dictionary、primitive など

→ Page、PageLayout を生成

→ Paragraph、Image、Shape、Barcode、Chart、Emoji、List、Table、Form などを生成

→ メタデータの抽出と変更

→ テキスト/画像の抽出

→ 画像の変更

→ Annotation（Note、Link など）の追加

→ テキスト/テーブル/リストの追加

→ ページレイアウトマネージャーを利用する

1件のコメント

v08zbv8fvlkjasdflkj 2021-09-23

数日前に投稿されていたサービスの中に、論文をHTMLに変換するものもありましたが、

肝は、multi-columnでのテキストを読む順序や、画像の範囲などですね。

こうしたサービスによって論文のserializationが成熟して、要約サービスもまもなく出てきそうです（笑）