Paper to HTML - 論文を読みやすいHTMLに変換
(papertohtml.org)<p>- 機械学習を利用して、PDF、LaTeX、PubMed Central XML の内容を読み取り、HTMLに変換 <br />
- アクセシビリティ向上が目的 <br />
- AIベースの研究資料検索エンジンである Semantic Scholar の実験的プロトタイプ <br />
- 現在は抽出された画像/コンテンツのみをキャッシュしており、同じ文書をアップロードした人にだけ高速にサービスする用途で使用されている。アップロードしたファイルは保存しない <br />
- 制限事項<br />
→ 表(Table)は画像として抽出される <br />
→ 数学(Math)コンテンツは精度が低いか、ほとんど抽出されない <br />
→ LaTeX/PubMed の処理は PDF より一部機能が不足している可能性がある <br />
- 今後、Semantic Scholar にアクセシビリティ機能を追加する計画がある </p>
3件のコメント