mpa-archive - Webサイトをzipにして、zipファイルから直接配信するツール
(github.com/potahtml)- マルチページWebアプリをZipファイルにクロールし、そのまま配信可能なMulti-Page Application(MPA) Archiver
mpa http://example.netを実行すると、ヘッドレスPuppeteerを使って再帰的にクロール(CPU数 / 2 本のスレッドを使用)- Sitemapを取得してシードポイントとして使用
- サイトのURLのみをクロールするが、外部リソースも
fetchする - サイトのリソースをすべて保存
mpa/sitemap.txtとmpa/sitemap.xmlを生成- 中断された場合は再開可能。URL 250件ごとにチェックポイントを保存
- SPAの場合、
--spaオプションで元のHTMLを保存可能
まだコメントはありません。