Wayback Machine ダウンローダー
(github.com)-
Webサイトの全体/一部を Internet Archive Wayback Machine がアーカイブした資料からダウンロードできるオープンソース
-
サイトの最新ファイル/全日付ごとのファイル/特定の日付(from ~ to)のファイルをディレクトリ構造のままダウンロード
-
index.htmlページを Apache/Nginx で利用できるよう自動生成 -
Wayback Machine が改変した版ではなくオリジナル版をダウンロード
-
--listオプションでダウンロードせず URL のみを JSON として保存可能 -
Ruby オープンソース
4件のコメント
ローカルのWayback Machineサービスを作りたいのですが……今やっているプロジェクトを整理してから進めないといけないので =m =……残念です。
Wayback Machineは画像が壊れるし / UIもいまひとつで(... ) / かといってPocketはページ保存ではなく原文保存で、しかも保存できない場所もあるので。オープンソースでページをクロップしたあと、ユーザーのローカルマシンやリモート先に保存し、これまで保存したページをPocketのようにきれいに一覧表示して、クリックするとアーカイブしたページへ移動する、そんなプロジェクトをやってみたいですね。
画像は保存時に Save outlinks オプションにチェックを入れないと、うまくいかない場合もあるようです。
しばらく待ってみます..(笑)
私も待ちます。
それと……React で作られたサイトもきちんと保存していただけると……ほほほ
待ってますね、ふふふ