9 ポイント 投稿者 xguru 2021-07-13 | 4件のコメント | WhatsAppで共有
  • Webサイトの全体/一部を Internet Archive Wayback Machine がアーカイブした資料からダウンロードできるオープンソース

  • サイトの最新ファイル/全日付ごとのファイル/特定の日付(from ~ to)のファイルをディレクトリ構造のままダウンロード

  • index.html ページを Apache/Nginx で利用できるよう自動生成

  • Wayback Machine が改変した版ではなくオリジナル版をダウンロード

  • --list オプションでダウンロードせず URL のみを JSON として保存可能

  • Ruby オープンソース

4件のコメント

 
ffdd270 2021-07-13

ローカルのWayback Machineサービスを作りたいのですが……今やっているプロジェクトを整理してから進めないといけないので =m =……残念です。

Wayback Machineは画像が壊れるし / UIもいまひとつで(... ) / かといってPocketはページ保存ではなく原文保存で、しかも保存できない場所もあるので。オープンソースでページをクロップしたあと、ユーザーのローカルマシンやリモート先に保存し、これまで保存したページをPocketのようにきれいに一覧表示して、クリックするとアーカイブしたページへ移動する、そんなプロジェクトをやってみたいですね。

 
lineaa 2021-07-14

画像は保存時に Save outlinks オプションにチェックを入れないと、うまくいかない場合もあるようです。

しばらく待ってみます..(笑)

 
xguru 2021-07-14

私も待ちます。

それと……React で作られたサイトもきちんと保存していただけると……ほほほ

 
galadbran 2021-07-13

待ってますね、ふふふ