ArchiveTeam、すべての goo.gl 短縮リンクのアーカイブ作業を完了
(tracker.archiveteam.org)- ArchiveTeam は、すべての goo.gl 短縮リンク のアーカイブを無事完了
- ArchiveTeam Warrior という仮想アーカイブプログラムを通じて、誰でもアーカイブプロジェクトに参加可能
- この Warrior は Windows、OS X、Linux 環境で 特別なリスクなく実行 できる
- ユーザーは 簡単な設定で プロジェクトを選択し、活動に参加できる
- 特別な技術がなくてもアーカイブ活動に役立てる 簡単で直感的な方法 を提供
ArchiveTeam Warrior の紹介
- ArchiveTeam Warrior は、誰でも手軽に使える 仮想アーカイブアプライアンス
- ユーザーは Warrior を実行して ウェブサイトなどをダウンロード し、それを ArchiveTeam のアーカイブへアップロードする作業に参加できる
- Warrior は実際のコンピューター環境に危険を与えず、インターネット帯域幅と少量のディスク容量だけを利用 する
- Windows、OS X、Linux 環境をすべてサポートし、VirtualBox、VMware などの仮想マシンプログラムが必要
VirtualBox を使った利用方法
- Warrior アプライアンス(357MB)をダウンロード
- VirtualBox で File > Import Appliance メニューをクリックし、ダウンロードしたファイルを読み込む
- 仮想マシンを起動すると、最新アップデートを自動で受け取り、ウェブブラウザーの利用を求められる
Warrior 実行後の流れ
- Settings ページにアクセスして確認
- ユーザー名を選択し、leaderboard に進捗を表示
- All projects タブで希望するプロジェクトを選んで参加し、最も緊急なプロジェクトに参加する ArchiveTeam’s Choice も選択可能
参加の利点
- 特別な技術や複雑な手順なしに、誰でも簡単にアーカイブプロジェクト活動へ貢献できる
- ユーザーの アーカイブ活動実績 はリーダーボードに表示され、モチベーション向上や協業の効果がある
1件のコメント
Hacker Newsの意見
ArchiveTeamがこういうプロジェクトをやるたびに本当に驚かされる。数年前、以前勤めていた動画プラットフォームがまもなくサービス終了を発表したとき、ArchiveTeamのあるメンバーとつながる機会があり、データ保存の作業に関心を持っていると聞いた。その人に少し助言しつつ(アーカイブ時に問題になりそうなサーバーエンドポイントの情報など)、自分のEC2インスタンスをいくつか一時的に貸した。サーバーは自分の所有だったので何が起きているか見られたのだが、2分もしないうちにインスタンスは完全に準備され、すぐに動画のアーカイブを始め、各インスタンスは重複なしでそれぞれ別の動画を効率よくダウンロードしていた。ArchiveTeamは理念が素晴らしいだけでなく、その実行方法の効率性が本当に印象的だ
タイトルが正確ではない。実際には Archiveteam.org であって、Archive.org ではない。The Internet Archive は保存領域を提供しているが、実際のアーカイブ作業は Archiveteam のメンバーが行っている
関連情報を共有したい。「リンク切れとの戦いに参加する」(リンク)、Google の goo.gl ポリシー変更に関する複数の HN 議論スレッド(2018年~2025年の関連記事まとめ, こちら, こちら, こちら, こちら, こちら, こちら)。さまざまな議論があるので参考になればと思う
Google の最新アップデートを共有する Google ブログ更新リンク
reddit や twitter 全体をアーカイブしている人はいるのだろうか? たとえ彼らの Terms が変わってそれを許可しなくなったとしても、気になる
ページがよく分からない。データセットの一覧(たぶん?)が載っているが、91 TiB まであって容量が大きく見える。Google の短縮リンクと対象 URL の一覧だけで 91 TiB も必要になるとは思えない。仕組みを知っている人はいる?
今回のアーカイブに少しでも貢献できてうれしい
どれだけ多くのリンクが非公開の YouTube 動画や Google ドキュメントなどに向いているのか気になる
「all」というのが、実際に公開されているすべての URL を指すのか、それとも URL ネームスペース全体を総当たりで試したのか気になる