Anna's Archive: チームからの最新アップデート
(annas-archive.org)- 最近、ミッションに対する攻撃が増加しているため、インフラおよび運用セキュリティの強化を進めている
- 2022年の開始以来、数千万件の書籍、論文、雑誌、新聞などの資料を安全に保存し共有している
- 大規模スクレイピングにより、WorldCat、Google Books などから膨大なメタデータを確保し、未収集資料の把握に活用している
- LibGen、Z-Library などとのパートナーシップを通じて数千万件の追加資料を確保したが、一部パートナーが消えたことは残念でもある
- WeLib などの新興サイトとは慎重な関係を維持しており、コミュニティへの貢献が不十分であることを理由に利用自粛を推奨している
最近の状況とチームの対応
- 最近、Anna's Archive のミッションを狙った攻撃が増えている
- そのため、インフラと運用セキュリティの強化措置を進めている
- 人類の知的遺産を安全に保存することは、今後も追求する価値のある活動である
資料の解放と保存活動
- 2022年の開始以来、数千万冊の書籍、科学論文、雑誌、新聞など多様なコンテンツを確保してきた
- これらの資料は、自然災害、戦争、予算削減などさまざまな脅威から保護された状態にある
- トレントで資料配布に参加してくれたすべての人々の尽力により、資料消失への懸念は大きく減った
大規模スクレイピングとメタデータの確保
- Anna's Archive は IA Controlled Digital Lending、HathiTrust、DuXiu などで大規模スクレイピングを組織的に進めている
- tens of millions に及ぶ資料ファイルの確保に成功した
- WorldCat、Google Books などから 膨大な書籍メタデータコレクション を構築した
- 確保したメタデータにより、コレクションにまだ含まれていない書籍を特定し、希少資料を優先的に確保する戦略に活用している
コミュニティと協力、新たな展開
- LibGen フォーク、STC/Nexus、Z-Library などの協力パートナーと連携し、数千万件の追加ファイルを確保した
- パートナーたちはファイルをミラーするなど、ミッションに大きく貢献している
- しかし、LibGen フォークの一つが消えたことは残念な出来事として受け止めている
新規プロジェクトと注意事項
- 最近では、WeLib という新しいプロジェクトが登場した
- アーカイブコレクションの大部分をミラーしており、Anna’s Archive のコードベースのフォークを使用している
- WeLib のユーザーインターフェース改善点の一部を取り入れて反映した
- しかし、新しいコレクションの共有やコードベース改善の共有がなく、エコシステムへの貢献に対する約束が不足している
- そのため、WeLib の利用には注意を推奨する
- さらに、内部では 数百テラバイト規模の新規コレクション がサーバー上で準備され、処理待ちとなっている
ボランティアと支援のお願い
-
誰でも ボランティアおよび寄付ページ を通じてプロジェクトに参加できる
-
いずれも小規模な予算で運営されており、わずかな支援でも大きな価値 がある
-
今後も知的遺産の保護と解放のための 継続的な努力を呼びかけている
-
Anna およびチーム一同(Reddit コミュニティ参照)
まだコメントはありません。