Data.govアーカイブを公開:米国連邦の公共データ16TB規模・30万件超のデータセットを収録
(lil.law.harvard.edu)- ハーバード・ロースクールのイノベーション研究所が、Source Cooperative上でData.govアーカイブを公開
- Source.coopは、組織や個人が標準的なHTTP方式を使ってデータを共有できるデータ公開ユーティリティ
- 2024〜2025年に収集された米国連邦の公共データセットで、16TB規模、311,000件以上のデータセットを収録
- Data.govに新しいデータセットが追加されるたびに、毎日更新される予定
- 学術研究、政策決定、公共利用のための重要な公共データセットを保存・認証するための「Data Vaultプロジェクト」の最初のリリース
- 政府記録の保存と公共情報へのアクセス性向上に向けた長年の取り組みの一環として構築
- 図書館の役割強化
- 政府記録の保存と公共情報へのアクセス性向上
- 詳細なメタデータの保存とデジタル署名の設定により、研究者や一般市民が必要な情報を容易に引用・参照できるようにする
- GitHubリポジトリ でオープンソースのツールとドキュメントを提供
- 類似のリポジトリを構築可能
- データ保存とアクセシビリティを誰でも拡張できるよう支援
- 関連プロジェクトと支援
- Perma.cc: 裁判所、法律ジャーナル、法律事務所で使われているWebアーカイブツール
- Caselaw Access Project: 米国の判例データ公開プロジェクト
- Century Scale Storage: 長期デジタル保存の研究
- Filecoin Foundation for the Decentralized Web、Rockefeller Brothers Fundの支援を受けて運営
1件のコメント
この話の背景には、現在のトランプ政権下で公共データから記録が削除されていることがあり、こうした動きやニュースが出てきたのだと思います。気候変動や公衆衛生に関する記録を削除しているそうです。世界全体が少しおかしくなってきているようです。
https://404media.co/archivists-work-to-identify-and-save-the-thousands…