4 ポイント 投稿者 GN⁺ 2026-02-23 | 1件のコメント | WhatsAppで共有
  • 1990年から2025年までのCIAワールド・ファクトブックのデータを構造化し、検索・分析できるオープンソース情報アーカイブ
  • 281の国・地域、36年版、100万件を超えるデータフィールドを収録
  • 年度別の国別プロフィール時系列データ全文検索地理・通信・貿易ネットワーク分析機能を提供
  • COCOM地域ベースのダッシュボード国家間の指標比較グローバルトレンドの可視化などの分析ツールを含む
  • パブリックドメイン資料に基づいており、CIAや米国政府とは無関係な独立プロジェクト

概要

  • 36年分の地政学情報を保存し、構造化したデータアーカイブ
    • 原典のCIAワールド・ファクトブックからパースした資料に基づく
    • 281エンティティ、36版、9,500件の国・年次レコード、1,061,341件のデータフィールドを収録
  • すべてのデータは検索可能で、年度ごとの国別レポートの変化を追跡できる

プラットフォーム構成

  • Factbook Archive / Reference Library
    • 1990〜2025年のすべての版を閲覧可能
    • 元のフィールドデータをそのまま表示し、年ごとの変化を検索可能
  • Intelligence Analysis / Analytic Workspace
    • **DoD戦闘軍(COCOM)**地域別に構成された分析ワークスペース
    • コロプレスマップ(Choropleth)時系列比較国別分析書(ICD 203形式)指標間比較機能を提供

主な機能

  • Library: すべてのエンティティを種類別に分類し、国旗も表示
  • Country Profile: 各国の全フィールドデータを閲覧
  • Full-Text Search: 100万件超のフィールドを対象にZ39.58構文でキーワード検索
  • Field Time Series: 特定データフィールドの36年間の推移を追跡
  • Factbook Quiz: 4つのモードの世界知識クイズを提供
  • Factbook Export: すべてのフィールドを含む印刷用の国別レポートを生成

インテリジェンス分析ツール

  • Regional Dashboard: COCOM地域と首都表示を含む世界地図
  • Timeline Map: 36年分のデータをアニメーション形式で可視化
  • Communications Analysis: インターネット・モバイル・ブロードバンド普及率指標を表示
  • Map Compare: 2つの年の地図を同期して比較
  • COCOM Region Detail: 地域別の主要指標(KPI)を表示
  • Intelligence Dossier: ICD 203基準の国別分析書
  • Global Rankings: 指標別の国別ランキングを並べ替え
  • Global Trends: 全版にまたがる世界的な指標トレンド
  • Compare Countries: 国家間の指標比較
  • Field Explorer: すべてのデータフィールドとカバレッジ統計を探索
  • Change Detection: 年度別のフィールド変化を検出
  • Dissolved States: すでに存在しない国・地域の情報
  • Trade Networks: 貿易関係ネットワークグラフ
  • Organization Networks: 国際機関の加盟関係グラフ
  • Query Builder: カスタム分析クエリを作成
  • Text Diff: 年度別テキスト比較と変更点のハイライト

プロジェクト情報

  • すべてのデータは**米国政府のパブリックドメイン資料(CIA World Factbook)**から収集
  • CIAや米国政府とは無関係
  • 分析はICD 203分析標準に準拠
  • GitHubリポジトリを通じてソースと方法論を公開

1件のコメント

 
GN⁺ 2026-02-23
Hacker News のコメント
  • 現政権が CIA World Factbook の内部データをすべて削除し、将来の復元の試みを阻止しようとしたように思える
    次の政権がこの アーカイブされたデータ を活用して再構築するなら、本当に素晴らしいと思う
  • こういうのこそ Show HN が機能すべき姿だ
    誰かがプロジェクトを投稿すると、コミュニティがリアルタイムでバグを見つけ、作者がすぐに修正する
    FIPS と ISO の国コード衝突問題は、こうした 珍しいバグ は多くの目でしか見つけられないという良い例だ
    作者が防御的にならず、フィードバックに積極的に対応した点が印象的だった
  • Factbook の JSON や Markdown ファイルが必要な人向けに GitHub リポジトリ がある
    「CIA.gov の元の形式(1:1)による国別プロファイル・データセットのキャッシュ」と説明されている
    詳細データは cache.factbook.json で確認できる
    • リンクありがとう! 私の GitHub とウェブサイトでもこのソースを使っている
      ただ、1990〜2025年のデータを SQL データベース にしてクエリ可能にする必要があると考えていた
  • 作者へ: データベースのフィールドやバグ(例: 国コード)を修正中なら、そのバージョンも共有してもらえるとありがたい
    このデータセットは GraphRAG 機能テスト に非常に適している
    実データに基づく世界シミュレーションゲームも作れそうだ
    • もちろん可能! すべてのデータ修正履歴は .txt の 変更ログ で管理している
      CIA が公開した元の内容はそのまま維持し、パース過程ではフォーマット上のノイズだけを整理している
      さらに FIPS 10-4 コードと ISO Alpha-2/3、および MasterCountryID を対応付けるルックアップテーブルを作成し、相互に関連付けられるようにした
      これらの資料も GitHub に追加する予定だ
  • 素晴らしいプロジェクトだ。だが一つ問題を見つけた
    2002年版 Factbook で「Germany」の項目をクリックすると、毎回「Gambia」のページに移動してしまう
    他の国ではこの現象を見ていない
    • 別の例として、「Nicaragua」を検索すると「Niger」のページにつながる
  • 2025–2026 版はすでに外部で購入・閲覧可能で、2026–2027版 は 4月7日発売予定だ
    Amazon リンク
    • こういう本が実際に出版されているとは知らなかった。教えてくれてありがとう
    • Internet Archive が 2025–2026 版を所蔵しており、スキャン後に OpenLibrary に追加される予定だ
    • 発売されたら私のプロジェクトにも追加する予定だ。情報共有ありがとう
  • このリンクは本当に驚きだ: 変更履歴分析ページ
  • 素晴らしいプロジェクトだ。だが 世界人口が二重に集計 されているようだ
    トレンド分析ページ で確認できる
    • 原因を見つけた。「World」エンティティ(約80億人)が個別の国々と一緒に合算されており、総計が二重になっていた
      報告ありがとう!
    • すぐに修正中だ。長く見すぎていてこういう点を見落としていたようだ。知らせてくれてありがとう
  • このプロジェクトは、現在の ホワイトハウス政権 によって終了されたサービスを保存したアーカイブなのか?
    • そう、そのとおりのサービスだ
  • 時系列チャートにバグがある。データを可視化する前に 正規化(normalization) が必要だ
    例: インドの固定ブロードバンド契約データ
    • 問題を見つけた。合計値をパースする 正規表現(regex) が単位の接尾辞(million/billion など)を処理できていなかった
      たとえば「18.17 million」が 18.17 としか認識されず、グラフが急落する誤りがあった
      単位処理を追加してバグを修正し、たった今デプロイを完了した
      報告してくれてありがとう