機械学習でモンゴル中のユルト/ゲルの数を数えてみる
(monroeclinton.com)- 機械学習アルゴリズムを活用し、モンゴル全土の Yurt(ゲル) の数を実際に数えるプロジェクトを実施
- 単一の衛星画像をもとにユルトを識別できるよう YOLO モデルを訓練し、大規模データラベリングを自動化
- 分散サーバー、Docker Swarm、FastAPI などを用いて、120以上のワーカーが並列に画像タイルを処理し、結果を集計
- 最終的に 172,689個のユルト を発見し、この結果はモンゴルの都市成長と 住宅インフラ問題 を理解するのに貢献
- モンゴルの ゲル地区 とその社会的背景、発展上の課題についての洞察もあわせて提供
機械学習でモンゴルのユルトを数える ― プロジェクト概要
モンゴル現代社会への関心
- モンゴル帝国の歴史と現代モンゴルの姿を理解するため、データを分析する代わりに Google マップ の衛星表示を積極的に探索
- ウランバートルの衛星写真で 数キロメートルに及ぶ広大なユルトの集積 を確認し、このユルトが正確にいくつあるのか自分で数えてみることを決意
データとラベリングの準備
- Google Maps から、主にウランバートル近郊を中心としたタイル形式(256x256 px)の衛星画像を自動収集
- タイルを Label Studio に読み込み、ユルトを1つずつバウンディングボックスで手作業ラベリングし、この過程で 注釈データ(annotated data) を生成
- 物体検出アルゴリズムとして YOLO11(ultralytics) を採用し、annotated データセットをモデル学習に活用
モデル訓練とデータセット拡張
- YOLO11 ベースでモデルを学習させるだけでなく、ラベリング→再学習→ラベリングの反復的フィードバックループ 方式で自動化の度合いを高めた
- 当初はデータ不足で精度が低かったが、反復的な追加ラベリング とサンプル数の拡大により検出率を向上
- モデル訓練はノートPCではなく vast.ai の GPU リソースを借り、Docker コンテナ 環境で大規模に実施。訓練完了時には S3 ストレージにモデル結果とメタデータを自動アップロード
全国規模の探索システム構築
探索範囲の最適化
- モンゴル全土の面積を基準に、各ズームレベルごとのタイル数を算出
- 人口密度が低いため非居住地域を除外する目的で、overpass turbo により人が住んでいそうなポイントを抽出
- 抽出ポイント周辺(2km バッファ)を基準に、実際に検査するタイル集合を大幅に縮小
大規模分散処理
- Docker Swarm を活用し、8台のサーバー(合計 128 vCPU)でクラスターを構成
- API サーバー(FastAPI)とワーカーで役割分担:
- API: ワーカーに割り当てる検索領域とタイル集合を管理し、進行状況と状態を管理
- ワーカー: API から検索領域を受け取り、該当タイル内のユルトをモデルで検出して API に結果を登録
結果集計
- 全体で約 270,000 の検索領域と数百万枚の画像を並列処理
- 最終的に172,689個のユルト を、確率 40% 以上の検出結果を基準として確認
- データセットを 公開 し、土地利用、ホテル、小規模鉱山周辺のユルト分布などを分析
ユルトとモンゴルの社会的文脈
ゲル(ユルト)地域の歴史と変化
- ユルトは歴史的に モンゴル遊牧民 の伝統的住居形態だったが、都市化と産業化の過程でその用途は多方面に変化
- 20世紀初頭には臨時学校など公共目的にもユルトが活用され、大都市への人口流入とともにウランバートルなどで ゲル地区 が形成された
「1979年の国勢調査では総人口の51%が都市居住であり、1970年代の急速な都市化を反映している。住宅およびインフラ不足により都市周縁部でゲル地区が拡大した。」
都市化とインフラの課題
- 農村から流入した人口がユルトを持って都市へ移住し、正式なインフラが整っていない状態で住居として使用
- 2002年の 土地所有権関連法 導入により、ゲル地区住民の居住地の法的な正式化が進行
- 政府は ウランバートル2020マスタープラン など再開発政策を推進しているが、実際の進行速度は遅い
「ゲル地区の土地所有者が建設業者に土地を売却または交換して新しいアパート建設が行われるが、アパートの価値がしばしば土地より低い、あるいは開発速度が遅い。」
示唆と今後の展望
- ゲル地区の正式化とインフラ提供が依然として社会的・政策的課題であることを示唆
- モンゴル政府の長期目標は、ゲル地区に 住宅、上水道、電力などの都市インフラを普及 させること
- データに基づく政策立案と継続的な追跡が必要
追加で探究したい問い
- モンゴルおよび他国で都市化・産業化が起こる主な要因
- モンゴル人のうち都市に定住する人と残る人の違い
- ゲル地区開発における政府側の難しさ
- 国ごとの開発速度の違いを生む背景
参考文献
- 主要な政策・社会学・インフラ関連の論文、報告書、データベースを参照
- “Distributional Effects of Ger Area Redevelopment in Ulaanbaatar, Mongolia.”
- Ulaanbaatar 2020 Master Plan and Development Approach for 2030.
- “Educational Import: Local Encounters with Global Forces in Mongolia.”
- Mongolia: A Country Study. Federal Research Division, Library of Congress.
- Poverty Mapping in Mongolia with AI-Based Ger Detection Reveals Urban Slums Persist after the COVID-19 Pandemic. arXiv.
まとめ
- 技術とデータで社会問題を見つめ、社会的背景と居住パターン に対する新たな視点を提示
- 多様な手法とオープンソースツール(機械学習、Docker、FastAPI など)を組み合わせた実践的な応用事例
1件のコメント
Hacker Newsのコメント
都市でゲル/ユルト地区の話になると、遊牧生活とゲル文化の文化的重要性を過小評価してはいけないと思う。近年は気候変動(砂漠化)や経済的理由で、多くの人が望まぬ形で遊牧生活をやめてウランバートルのような都市近郊へ移住しているが、たいていは一時的なものと考え、やむを得ず都市に来る場合が多い。住宅不足の問題だけでなく、アパートのような恒久的構造物へ完全に移ることが、遊牧を完全に放棄した象徴になってしまうため、それをためらう心理も大きい。そのため恒久建築の横にゲルを建てたり、親戚の家の庭に追加したり、文化的アイデンティティを保つ手段として拡張して使う姿もよく見られる。こうした例は最初の写真群で確認できる
数年前にオートバイでモンゴルを横断したときに驚いたことがあったが、立派な恒久住宅に住んでいても裏庭には必ずゲルがあった。外部の人間としては、なぜ二つ目の家が必要なのかと不思議に思ったが、現地の人に聞くと、こちらが変なことを言っているという目で見られた。ゲルは単に文化に深く根付いていて、ある種のステータスシンボルでもあり、客人のもてなしや屋外生活など多目的に使われる空間なのだ
ウズベキスタンのヒヴァにある宮殿で見た経験を話したいのだが、確かに出入口もあり豪華な部屋も多い伝統的な宮殿だったにもかかわらず、壁で完全に囲まれた奥の中庭の一角に、丸い区画、つまりゲルを建てるための場所が別に設けられていた。この地域のハーンたちもチンギス・ハーンの血統を誇っていたが、都市の中に住んでいても恒久的な屋根の下で夜を過ごすのはハーンらしくないという感覚があり、訪ねてくる親族たちもそうした姿は歓迎しない空気があった
Toshhovli PalaceのWikipedia
[接見の中庭にある円形区画の写真](https://en.wikipedia.org/wiki/Toshhovli_Palace#/media/File:KhivaTach_Khaouli_reception_yard_Iwan.JPG)
モンゴルでは近年の何度かの厳冬のため草原から大規模な移動が起き、家畜の群れが大きく減っているので、大半が都市に流入している。望んでも恒久建築に入る場所が足りないのが実情だ
聞くところによると、すでにゲルを一つくらいは持っていて、必要なときに引っ越すのも比較的簡単らしい。たとえば特別な行事があると、また田舎の家に戻るという話も聞いたことがある
ゲルで暮らすことを必ずしも公共政策の失敗のせいだと見るより、単なる文化的選択だという解釈のほうに同意する。昔はチンギス・ハーンもゲルに住んでいたし、実際、必要に迫られてゲル生活を選ぶ人もいれば、自らの意思で選ぶ人もいる。したがって、そうした姿そのものを決して否定的だと決めつけることはできない
ウランバートルには標準化されたゲルがある。大規模な市場で部品や完成品のゲルを簡単に購入できる。2017年時点では1基あたり約1,000ドルだった。その金額で、きちんと断熱され、簡単に移動できる小さな家を手に入れられ、モンゴルでは都市の外ならどこにでも定住できる(ただし羊2,000頭と一緒なら、放牧地の利用は現地と相談したほうがよい)。結局、ゲルを選ぶのは伝統や文化だけでなく、その状況では合理的な判断でもある
ちなみに、礼儀としてトルコ式の住居テントをユルト、モンゴル式をゲルと呼ぶ。フランスではシャバドゥ、カナダではプランバス、アメリカではフリップと呼ぶこともある、という冗談も出ていた。自分のシャバドゥを見て現地の人がゲルと呼んだら少し気になる、という笑い話も添えられていた
ゲルを置くために、どのような基礎工事をするのか気になる
モンゴルに機械学習を適用したユルトが0個だという言及があった
そんなはずはないと思うので、むしろかなりあるのではと推測する
最初はユルトを職業か人のタイプだと思っていて、タイトルを誤解した
ありがとう、笑える体験だったと言っている
非ネイティブとして、もっと自然な文は何だろうと考えた。「機械学習でモンゴルのすべてのユルトを数えてみた」のような文も挙げている
OpenStreetMap(OSM)にすでに輪郭が示されている89,259基のユルトを入力に使わなかったのは惜しい気がする。ただし、その輪郭をGoogle Maps画像と位置合わせするのに問題があったはずだ
OSMのモンゴルのゲルタグ統計
モデルはタイル境界上にあるユルトをうまく捉えられなかったのではないかと推測する。そして人口300万人に比べて数がずっと少ないので意外に感じる
「300万人に比べてゲルの数が少ない」という点について、実際の集計結果が172,700基なら、それぞれ家族居住用と見なして1ゲルあたり4人(実際はもっと多いかもしれない)とすれば約69万人となり、モンゴル人口350万人の20%に当たる。かなりもっともらしい数字に見える
リンクをクリックする前にざっくり見積もった数字も共有している。モンゴルの人口300万人のうち首都に150万人が住む。100万人ほどが都市外に住むと仮定し、4人に1ゲルなら25万基。そこに来客用、倉庫用、住宅の庭など副次的用途を加えると30万基くらいと見積もるが、MLアプリの結果のほぼ2倍だ
こういうふうにOSMなどをラベルとして使おうというアイデアは、地理/機械学習プロジェクトでよく話題になる。ただ、OSMはGoogle Maps画像の採用をライセンス上認めていないので、研究目的であっても画像の取得や再配布には法的な問題が多い。Googleは多様な外部画像ソースからサブライセンスを受けており、IPを厳格に管理している。画像とラベルの位置合わせの問題も大きく、ラベル付け自体が画像ではなくGPS座標かもしれない。しかもゲルのような移動式構造物は、ラベルの完全性や整合性がどうしても低くなる。OSMの網羅性も地域コミュニティの活動状況に大きく左右される。それでも、自前ラベルと予測値のクロスチェックには使える。タイル単位の検出では、境界上の予測は通常捨て、オーバーラップウィンドウやNMSなどで重複処理を行う
17万2千あまりでもなお途方もなく多い数であり、人口比で見たゲルの数は世界のどこよりも突出していることを強調している
Google Mapsの衛星画像を直接ダウンロードするのは利用規約上禁止されていることを強調したい。実際、ブロックされやすいのだが、モンゴル全体のタイルをすべて取得したという事実に驚く
市場独占以外に、こうした方針の理由が理解できないという反応だ
ブロックされたら新しいアカウントを作ればいいという意見もある
結果が興味深いので、実際に誤検出率がどれくらいだったのか気になる。貯蔵タンクやサイロ、屋外プールがゲルと誤分類されたのかも聞いてみたい
大学時代に触れたGeo/MLプロジェクトの話で、久しぶりに見て楽しかった。オーストラリア政府も似たような作業に毎年多額の資金を投じているが、この記事の筆者の結果と比べると、うちの政府のほうがずっと非効率に見えて残念だ。土地一つまともに分類できず、小さなゲル状オブジェクトのカウントすらろくにできない現状にもどかしさを感じる
「合計172,689基のゲルを40%超の精度予測スコアで検出」という結果の “prediction score” をどう解釈すればいいのか気になる
最初は、モンゴルのすべてのユルトが機械学習を「使っている」という意味だとタイトルを誤解した
半商用ソリューション(教育用途は無料)を使ったとのことで、ディープラーニングモデルのトポロジー/アーキテクチャが気になる。より良いアプローチがあるのかも知りたい