- ロンドン中のあらゆるレストランデータをスクレイピングし、機械学習モデルを構築して、Google Mapsのアルゴリズムが都市内の小規模事業者の生存に及ぼす構造的影響を分析したプロジェクト
- Googleマップのランキングは単なる一覧ではなく、**関連性、距離、prominence(知名度)**のシグナルを通じて需要を積極的に組織する「市場形成者」として機能
- レビュー数・増加速度・ブランド認知・Web上での言及によって累積的に強化される構造が示され、初期露出 → 需要増加 → レビュー増加 → 追加露出という循環が発生
- この構造はチェーン店や中心地の飲食店を有利にし、**新しい独立系飲食店はレビュー不足のため発見すらされにくい「コールドスタート問題」**に直面する
- これを切り分けるため、飲食店の構造的条件だけから**予想評価(カウンターファクトゥアル)を予測するMLモデルを構築し、実際の評価との差を残差(residual)**として計算することで、アルゴリズムが過大・過小評価した飲食店を特定
- さらに地域単位で飲食店を集計し、レストランハブの構造的な強さをPCA・クラスタリングで分析し、プラットフォームが都市のフードエコシステムをどう組み替えているかを示す
Google Mapsはディレクトリではなく市場形成者(Market Maker)
- Google Mapsが「人々が好むもの」を受動的に反映しているという公式の語りとは異なり、実際には**relevance(関連性)、distance(距離)、prominence(知名度)**という中核シグナルを通じて需要を組織している
- relevanceは検索語とビジネスのメタデータとのテキストマッチングから推定され、distanceは純粋に空間的な要素
- prominenceはレビュー数、レビュー増加速度、平均評価、ブランド認知、Web上での可視性などから算出され、政治経済的な影響力が立ち上がる地点となる
- 人々がその場所とどれだけ頻繁に相互作用し、言及し、すでに認知しているかが反映される
- つまりGoogleマップは需要を「反映」するのではなく、**ランキングアルゴリズムによって需要を組織する市場形成者(market maker)**である
累積優位の構造とマタイ効果
- 順位リストでの可視性が来店客を決め、来店客がレビュー蓄積の速度を決め、そのレビューが再びprominenceシグナルに反映されるという累積優位(cumulative advantage)
- 金融市場で資本が複利で増殖する仕組みに似ており、Robert Mertonの**マタイ効果(Matthew Effect)**がケバブ店に適用された形
- チェーン店は拠点をまたぐブランド認知のおかげで有利であり、人通りの多い地域の店舗は同じ品質でもより速くレビューを蓄積してprominence順位を上げる
- 新規の独立系店舗はcold-start問題に直面する。レビューがなければ発見されにくく、発見されなければレビューも蓄積しにくい
- 中立的な消費者選択に見えるものも、実際にはアルゴリズムに媒介された市場設計として理解されるべきだ
市場形成者としてのプラットフォーム
- 経済学における市場形成者(market maker)は、需要と供給を単に反映するのではなく、流動性、マッチング、価格発見を積極的に形作る仲介者である
- Google Mapsのようなプラットフォームは、価格ではなく可視性を制御することで、地域サービスに対して類似の機能を果たしている
- デジタル経済学の用語では、ランキングアルゴリズムは**attention allocator(注目配分者)**として機能し、需要を特定の事業者へ導き、他の事業者から遠ざける
機械学習で構築した反事実的(counterfactual)な都市
- Google Mapsが都市需要の市場形成者であるなら、その増幅レイヤーがなければ都市がどう見えるかを把握することが核心的な問いになる
- レストランの内在的な成果とプラットフォーム可視性の効果を分離するために機械学習モデルを構築
- HistGradientBoostingRegressor(scikit-learnのgradient-boosted decision tree)を使用
- 大きく雑多な混合型の表形式データに適しており、手動指定なしで相互作用効果を捉えられる
- モデルの特徴量(features):
- レビュー数(注目の逓減効果を反映するためlog変換)
- 料理ジャンル、チェーン/独立の別、価格帯、業態(レストラン/カフェ/テイクアウト/バー)
- 空間グリッドを通じた都市内の位置
料理ジャンル分類モデルも別途構築
- Google Mapsの料理ジャンル分類に不正確さや不整合があることが判明
- かなりの数が"restaurant"、"cafe"、"meal takeaway"など曖昧にラベル付けされていた
- 店名、メニューの言語、レビュー本文をもとに料理ジャンルを予測する別の分類モデルを構築
- ダッシュボードの料理ジャンルフィルターはGoogleタグではなく、機械学習の結果を使っている
- 料理ジャンルの誤分類があると、多様性、クラスタリング、高距離競争関係の分析が歪む
評価残差(rating residual)でアルゴリズムによる過小評価を測る
- すべての特徴量は標準的な前処理パイプライン(欠損値補完、エンコーディングなど)を通過
- モデルはプラットフォーム上で観測可能な特徴と評価の対応関係だけを学習する
- 各レストランについて**反事実的な期待評価(counterfactual expected rating)**を生成
- 実際の評価と予測評価の差がrating residual(評価残差)
- 正の残差: プラットフォームの基準線より実質的に優れた成果
- 負の残差: アルゴリズムが通常は報いる条件に比べて低調な成果
- 料理の品質を完全に測る指標ではないが、**アルゴリズムによるミスプライシング(algorithmic mispricing)**を測る強力な指標
- 社会的・料理的価値が、プラットフォームが構造的に増幅するものと乖離する地点を捉える
有料広告による可視性の限界
- 一部のレストランはpromoted pinsやローカル検索広告に費用を払っている
- 有料の可視性は公開されておらず、推定できない
- これはプラットフォームの影響力がどれほど不透明になっているかを示す兆候でもある
- 評価残差は、観測不可能な広告支出を一部反映している可能性がある
London Food Dashboardの紹介
- 分析結果をまとめた**London food dashboard**を構築
- 現在の機能: 名前検索、過小評価された名店(機械学習アルゴリズムが識別)フィルター、料理ジャンル、自治区、価格帯、最低評価、レビュー数フィルター
- ベータ版ではあるが、ロンドンのアルゴリズム化された食の経済をのぞき込む顕微鏡として機能する
- アクセス先: laurenleek.eu/food-map
- "underrated gems"フィルターが機械学習残差の活用例
- より大きく暗いバブルは、アルゴリズムが過小評価した場所を示す
個別レストランからアルゴリズム近傍へ
- レストランは単独で失敗するのではなく、エコシステムの中で失敗する
- プラットフォームのダイナミクスが個別レストランから街区全体のフードエコシステムへ拡張されたときに起きる現象を分析するため、第2のモデリングレイヤーを追加
- レストランを小さな空間セル(地図上の六角形 - 正方形よりedge effectに強い)に集計
- 各地域の要約特徴量を計算: レストラン密度、平均評価、平均残差、総レビュー数、チェーン比率、cuisine entropy、価格帯
- 特徴量を標準化し、PCA(主成分分析)を実行して、全体の「レストランエコシステム強度」を連続的なhub scoreへ圧縮
- 同じ特徴空間にK-meansクラスタリングを適用し、地域を4つの構造タイプに分類:
- elite, strong, everyday, weakハブ
ハブ分析の結果
- パターン自体は見慣れたものだ。ロンドン中心部が支配的である
- 重要なのはハブの位置ではなく、ハブのタイプである
- 生の評価ではなく全体のhub scoreによって、ロンドンで最も構造的に強い5つのレストランハブを特定
- 密度、アルゴリズム的注目、独立系店舗の生存、消費者の購買力がすべてそろった場所
- 地図上にラベル表示される
- 近隣間の対立を招かないよう、本文では順位を明示的に列挙していない
料理ジャンル密度とロンドンの食文化の多様性
- 料理ジャンル密度パネルをハブ分析に重ねると、より鮮明な結果が得られる
- ロンドンの食文化の多様性はプラットフォーム経済全体に均等には分布していない
- 移民系の料理は、アルゴリズム的可視性が構造的に弱い都市地域に強く集積している
- Italian, Indian, Turkish, Chinese, Thai, British, Japanese, French, American, fish-and-chipsは、それぞれ固有の定着の歴史、労働ネットワーク、小売形態、資本・家賃との関係を反映している
- 長く連続した回廊を形成する料理もあれば、特定の商業集積や所得階層と結びついた断続的なクラスターとして現れる料理もある
- 料理の多様性は単なる好みではない。どこに家族が定住したのか、どの商店街が2世代目が事業を始められるほど長く手頃だったのか、料理のエコシステムが成熟する前に移住が起きた都市の部分はどこか、といったことと結びついている
政策的含意
- このプロジェクトは検索の問題として始まり、より大きな問題へと行き着いた
- 最も重要な結果は、どの街が1位かではなく、プラットフォームが今や日常的な都市市場での生存を静かに構造化しているという認識である
- ロンドンのレストランシーンは、もはや好みだけで組織されてはいない
- 複利のように増大する可視性、発見が訪れると上がる家賃、そして消費者が到着するずっと前に注目を配分するアルゴリズムによって組織されている
- 「選択」に見えるものが、ますますランキングシステムの下流効果になっている
アルゴリズム透明性と監査の必要性
- 発見可能性が今や小規模事業者の生存を左右するなら、競争、公正性、都市再生はもはやプラットフォームのランキングシステムを無視できない
- 自治体が通りを再整備し、免許規制を緩和しても、アルゴリズムによる不可視化がその場所を経済的に孤立させる可能性がある
- プラットフォームの透明性と監査可能性は、もはやニッチな技術論争ではなく、静かに地域経済政策の道具になりつつある
- 少なくともこれほどの経済的帰結を持つランキングアルゴリズムは、監査可能であるべきだ
- 金融市場を監査するのと同じように、**注目市場(attention market)**も監査(Audit)すべきである
- ナビゲーションアプリとしてのGoogle Mapsが持つ権力の大きさに注目すべきだ
2件のコメント
ここに積極的な店主たちによるレビュー介入まで重なって、大きな非効率を生み出していると思います。難しい問題ですね。以前は信頼して行ける Googleマップのレビューでしたが、今ではディスカバリー領域は完全に壊れてしまったように思います。
NAVERマップはかなり信頼できなくなっていて、カカオマップは多少はマシでした。それでもやはりサクラレビューがあるので、こういう領域はメジャーなサービスであるほど信頼度が落ちますね。