ChatGPTで写真から「逆方向位置検索」を行うのが流行中

(techcrunch.com)

6 ポイント投稿者 GN⁺ 2025-04-19 | 6件のコメント | WhatsAppで共有

ChatGPTを使った画像ベースの位置追跡がバイラルトレンドとして広がっている
OpenAIの最新モデル o3とo4-miniは画像分析とWeb検索機能 を組み合わせ、高精度な位置推論を実行
ユーザーはo3に レストランのメニュー、街の風景、人物写真などを入力 し、「GeoGuessr」ゲームのように位置の推測を試みている
プライバシー侵害への懸念 が高まっており、OpenAIには安全対策があるものの、明確な防止策は不足
OpenAIは 悪用の検知および対応システムの存在 を明らかにしたが、実際の制限は依然として不十分だとの指摘がある

ChatGPTを活用した画像ベースの逆追跡トレンド

最近、ユーザーの間で ChatGPTを通じて画像内の位置を追跡 するトレンドが広がっている
OpenAIが公開した 新モデルo3とo4-miniには、画像内の視覚情報を推論 できる機能が搭載されている
ぼやけた写真や歪んだ写真でも、切り抜き、回転、拡大などの前処理 を経て分析できる
この機能はWeb検索機能と組み合わされ、都市、ランドマーク、レストラン、バーなどの位置推論 に卓越した性能を見せる

GeoGuessrのように使われるChatGPT

ユーザーはo3に「GeoGuessrのように振る舞え」と依頼し、Instagramストーリーのキャプチャ、街の写真、メニュー表などから位置推定 を試みている
- GeoGuessr は、写真を見て位置を当てるオンラインゲーム
ChatGPTは過去の会話履歴や EXIFメタデータなしでも、視覚的な手がかりだけで位置を推測 する
特にo3は、特定の状況ではGPT-4oより優れた性能を示した
例: 暗いバーに掛けられた紫色のサイの装飾写真を見て
- GPT-4oは「英国のパブ」と誤答
- o3は正確に「ウィリアムズバーグのスピークイージーバー」と推論して正解

GPT-4oも驚くべき精度を示す

TechCrunchが行ったテストでは、GPT-4oもかなり高い精度を示し、処理速度はより速かった
ただし、特定の画像ではo3だけが正確に位置を突き止めた事例もある
しかしo3も完璧ではなく、答えを出せなかったり、見当違いの場所を提示したりする場合 もある

潜在的なプライバシー侵害への懸念

何の制約もなく、誰でも他人の写真を使って 位置を追跡できてしまう点は大きな問題
たとえば Instagramストーリーをキャプチャしてドキシング（doxxing）の危険 につながる可能性がある
現在、o3とo4-miniモデルについて、OpenAIは 公式の安全性レポートでこの問題に言及していない

OpenAIの公式見解

記事掲載の数時間後、OpenAIはTechCrunchに次のような声明を伝えた:

「o3とo4-miniはChatGPTに視覚的推論能力を追加し、
アクセシビリティ、研究、緊急対応の状況で有用に使うことができます。
私たちは機密性の高い情報の要求を拒否するよう学習させており、
個人特定の防止および悪用監視の仕組みを導入し、
ポリシー違反には積極的に対応しています。」
それでもなお、位置の逆追跡機能に対する具体的な遮断メカニズムや技術的制御は不足 している状況だ

6件のコメント

ndrgrd 2025-04-19

面倒な部分をコンピュータが代わりにやってくれているだけで、方法そのものはもともと存在していたのではないですか。

kandk 2025-04-21

AIというのは結局、人間にできることをやっているんですよね。（ロボット掃除機のように）

unsure4000 2025-04-19

かかる時間とコストが数十倍も安くなりました。これは明らかに脅威の増大です。

ndrgrd 2025-04-19

本文にもあるように、もともと「ゲーム」のような形で楽しまれていたものなので、以前から一般人には手が届かないようなレベルだったわけではありませんでした。
脅威が生じるのは、位置を特定されてはいけない状況で、簡単に場所を特定できる写真を投稿してしまうときです。

それ以前に、Hacker News のコメントにもあるように、公開されたインターネットに何かを載せるということ自体が、すでに情報の露出を前提にしなければならない行為でもあります。

roxie 2025-04-20

概ね同意します。ただ、『誰でも』『一瞬で』できるようになったという点は、かなり恐ろしい副作用を思い起こさせますね。

GN⁺ 2025-04-19

Hacker Newsの意見

「左ハンドル車だが、交通は左側通行」という推論があるが、写真は交通がどちら側に流れているかの手がかりを与えていない
「店の看板の言語がスペイン語やポルトガル語というより、ラテンアルファベットのビジネス名のように見える」という意見に対して、スペイン語とポルトガル語もラテンアルファベットで書かれる
街の写真を撮り、一部のランドマークを除いたところ、約500km程度の誤差はあったものの、多くの点を正確に推論した
- 写真全体を使ったときは、有名な島を誤認した
- Google画像のランドマーク写真を使ったときも、同じ島だと認識した
ChatGPTを超える技術だと確信している
- ChatGPTで作った写真をMidjourneyの「Describe」機能に入力すると、正確な位置を含む説明を生成した
- 背景の山並みの配置が特定の地域を示しているようだ
新しいトレンドが生まれるたびに嫌悪感を覚える
- ローマの街の写真を見せたところ、ポリシー違反だとして削除された
車のラジオ時計の設定方法を尋ねると、正確な方法とラジオのモデルを特定した
「新たなプライバシーリスク」への懸念
- インターネット自体がプライバシーリスクを内包している
- 毎回新しいリスクを強調するのは大げさだ
Geoguessrゲームで位置推論技術が進歩していくはずだ
- 衛星画像や非衛星画像を通じて位置を正確に把握できる技術が開発されるだろう
GeoguessrゲームでGemini 2.5により22k/25kのスコアを獲得した
- ドイツのエッセンとイギリスのシェフィールドでは正確だったが、イタリアとロシアでは誤差があった
- 単一画像だけから推論した結果だ
ベトナム・ダナン市のハン川で撮影した写真を分析し、正確に位置を特定した
- 分析技術があることを確認した
街の写真から都市は正確に特定したが、具体的な通りや地区は誤って推論した
- Googleの画像による逆検索のほうがより正確な結果を提供する