ChatGPTで写真から「逆方向位置検索」を行うのが流行中
(techcrunch.com)- ChatGPTを使った画像ベースの位置追跡がバイラルトレンドとして広がっている
- OpenAIの最新モデル o3とo4-miniは画像分析とWeb検索機能 を組み合わせ、高精度な位置推論を実行
- ユーザーはo3に レストランのメニュー、街の風景、人物写真などを入力 し、「GeoGuessr」ゲームのように位置の推測を試みている
- プライバシー侵害への懸念 が高まっており、OpenAIには安全対策があるものの、明確な防止策は不足
- OpenAIは 悪用の検知および対応システムの存在 を明らかにしたが、実際の制限は依然として不十分だとの指摘がある
ChatGPTを活用した画像ベースの逆追跡トレンド
- 最近、ユーザーの間で ChatGPTを通じて画像内の位置を追跡 するトレンドが広がっている
- OpenAIが公開した 新モデルo3とo4-miniには、画像内の視覚情報を推論 できる機能が搭載されている
- ぼやけた写真や歪んだ写真でも、切り抜き、回転、拡大などの前処理 を経て分析できる
- この機能はWeb検索機能と組み合わされ、都市、ランドマーク、レストラン、バーなどの位置推論 に卓越した性能を見せる
GeoGuessrのように使われるChatGPT
- ユーザーはo3に「GeoGuessrのように振る舞え」と依頼し、Instagramストーリーのキャプチャ、街の写真、メニュー表などから位置推定 を試みている
- GeoGuessr は、写真を見て位置を当てるオンラインゲーム
- ChatGPTは過去の会話履歴や EXIFメタデータなしでも、視覚的な手がかりだけで位置を推測 する
- 特にo3は、特定の状況ではGPT-4oより優れた性能を示した
例: 暗いバーに掛けられた紫色のサイの装飾写真を見て
- GPT-4oは「英国のパブ」と誤答
- o3は正確に「ウィリアムズバーグのスピークイージーバー」と推論して正解
GPT-4oも驚くべき精度を示す
- TechCrunchが行ったテストでは、GPT-4oもかなり高い精度を示し、処理速度はより速かった
- ただし、特定の画像ではo3だけが正確に位置を突き止めた事例もある
- しかしo3も完璧ではなく、答えを出せなかったり、見当違いの場所を提示したりする場合 もある
潜在的なプライバシー侵害への懸念
- 何の制約もなく、誰でも他人の写真を使って 位置を追跡できてしまう点は大きな問題
- たとえば Instagramストーリーをキャプチャしてドキシング(doxxing)の危険 につながる可能性がある
- 現在、o3とo4-miniモデルについて、OpenAIは 公式の安全性レポートでこの問題に言及していない
OpenAIの公式見解
- 記事掲載の数時間後、OpenAIはTechCrunchに次のような声明を伝えた:
「o3とo4-miniはChatGPTに視覚的推論能力を追加し、
アクセシビリティ、研究、緊急対応の状況で有用に使うことができます。
私たちは機密性の高い情報の要求を拒否するよう学習させており、
個人特定の防止および悪用監視の仕組みを導入し、
ポリシー違反には積極的に対応しています。」 - それでもなお、位置の逆追跡機能に対する具体的な遮断メカニズムや技術的制御は不足 している状況だ
6件のコメント
面倒な部分をコンピュータが代わりにやってくれているだけで、方法そのものはもともと存在していたのではないですか。
AIというのは結局、人間にできることをやっているんですよね。(ロボット掃除機のように)
かかる時間とコストが数十倍も安くなりました。これは明らかに脅威の増大です。
本文にもあるように、もともと「ゲーム」のような形で楽しまれていたものなので、以前から一般人には手が届かないようなレベルだったわけではありませんでした。
脅威が生じるのは、位置を特定されてはいけない状況で、簡単に場所を特定できる写真を投稿してしまうときです。
それ以前に、Hacker News のコメントにもあるように、公開されたインターネットに何かを載せるということ自体が、すでに情報の露出を前提にしなければならない行為でもあります。
概ね同意します。ただ、『誰でも』『一瞬で』できるようになったという点は、かなり恐ろしい副作用を思い起こさせますね。
Hacker Newsの意見