- ChatGPT AtlasはChatGPTを中核に搭載した新しいAIベースのウェブブラウザとして、ユーザーの文脈、ツール、タスクを統合し、**「スーパーアシスタント」**へと進化させることを目指している
- Atlasは、ユーザーがウェブのどこを閲覧してもChatGPTが同行し、ページを離れずに作業を実行し、文脈理解をサポートする機能を提供する
- ブラウザーメモリを通じて、ユーザーが訪問したサイトの文脈を記憶し、それをもとに質問への回答、要約、予定計画などの作業を支援する
- エージェントモード(Agent Mode)を通じて、ChatGPTがユーザーのブラウジング環境でタブを開く、情報検索、予約、注文といった実際のアクションを実行できる
- macOS向けに世界規模でリリースされ、将来的にWindows、iOS、Android版も提供予定で、AIベースのブラウジングの新しいステップと評価されている
- ChatGPT AtlasはChatGPTとウェブブラウザを組み合わせた****AIベースのウェブブラウザツール
- 単なる検索を超えて、ユーザーの文脈を理解し、行動するインテリジェントなブラウザ環境を目標としている
- 既存のChatGPTのウェブ検索機能が急速に普及した後、OpenAIはブラウザ自体をAI中心に再構成し、作業自動化、調査、スケジュール計画までサポートするよう設計した
- ユーザーはコピー&ペーストを別途行うことなく、Atlasのウィンドウ内で直接ChatGPTの支援を受けられる
ブラウザーメモリ機能
- Atlasは、ユーザーが訪問したサイト情報を基にブラウザーメモリを保存し、文脈ベースの対話とカスタマイズ支援を提供する
- 例:「先週見た求人情報を要約して」といったリクエストを自動で処理
- メモリは完全にユーザー管理され、ユーザーはいつでも閲覧・保存・削除できる
- ブラウザ履歴を削除すると関連メモリも同時に削除され、記憶の範囲をサイト単位で調整できる
- デフォルトでは、ブラウジングコンテンツはモデル学習に使用されず、ユーザーが明示的にオプトインした場合にのみ学習データに含まれる
エージェントモード (Agent Mode)
- Atlasに組み込まれたAgent Modeは、ChatGPTがユーザーのブラウザ内で実際の作業を実行する機能
- 例:レシピを基に材料をカートに入れて注文したり、ドキュメントを読んで競合他社分析を行ったりする
- エージェントはユーザーの許可を受けてタブを開き、クリックして作業を進める
- Plus、Pro、Businessユーザー向けにプレビューバージョンとして提供され、より速い速度と高い信頼性を目指して継続的に改善中
セキュリティとプライバシー
- Atlasはセキュリティを最優先した設計を基に、次のような制限を設けている
- ブラウザ内でのコード実行、ファイルダウンロード、拡張機能インストールは不可
- ローカルファイルや他アプリへのアクセス不可
- 金融機関などの機微なサイトでは自動的に一時停止
- ログアウトモードでもエージェントを利用可能にして、個人情報の露出リスクを最小化
- 悪性ページやメールに隠されたコマンド型攻撃を防ぐため、数千時間のレッドチームテストを実施し、新しい攻撃タイプに対応できるよう迅速なパッチ体制を運用
- ユーザーには、Atlas利用時の情報露出リスクを考慮し、作業モニタリングとログアウトモードの活用を推奨
データおよびコントロール設定
- ユーザーは、ChatGPTがアクセスできるサイトの可視性をアドレスバーのトグルで制御できる
- 無効化するとページ内容のアクセスが遮断され、メモリ生成が停止
- データ学習を希望する場合は、設定の**“include web browsing”**オプションを通じてウェブコンテンツを学習データに含められる
- ペアレンタルコントロールも強化され、保護者がブラウザーメモリやエージェントモードを無効化できる
対応プラットフォームと配信
- ChatGPT AtlasはmacOS用に即時リリースされ、Free・Plus・Pro・Goユーザー全員が利用可能
- Business、Enterprise、Eduプランのユーザーも、管理者が有効化すれば利用可能
- Windows、iOS、Android版は近日リリース予定
- ユーザーは既存ブラウザのブックマーク、パスワード、履歴をインポートして、簡単に移行可能
将来計画
- OpenAIはAtlasの次の段階として、マルチプロフィール対応、開発者ツールの改善、Apps SDK統合拡張性を計画している
- ウェブサイト運営者はARIAタグを追加することで、ChatGPTエージェントが自社サイトでより正確に動作するよう改善できる
- 今回の公開は、AIがブラウザ内に入り込んで**「対話型ウェブ体験」**を実現する第一歩として評価されている
1件のコメント
Hacker News コメント
個人的にはプライバシーだけに注目するのは視野が狭いと思う。重要なのは、この技術が従来のインターネット・ブラウジングの在り方を根本的に変える可能性があるか、そしてウェブトラフィックの収益化方式にどのような影響を与えるかである。特に、これは本当に新体験のV0.1なのかV1.0なのかで差が大きい。もしV1.0レベルだと、伝統的なウェブからの移行が急速に進んでおり、経済的にもかなりの影響が生じる可能性がある。そうなればデータセンターAI投資も十分に正当化できる。
ChatGPT AtlasのDMGインストーラーの主要画面を整理してみた(インストールスクリーンショット):
OpenAIの回答はPerplexityのCometに似ていると感じる。これが未来になってしまうのではと心配だ。実際、この種のAIブラウザはかなり価値を生むが、最終的にすべてを統制する単一のBig Techが生まれるように思う。オープンソースブラウザ(Firefoxなど)もいずれ、独自LLMを活用した代替機能を出してほしい。クラウドベースLLMではなくオンデバイス処理のほうが理想だが、問題は優秀なMLエンジニアのほぼ全員がすでにビッグテックに流れていることだ
Atlasのagentモードをテストしてみた。自分の経験と興味に基づき、HNコメントの中から自分がインサイトを足せる投稿を見つけてくれた。結果、スタートアップやクラウドに関して自分がよく知る7件、よく知らない3件(Fine-tuning LLM)についてのコメントが出てきた。おすすめコメントの内容はまさに私が言いたいことだったが、言い方は私の言い回しと距離がある。テスト後、これを使うと私が直接楽しんでいた活動が魂のない作業に変わってしまいそうで悩んだ。ツール自体は面白いが、何に使うかはまだ確かでない
なぜAtlasブラウザはmacOSのみなのか気になる。LinuxやWindows対応もあれば、より正式なローンチのように感じるだろう
明確に使い道があるとは思うが、日常を細かくAI企業に委ねる感覚が強い。疑問があれば、ただChatGPTアプリを開いて質問した方が良い。私の基準だとHoneyブラウザ拡張に近いが、データ損失の観点ではずっと深刻な問題になる。データが本当にプライベートであると1秒でも信じることはできない
Atlasは確かにChromiumベースなのに、Chromium言及、ライセンス、クレジットがどこにもない。chrome://ページはすべてブロックされている。こうしたオープンソースベースのプロジェクトなら、少なくとも出所と基盤を透明に明示すべきだと思う。最初は不足があっても、これは基本だと思う。これは標準なのか、それとも自分だけ違和感を覚えるのか
OpenAIはApple Intelligenceが解決できない部分を取りに行っているようだ。むしろこれらの機能がmacOS標準機能として統合されるべきだ。FoundationLLMでローカル演算とプライバシー保護を最大化し、フロントラインモデルの呼び出しが本当に必要なときのみ自社サーバーで処理するのがよい。macOSがAIアシスタント品質をOSレベルでより深く統合する変化を必ず実現しなければならないと思う。Apple Intelligenceは良いスタートだったが、ローカルモデルの性能が足りず、重要な機能がスタック内に隠れているように感じる
LLM Chrome拡張を使わない理由は、ブラウザ情報が過剰に収集されるのではという信頼不足があるからだ。今回も同じ懸念があるが、少なくとも今回は信頼イメージを持つ大企業であることだけが違いで、これが本当に良いか私には分からない
この技術が便利に見えるなら、全体主義政権がこれをどれだけ欲しがるか想像すべきだ。広告で鳥肌が立ったことがあるなら、Atlasはルートレベルのキーロガーサービスである。なぜAI会社に私のすべてのブラウザ操作を収集・記録することを許可しなければならないのか分からない。GoogleもChromeで既にこれくらいはやっている。広告効率化を目的とすることと、人間の認知プロセス自体を記録して一般AIモデルの訓練データを狙うことは本当に全く異なる