6 ポイント 投稿者 GN⁺ 2025-10-22 | 1件のコメント | WhatsAppで共有
  • ChatGPT AtlasはChatGPTを中核に搭載した新しいAIベースのウェブブラウザとして、ユーザーの文脈、ツール、タスクを統合し、**「スーパーアシスタント」**へと進化させることを目指している
  • Atlasは、ユーザーがウェブのどこを閲覧してもChatGPTが同行し、ページを離れずに作業を実行し、文脈理解をサポートする機能を提供する
  • ブラウザーメモリを通じて、ユーザーが訪問したサイトの文脈を記憶し、それをもとに質問への回答、要約、予定計画などの作業を支援する
  • エージェントモード(Agent Mode)を通じて、ChatGPTがユーザーのブラウジング環境でタブを開く、情報検索、予約、注文といった実際のアクションを実行できる
  • macOS向けに世界規模でリリースされ、将来的にWindows、iOS、Android版も提供予定で、AIベースのブラウジングの新しいステップと評価されている

  • ChatGPT AtlasChatGPTとウェブブラウザを組み合わせた****AIベースのウェブブラウザツール
    • 単なる検索を超えて、ユーザーの文脈を理解し、行動するインテリジェントなブラウザ環境を目標としている
  • 既存のChatGPTのウェブ検索機能が急速に普及した後、OpenAIはブラウザ自体をAI中心に再構成し、作業自動化、調査、スケジュール計画までサポートするよう設計した
  • ユーザーはコピー&ペーストを別途行うことなく、Atlasのウィンドウ内で直接ChatGPTの支援を受けられる

ブラウザーメモリ機能

  • Atlasは、ユーザーが訪問したサイト情報を基にブラウザーメモリを保存し、文脈ベースの対話とカスタマイズ支援を提供する
    • 例:「先週見た求人情報を要約して」といったリクエストを自動で処理
  • メモリは完全にユーザー管理され、ユーザーはいつでも閲覧・保存・削除できる
  • ブラウザ履歴を削除すると関連メモリも同時に削除され、記憶の範囲をサイト単位で調整できる
  • デフォルトでは、ブラウジングコンテンツはモデル学習に使用されず、ユーザーが明示的にオプトインした場合にのみ学習データに含まれる

エージェントモード (Agent Mode)

  • Atlasに組み込まれたAgent Modeは、ChatGPTがユーザーのブラウザ内で実際の作業を実行する機能
    • 例:レシピを基に材料をカートに入れて注文したり、ドキュメントを読んで競合他社分析を行ったりする
  • エージェントはユーザーの許可を受けてタブを開き、クリックして作業を進める
  • Plus、Pro、Businessユーザー向けにプレビューバージョンとして提供され、より速い速度と高い信頼性を目指して継続的に改善中

セキュリティとプライバシー

  • Atlasはセキュリティを最優先した設計を基に、次のような制限を設けている
    • ブラウザ内でのコード実行、ファイルダウンロード、拡張機能インストールは不可
    • ローカルファイルや他アプリへのアクセス不可
    • 金融機関などの機微なサイトでは自動的に一時停止
    • ログアウトモードでもエージェントを利用可能にして、個人情報の露出リスクを最小化
  • 悪性ページやメールに隠されたコマンド型攻撃を防ぐため、数千時間のレッドチームテストを実施し、新しい攻撃タイプに対応できるよう迅速なパッチ体制を運用
  • ユーザーには、Atlas利用時の情報露出リスクを考慮し、作業モニタリングログアウトモードの活用を推奨

データおよびコントロール設定

  • ユーザーは、ChatGPTがアクセスできるサイトの可視性をアドレスバーのトグルで制御できる
    • 無効化するとページ内容のアクセスが遮断され、メモリ生成が停止
  • データ学習を希望する場合は、設定の**“include web browsing”**オプションを通じてウェブコンテンツを学習データに含められる
  • ペアレンタルコントロールも強化され、保護者がブラウザーメモリやエージェントモードを無効化できる

対応プラットフォームと配信

  • ChatGPT AtlasはmacOS用に即時リリースされ、Free・Plus・Pro・Goユーザー全員が利用可能
  • Business、Enterprise、Eduプランのユーザーも、管理者が有効化すれば利用可能
  • Windows、iOS、Android版は近日リリース予定
  • ユーザーは既存ブラウザのブックマーク、パスワード、履歴をインポートして、簡単に移行可能

将来計画

  • OpenAIはAtlasの次の段階として、マルチプロフィール対応開発者ツールの改善Apps SDK統合拡張性を計画している
  • ウェブサイト運営者はARIAタグを追加することで、ChatGPTエージェントが自社サイトでより正確に動作するよう改善できる
  • 今回の公開は、AIがブラウザ内に入り込んで**「対話型ウェブ体験」**を実現する第一歩として評価されている

1件のコメント

 
GN⁺ 2025-10-22
Hacker News コメント
  • 個人的にはプライバシーだけに注目するのは視野が狭いと思う。重要なのは、この技術が従来のインターネット・ブラウジングの在り方を根本的に変える可能性があるか、そしてウェブトラフィックの収益化方式にどのような影響を与えるかである。特に、これは本当に新体験のV0.1なのかV1.0なのかで差が大きい。もしV1.0レベルだと、伝統的なウェブからの移行が急速に進んでおり、経済的にもかなりの影響が生じる可能性がある。そうなればデータセンターAI投資も十分に正当化できる。

  • ChatGPT AtlasのDMGインストーラーの主要画面を整理してみた(インストールスクリーンショット):

    1. ブラウザメモリを有効化:サーフィン中に有用な情報を記憶し、より賢い回答や提案を受ける。ユーザーがメモリのプライバシーを直接管理する
    2. どのサイトでもChatGPTに質問:ChatGPTサイドバーを開いて、サイト内容の要約・説明・様々な作業処理が可能
    3. カーソルを協働ツールに:メール作成、レビュー、フォーム入力などをChatGPTロゴをワンクリックするだけで支援
    4. デフォルトブラウザに設定すると、Atlasでメッセージ、ファイルアップロード、データ分析、画像生成などの制限が解除(7日間)
    5. すべて準備完了。Atlasで安全にデータとプライバシーを管理しつつウェブを探索せよと、歓迎メッセージとバッジを表示 多くのChatGPT Freeユーザーは(4)が気になるだけでもデフォルトブラウザに設定してしまいそうで、かなりひらめきがあるアイデアだと思う
    • ChatGPTメモリ機能をすべてオフにしていた。自己の区別がうまくいかないのか、例えば冬用タイヤについて「ファームウェア分野に従事しているから耐久性により敏感だろう」などと的外れな回答を受けてびっくりした
    • 自然言語でブラウザ履歴を検索する機能が最も楽しみ。5か月前のリンクタイトルは覚えていないのに内容は説明できているのに、10分以上探したことがあまりに多かった
    • (4)の機能が気になってデフォルトブラウザに変更してみたが、最も怪しかったのはキーチェーンへのアクセス要求だったので、これは拒否した
    • デフォルトブラウザにするときのメリットがあるのは今回が初めてのようで、このようなボーナスがあると、設定後もデフォルトのままにしておく人は多そう
    • 「プライバシーはあなたが直接コントロールします」という言葉を繰り返す企業をどう信じればいいのか。インターネット全体をスクレイピングしてプライバシーそのものを侵害した経緯のある会社だから、なおさら信頼しづらい
  • OpenAIの回答はPerplexityのCometに似ていると感じる。これが未来になってしまうのではと心配だ。実際、この種のAIブラウザはかなり価値を生むが、最終的にすべてを統制する単一のBig Techが生まれるように思う。オープンソースブラウザ(Firefoxなど)もいずれ、独自LLMを活用した代替機能を出してほしい。クラウドベースLLMではなくオンデバイス処理のほうが理想だが、問題は優秀なMLエンジニアのほぼ全員がすでにビッグテックに流れていることだ

    • 何の価値があるのか聞きたい。実際に使っていないが、YouTubeレビューを見るとかなり不安定で、あまり有用そうにも見えない。Siriの登場時を思い出す。結局タイマー設定や音楽制御など、特に大したことのない機能にしか使われなくなったのと同じ
    • 確かにAIエージェント機能はトレンドだと思うが、GeminiもすぐにChromeに統合されるように感じる。独自エージェントモードが出れば、ブラウザ市場でそのシェアをどんどん奪えるだろう
    • 人々の不安は、既存のChromeのようなブラウザ版AIエージェントが出ることだ。非合理的な恐怖ではないが、これが大衆的に成功するかどうかは懐疑的だ。ブラウザエコシステムに変化は必要だが、基本的に普段使いのものはそのまま使い続ける。実際に不便な場合や強制されない限り、容易に変えない。もしかしたらこうした変化が来るかもしれない
    • 個人的には、全体のブラウザを丸ごと管理する形より、サンドボックス化されたブラウザプラグイン方式のほうがずっと好まれる。それでもComet自体は気に入った
    • 「すべてを知り、すべてを管理する単一Big Techが登場する」と言う話には完全に拒否感がある。自分の生活やデータをすでに権力を握った企業にさらに渡すのは絶対に嫌だ。AIが実際に自分の生活を良くした例はまだ見たことがない。Lynxくらいは使う。AIが検索結果からウェブページまで不要なノイズを増やすので、私にとってはただ面倒なだけ
  • Atlasのagentモードをテストしてみた。自分の経験と興味に基づき、HNコメントの中から自分がインサイトを足せる投稿を見つけてくれた。結果、スタートアップやクラウドに関して自分がよく知る7件、よく知らない3件(Fine-tuning LLM)についてのコメントが出てきた。おすすめコメントの内容はまさに私が言いたいことだったが、言い方は私の言い回しと距離がある。テスト後、これを使うと私が直接楽しんでいた活動が魂のない作業に変わってしまいそうで悩んだ。ツール自体は面白いが、何に使うかはまだ確かでない

  • なぜAtlasブラウザはmacOSのみなのか気になる。LinuxやWindows対応もあれば、より正式なローンチのように感じるだろう

    • ChatGPTデスクトップアプリもほぼ4か月間ほぼ同じようにmacOS専用で出していた。実際Electronベースなので、Windows対応にもあまり意識がないようだ。公式にLinux版を一度もリリースしたことはなく、今回のAtlasもmacOSの世界展開後に「Windows、iOS、Androidもすぐ来ます」とだけ言ったので、Linux版は期待しない方がよさそうだ
  • 明確に使い道があるとは思うが、日常を細かくAI企業に委ねる感覚が強い。疑問があれば、ただChatGPTアプリを開いて質問した方が良い。私の基準だとHoneyブラウザ拡張に近いが、データ損失の観点ではずっと深刻な問題になる。データが本当にプライベートであると1秒でも信じることはできない

    • かつてブラウザテレメトリの論争があったが、今度はウェブ使用履歴全体をAI会社にストリーミングするイメージだ。最終的には人生の全データを彼らのクラウドにアップロードするのがエンドゲームになりそうだ。メール、連絡先、メッセージ、ブラウジング履歴、GPS、Meta ARカメラ、家の3Dスキャン、銀行記録など、あらゆる情報が流れこみ、たった今のように使う手間と引き替えに重大な欠点なしで受け入れてしまう日が来るかもしれない
  • Atlasは確かにChromiumベースなのに、Chromium言及、ライセンス、クレジットがどこにもない。chrome://ページはすべてブロックされている。こうしたオープンソースベースのプロジェクトなら、少なくとも出所と基盤を透明に明示すべきだと思う。最初は不足があっても、これは基本だと思う。これは標準なのか、それとも自分だけ違和感を覚えるのか

    • Help > ChatGPT Atlas Helpには関連ドキュメントがあり、"AtlasはOpenAIのChromiumベースのMacブラウザです"という文言が明記されている。これが公式案内のようだ
    • 公式のライセンス要件を述べると、Chromium BSDライセンスは派生物において出典表示を明確に要求している。NOTICEファイルの内容を成果物内のどこかに表示する法的義務がある。Atlasでこれを欠いているのは意外だ。Chromium BSD License
    • Atlasに直接尋ねるとatlas://creditsがあることを間接的に示したが、公式にアクセスする経路や表示位置はない
    • もともとパクリで有名な会社が、いまやオープンソースすら認めないように見える。これは一貫性があると感じる
    • 正直、難しく考える必要はない。意図的にChromiumやGoogleの痕跡を消そうとしているように見える。どこにも関連言及がなく、chrome://ページは全部塞がれ、UIもすべてオープンソース由来の雰囲気を消している。ライセンス上の出典表示義務があるからこそ、この透明性不足は一段と不快だ
  • OpenAIはApple Intelligenceが解決できない部分を取りに行っているようだ。むしろこれらの機能がmacOS標準機能として統合されるべきだ。FoundationLLMでローカル演算とプライバシー保護を最大化し、フロントラインモデルの呼び出しが本当に必要なときのみ自社サーバーで処理するのがよい。macOSがAIアシスタント品質をOSレベルでより深く統合する変化を必ず実現しなければならないと思う。Apple Intelligenceは良いスタートだったが、ローカルモデルの性能が足りず、重要な機能がスタック内に隠れているように感じる

    • これらの統合はどれも中途半端に見える。Siriはまともに動かないしChatGPTは呼び出すだけで、Apple Intelligenceも十分使えるわけではない。Appleも今やSiriを下げるべきか悩んでいるように思える。あるいはChatGPT連携をさらに深くするか、Googleが20兆の検索デフォルト報酬を本当に捨てられるかは分からない。AtlasがSafariの直接競合製品になるかも興味深い。OpenAIがsora2やAtlasのようにApple優先で開発するケースが増えている点も注目すべきだ
  • LLM Chrome拡張を使わない理由は、ブラウザ情報が過剰に収集されるのではという信頼不足があるからだ。今回も同じ懸念があるが、少なくとも今回は信頼イメージを持つ大企業であることだけが違いで、これが本当に良いか私には分からない

    • Private Internet AccessやNordVPNのようなプライバシー重視企業が独自のAIブラウザ拡張やブラウザ自体を出してくれれば大きな価値があるはずだ。トラフィックを匿名化してLLM複数モデルを動かす方式なら、プライバシー重視のイメージでOpenAIやPerplexityから利用者を引き離せるだろう
    • OpenAIがmacOS向けchatgptアプリで証明書ピンによりデータ監視を難しくした例がある
    • LLMプラグインが既存プラグインより特に多くの情報にアクセスできるというのは誤解だと思う。Chromeの拡張機能manifest構造の理解を誤っているようだ
    • LLMは適切な文脈では非常に強力だと思う。ただし常に一定の距離を置いて使うほうが気が楽だ。必要なときに自分で検索に行って使うほうがよい。AIが常に私の後ろをついてきて監視し続けることは望まない
  • この技術が便利に見えるなら、全体主義政権がこれをどれだけ欲しがるか想像すべきだ。広告で鳥肌が立ったことがあるなら、Atlasはルートレベルのキーロガーサービスである。なぜAI会社に私のすべてのブラウザ操作を収集・記録することを許可しなければならないのか分からない。GoogleもChromeで既にこれくらいはやっている。広告効率化を目的とすることと、人間の認知プロセス自体を記録して一般AIモデルの訓練データを狙うことは本当に全く異なる

    • 製品ページをざっくり見たが、GoogleのChrome+Geminiと比べてAtlasが特に多くの情報を記録・収集すると断言できる根拠が正確には分からない。ほとんどの機能は既にChromeに入っており、両方がキー入力全体を記録するならGoogleもできる。むしろ両方ともユーザー予測モデルを作る目的が同じで、ChromeとAtlasはそこまで違わない
    • MicrosoftのRecallとの類似点はあるが、Atlasはユーザーがこの機能を直接許可する点が違う。OpenAIにとって新しい広告ターゲティングの機会が明確に生まれると考える
    • 人口統計、決済、位置、所得などターゲット広告向けのデータモデルと、ユーザーの思考そのものを測って一般AIの訓練に利用することは全く別だ。Atlasが成功すれば、Googleも真似するだろう。すでにChromeとGeminiはあるので、GeminiをChromeへ統合するのはすぐだ。専用TPUを付ければ、実質Atlasと同等になる
    • 私のWebブラウザはrootで実行されているのか、Atlasはrootで動いているのか、Atlasがすべてのタイピングを記録するキーロガーなのか。実際にこれらが事実かどうか気になる