ChatGPTのAtlasブラウザのコアと主要機能
(maily.so)ChatGPTのAtlasブラウザ公開
10月22日の早朝、OpenAIは新しいウェブブラウザ「ChatGPT Atlas」をリリースしました。
AtlasはChatGPTを基盤に構築されたAIブラウザで、OpenAIはこのプロジェクトの準備にかなり長い時間を費やしてきたと明らかにしました。OpenAIは、AIは10年に一度あるかないかというチャンスであり、ブラウザが何をできるか、ブラウザをどう使うか、そしてウェブをもっと生産的で楽しく使う方法を見直す機会だと述べています。従来のタブ中心の設計は優れていましたが、その後ブラウザのイノベーションは大きく進んでいないため、OpenAIはブラウザの可能性を再考することになりました。
かつてはURLバーと検索ボックスがインターネット利用の中核でしたが、OpenAIは今後はチャット体験のウェブブラウザが重要な役割を果たすと説明し、そのためこのユーザー体験を中心にブラウザ設計を始めたとしています。すでに多くの作業や生活がブラウザ上で行われているため、ChatGPTが主要なヘルパーになると、ページでチャットしたり、ChatGPTで情報を検索したり、ブラウザ内でChatGPTのエージェントモードを使うなど、さらに多くのことができると考えています。今後はさらに多くの機能を公開し、ユーザーに直接体験してもらう予定です。
Atlasのコア機能
Atlasは「ブラウザとチャットできるならどうだろうか?」という問いから始まりました。
この考えに基づき、数年にわたる複雑な機能を単純化して、チャット体験として再構成したとされています。Atlasは、単にチャットボタンが追加された既存ブラウザではなく、ChatGPTを中核として設計されており、ChatGPTはウェブを探索する間ずっとユーザーのそばで助けとなるようだと述べています。Atlasを使うことで、ユーザーはより多く質問し、より多く学ぶことになるでしょう。
Atlasは高速かつ柔軟であり、新しく驚きのある体験をサポートできるよう設計されています。
Atlasの主な機能として、ウェブのどこからでもチャットできる機能、ブラウザメモリ機能、そしてChatGPTがユーザーの代わりに作業を実行できるエージェント機能があります。このブラウザはウェブの新しい時代に向けた新しいタイプのブラウザであり、その可能性を示すことに大きな期待が寄せられています。
- チャット機能
- ブラウザメモリ機能
- エージェント機能
Atlasの主な機能
Atlasを初めてダウンロードして開くか、新しいタブを作成するとホーム画面が表示されます。
この画面は既存ブラウザと似た感覚に設計されていますが、ChatGPTの全機能が統合されています。画面中央には、チャットで質問できるコンポーザーがあり、ツール、モデル、チャット履歴のあるサイドバーにアクセスできます。ブラウザなので、URLを入力して特定サイトへ移動したり、ブックマークを参照して特定ページを開いたりと、より多くの作業を行えます。また、ブラウザメモリを使用して、以前見たことがあるが正確な場所が分からないウェブページを検索できます。
Atlasホームページにはおすすめ機能があります。これはAtlasがユーザーのアクティビティを基に生成され、ユーザーが興味を持つ可能性のあるニュース記事やエージェント作業を提案できます。Atlasを使うほど、レコメンドはさらに正確になります。GitHubの例では、コード作業をしながらサイドバーにChatGPTを招待し、ウェブページの内容を理解して編集することができます。これにより、情報を単に表示するツールから、情報を理解して編集できるツールへと変わります。
タブを開く
新規タブページがAtlasの起点です。質問をしたりURLを入力したりすると、一か所でより速く有益な結果を見られます。チャット以外に、より具体的な種類の結果を探索したい場合は、タブで検索リンク、画像、動画、ニュース(利用可能な場合)を選択します。
ChatGPTに聞く
「ChatGPTにリクエスト」をクリックすると、ページでChatGPTサイドバーを開き、要約、説明、作業をその場で処理できます。ChatGPTはユーザーがいるページの詳細情報を確認できるため、回答がより有用で、常に適切なコンテキストを提供します。
カーソルを使う
ChatGPTは、あらゆるプレーンテキスト画面で文章作成時のインライン編集や提案を提供するのに役立ちます。
パーソナライズされた提案
ChatGPTは、ユーザーが探ってきた内容を記憶し、過去ページへ戻る、テーマをさらに深掘りする、関連するアイデアを提示する、日常的な作業を自動化するなど、次に何をすべきかを提案できます。
聞いてみる
必要なことがあればいつでも聞いてください。
「昨日見た靴を再度開く」や「タブを整理する」と入力すれば、残りはChatGPTが処理します。
その他
ブラウザメモリをオンにすると、ChatGPTはユーザーが検索したコンテンツの主要な詳細を覚え、チャット応答を改善します。最近のアクティビティからToDoリストを作成したり、確認済みの製品に基づいて年末プレゼントを継続的に調査したりなど、より賢い提案を行います。ブラウザメモリはChatGPTアカウントとユーザーの管理下で非公開保存されます。
設定で全メモリを確認し、不要になったメモリを保持したうえで検索履歴を削除して消去できます。ブラウザメモリがオンでも、アドレスバーのトグルでChatGPTが閲覧できるサイトと閲覧できないサイトを決定できます。可視性がオフの場合、ChatGPTはページコンテンツを閲覧できず、当該サイトではメモリは生成されません。
デフォルトでは、閲覧コンテンツをモデルの学習に使用しません。選択したコンテンツについては、データコントロール設定で「web browsingを含める」を有効化でき、ChatGPTアカウントでチャット学習を有効化している場合、Atlasでもチャット学習を有効化できます。これには「ChatGPTに聞く」サイドバーで添付したウェブサイトコンテンツと、チャットへ情報を提供するブラウザメモリが含まれます。
子ども向け保護機能はAtlasでも動作します。保護者がChatGPTの子ども向け保護機能を設定している場合、それらの設定はAtlasのChatGPTとの対話へ引き継がれます。保護者がブラウザメモリやエージェントモードをオフにするオプションを含む、Atlas向けの新しい子ども向け保護機能も導入されています。
AtlasでChatGPTのエージェント機能を構築するにあたり、私たちは安全性を最優先し、ログイン済みサイトへのアクセスや履歴検索から生じうる新たなリスクに対処するための安全対策を追加しました。
- ブラウザでコードを実行したり、ファイルをダウンロードしたり、拡張機能をインストールしたりできません。
- コンピューターやファイルシステム上の他のアプリにアクセスできません。
- 金融機関など特定の機密サイトに対する操作について監視が必要か確認するため、一時停止される場合があります。
- ログアウトモードでエージェントを使うことで機密データへのアクセスを制限し、ウェブサイト上のように振る舞うリスクを減らせます。
ChatGPTのエージェント機能にはなおリスクがあります。エージェントはユーザー代行で行動する際の誤りだけでなく、隠れた悪意ある指示にも脆弱であり、これらの指示はChatGPTエージェントの意図した行動を無視するために、ウェブページやメールなどの場所に隠されている可能性があります。そのためログイン済みサイトでデータを盗んだり、意図しない行動を取ってしまうことがあります。
ChatGPTのエージェントシステムカードで説明されているように、私たちは数千時間にわたり本格的なレッドチーミングを実施しており、特にChatGPTが新たな攻撃へ迅速に適応できるよう安全対策を設計するなど、これらの攻撃からの保護を重視してきました。しかしAIエージェントの人気が高まるにつれ起こるすべての攻撃を防げるわけではありません。ユーザーはエージェントにどの情報を提供するか決定する際にトレードオフを考慮し、AtlasでログアウトモードのChatGPTエージェントを使うか、エージェントの活動を監視するなど、リスクにさらされることを最小化する対応が必要です。私たちは発見された脆弱性を継続的に監視し、修正していきます。
今回のリリースは、ほとんどのWeb利用がエージェントシステムで行われる未来へ向けた一歩です。ここでルーティンを委任し、最も重要なことに集中できます。
検索機能とカーソルチャット
Atlasのエージェントモードは、Atlasがウェブを探索し、ユーザーのために作業を実行できる高度な機能です。
この機能は、ユーザーが自分で行うのが面倒な作業を代わりに実行したり、新しいソフトウェアの使い方を学ぶのを助けたりできます。OpenAIは、このエージェントがユーザーのブラウザと個人のインターネットに対してフルアクセス権を持つとどれほど強力になるかに驚かざるを得ないとしています。エージェントモードは安全性を重視しており、モデルから製品体験まで、スタック全体のあらゆる部分に安全対策が組み込まれています。
エージェントモードを通じて、ChatGPTはユーザーのブラウザを制御して作業を実行できます。
例えば、Google DocsでToDoリストを確認したり、まだ作業を入力していない人に通知を残したり、現在完了したすべての作業をLinearというタスク管理ソフトウェアへ移行したりできます。ユーザーはエージェントが行う作業をリアルタイムで確認できます。エージェントモードはユーザーのローカル認証と履歴にアクセスでき、ユーザーの自然な拡張のように感じられるよう設計されています。
エージェントモードの活用例と安全面の考慮事項
エージェントモードは個人的な用途にも利用できます。
例えば、料理レシピページで必要な材料を把握し、必要量を計算し、食料品店で買い物リストを作成するよう依頼できます。ChatGPTはユーザーの好む買い物先を覚えて、該当サイトへ移動し、カートに必要な項目を追加できます。エージェントモードは、ユーザーが買い物リストを確認し、必要なら項目を追加・削除できるよう助けます。
ChatGPTエージェントがユーザーのブラウザを共有することは、新たなリスクをもたらす可能性があります。
このためOpenAIは、ChatGPTエージェントがユーザーのタブでのみ動作し、コンピューター上でコードを実行したり他のファイルへアクセスできないよう安全対策を設けています。また、ユーザーは、ChatGPTエージェントがログイン済みサイトやデータへアクセスするかを決定でき、必要に応じてシークレットモードを使用できます。Atlasはユーザーが個人情報を保護しながらエージェントモードを安全に使えるよう、さまざまなオプションを提供します。
今後の計画
OpenAIは、ChatGPT Atlasが多くのユーザーから愛されることを期待しています。
現在、macOS版から順次全世界ユーザー向けに提供が始まっており、エージェントモードはPlusおよびProユーザーにのみ提供されます。Windows版、iOS、Android版もまもなく順次公開される予定です。ユーザー定義の指示がウェブ上でユーザーを追跡し、ユーザーをよりよく理解したエージェントがユーザーのために作業を行い、ユーザーが望むものを先回りして提示するというアイデアを発展させる計画です。今後はユーザーからのフィードバックを積極的に取り入れ、ChatGPT Atlasをさらに進化させていくと述べています。
3件のコメント
私も公開当日にダウンロードして使ってみたのですが、上の方々と同じ現象を確認しました。
エラーと思われる点なので、パッチが提供されると思います
韓国語入力時に文字が分解されてしまう人は、意外とかなり多いみたいですね。
先ほどインストールして試してみましたが、私の環境ではジャソ分離が有効になりませんでした。バージョンは Tahoe(26.0.1)を使用しています。