- GoogleのGemini 3は、単なる対話型チャットボットを超え、コード作成・Web探索・ファイル操作など実際の作業をこなすデジタル同僚型AIへと進化
- 同時に公開されたAntigravityは、ユーザーのコンピューターにアクセスして自律的にプログラムを書き、Inboxシステムを通じて承認や支援を求めるエージェントベースのツール
- Gemini 3はユーザーの指示に従ってWebサイト構築、データ分析、論文執筆まで実行し、PhDレベルの研究遂行能力を示す
- エラーは依然として存在するが、それは判断力・理解の差のレベルであり、人間と協働する**「AIチームメンバー」的な形**に近い
- 記事は**「チャットボットの時代からデジタル同僚の時代への転換」**が起きていると強調し、人間はもはやAIのミスを直す存在ではなく、AIの仕事を指揮する管理者へと変わりつつあると述べる
Gemini 3の登場と3年間の変化
- ChatGPTの公開から約3年後に登場したGoogle Gemini 3は、AI進化の速度を示す事例
- 2022年のGPT-3.5時代には、単に段落や詩を生成する程度だった
- 2025年のGemini 3は、インタラクティブゲームを自らコーディングしてデザインするレベルに進化
- Gemini 3はユーザーのリクエストに応じて、「Candy-Powered FTL Starship Simulator」という実際に遊べるゲームを生成
- これは、かつてのAIが単にテキストを説明していた段階から、コードとインターフェースを直接実装する段階へ進化したことを示す
Antigravityとエージェント型AI
- GoogleはGemini 3とともに、Antigravityという開発者向けツールを公開
- これはClaude CodeやOpenAI Codexに似た、ユーザーのコンピューターにアクセスして自律的にコードを書くシステム
- AntigravityはInboxの概念を導入し、AIが作業中に承認や支援を必要とするとき、ユーザーに通知を送る
- ユーザーは英語で指示を出し、AIはそれをコードとして実行する
- 例として、筆者のニュースレター原稿ファイルを分析し、AI関連の予測を整理したWebサイトを自動生成
- AIはWeb検索・コード実行・ブラウザテストを行い、結果をNetlifyにデプロイ可能な形でパッケージ化する
協働型AIとしてのGemini 3
- Gemini 3は作業中、ユーザー承認の要求を通じて進行状況を透明に共有
- ユーザーはAIの提案を確認・修正しながら協働する
- このプロセスは**「AIの管理」**に近い体験
- AIは完璧ではないが、エラーは判断の違いや意図解釈のずれのレベルであり、従来のハルシネーション問題はほとんどない
- Gemini 3との協働は**「チームメンバーの管理」**に近く、単なるプロンプト入力以上の相互作用を強調する
研究遂行能力と「PhDレベル」の評価
- Gemini 3は研究用データセットの分析と論文執筆という課題を遂行
- 古いクラウドファンディングのデータファイルを復旧・整理し、新たな分析を実施
- 「スタートアップ・ビジネス戦略」をテーマにした14ページの論文を執筆
- AIは独自の仮説を立て、統計分析を行い、**独自指標(アイデアの独創性測定)**も作成
- 成果物は大学院生レベルの完成度を見せたが、一部の統計手法や理論展開は不十分
- 追加の指示を与えると品質は大きく向上
- 筆者は「PhDレベルの知能は遠くない」と評価
デジタル同僚への転換
- Gemini 3は考え、実行するパートナー型AIであり、世界中の数十億人がアクセス可能
- AI進化には減速の兆しがなく、エージェント型モデルの台頭とAI管理能力の重要性が浮き彫りになっている
- 筆者は「チャットボットの時代がデジタル同僚の時代へ移行中」と表現
- 人間はもはやAIのエラーを修正する存在ではなく、AIの業務を指揮する管理者へと変化
- 最後にGemini 3は、コードだけでブログ用のカバー画像を生成するなど、テキストを超えた創作能力も実演
- ただし、AIにコンピューターへのアクセス権を与える際にはセキュリティリスクがあるため注意が必要
1件のコメント
Hacker Newsの意見
こういう記事を見るたびに、いつも抜けている部分がある — 「それは良いのか、正確なのか」 という問いだ
edgeDetect(image)のような Sobelフィルタ のコードを書かせると、モデルごとに成功するかどうかが分かれていたこれまでAIとのインタラクションの大半が テキストボックス 中心だったのは興味深い
「幻覚(hallucination)」問題は依然として存在する
「PhDレベルの知能なのか?」という問いについては、大学院生として似た感覚を持つ
Googleの進歩は ソフトウェアだけでなくハードウェア においても起きている
Gemini 3は印象的だが、それでもなお 既存文献の限界 の中にとどまっている感じがする
GPT-3のリリース時期は2020年6月で、ChatGPTは3.5バージョンだった
「Human in the loop」が、AIのミスを直す人間 から AIを指揮する人間 へ進化しているという話は昔から聞いてきた
Claude CodeやAntigravのようなツールを ローカルシステムで直接実行 するのが安全なのか疑問がある