35 ポイント 投稿者 GN⁺ 2025-03-28 | 4件のコメント | WhatsAppで共有

チャットボット革命で出遅れたグーグルの危機の始まり

  • 2022年12月、シシー・シャオ(Sissie Hsiao)は、グーグルのChatGPT対抗製品を100日以内に開発する任務を与えられた
  • シャオは16年以上勤務したベテランで、数千人を率いてきたが、今回のように深刻な危機的状況は初めてだった
  • OpenAIがChatGPTを公開した後、事実誤認や数学のミスがあったにもかかわらず、ユーザー数は急速に100万人以上へと増加した
  • 一部ではChatGPTをグーグル検索の代替と見なし始め、これはグーグル最大の収益源に対する脅威だった
  • グーグルは独自の言語モデルLaMDAを保有していたが、公開アクセスは制限的で、デモ内容さえ「犬の話」に限られていた
  • **ウォール街(金融市場)**は不安視しており、かつてCEOのスンダー・ピチャイは「AIファースト時代」を宣言し、知能型アシスタントがデバイスを代替すると語っていたが、現実は期待に及ばなかった
  • Transformerアーキテクチャを生み出したのもグーグルの研究者8人だったが、彼らは退職するか、成果を残せないまま去っていった
  • シャオが管理していたGoogleアシスタントは、タイマー設定や音楽再生程度にしか使われていなかった
  • Gen Z世代向けに料理のアドバイスや歴史クイズを提供する未完成のチャットボットがあるだけだった
  • 2022年末までにアルファベット株は前年比39%下落し、AI先導企業としてのグーグルの立場は揺らいでいた

グーグルのAI危機対応と戦略転換

  • 2023年初め、グーグルの取締役会はAIに関するリアルタイム報告を求めた
    • 共同創業者であり主要株主でもあるセルゲイ・ブリンも直接戦略レビューに参加
    • 従業員には「スタートアップのように動け」というメッセージが伝えられた
  • 以前は、多くの社員が製品に反対はできても承認権限は持たない文化だった
  • 現在は、より大きなリスクを取り、より速く実行する文化へと転換している
  • シシー・シャオは100日プロジェクトを始めるにあたり、チームに独特の原則を示した:
    速度より品質、しかし迅速に(Quality over speed, but fast)
  • 別の上級幹部**ジェームズ・マニカ(James Manyika)**は、AI戦略を根本的に変える役割を担った
    • オックスフォード出身のロボティクス博士で元マッキンゼー顧問、2022年にグーグルへ入社
    • ピチャイにDeepMindとGoogle Brainの統合を提案した
  • DeepMind(ロンドン、デミス・ハサビスが運営)とGoogle Brain(マウンテンビュー、ジェフ・ディーン管轄)は別々に運営され、リソースを非効率に消費していた
    • OpenAIの公開後、3人のリーダーが統合計画を取締役会に提案
    • ハサビスはプロジェクト名として「Titan」を提案したが却下され、ジェフ・ディーンの案だった「Gemini」に決まった
  • マニカはその後、グーグルが大胆で責任ある選択をしてきたと言及した
    • ただし「常に正しい選択ばかりをしてきたわけではない」とも認めた
    • 緊迫した状況の中、社員の間では「グーグルがヤフーのようになるかもしれない」という不安まで広がった
    • シャオは当時を「マラソンを全力疾走している気分」と表現した
  • しかし2年が過ぎた現在、アルファベット株は過去最高値を更新
    • 投資家はグーグルのAI競争力回復に楽観的な見通しを示している
  • WIREDはこの時期を、グーグル史上もっとも混乱し、文化的変化が大きかった時期と評価した
    • エンジニア、マーケティング、法務、安全専門家など50人以上の現職・元職員にインタビューを実施
    • 今回の記事ではグーグルの変化を初めて上級幹部たちの証言を通じて詳しく照らし出す

Bard開発:全社的優先順位とリソース集中

  • ChatGPTに対抗するため、グーグルは新しいチャットボットプロジェクトを開始、コードネームはBard
  • シシー・シャオは約100人の人材をグーグル全社から直接招集した
    • 管理職は反対できず、Bardプロジェクトが最優先課題だった
  • シャオは技術力と感情知能を備え、大局を見られる人材を選別した
  • 大半はカリフォルニア州マウンテンビューに配置され、役割を問わず柔軟に業務をこなした
    • Team Bardはあらゆる役割を担うチームだ」という哲学を強調
  • 2023年1月、グーグル史上初の大規模レイオフを発表:約1万2,000人、全体の7%規模
  • 一部の社員は、残業や追加業務をしなければ解雇されるかもしれないという恐怖に苦しんだ
    • 子どもを寝かしつける時間を諦めて夜間会議に参加したケースも多かった
  • Bardは既存のLaMDAを基盤としていたが、知識更新と新たな安全装置が必要だった
    • インフラチームは最優秀の技術者たちを再配置し、サーバー確保とシステムチューニングに集中
    • データセンターは電力使用量がほぼ限界に達し、機器の過熱リスクが発生
    • そのため、電力需要をより安全に処理できる新しい管理ツールも迅速に開発された
  • 緊張を和らげるため、ユーモアも生まれた
    • あるチームメンバーはカスタムポーカーチップを作り、特定のチップ名を刻んでエンジニアの机の上に積み上げながら、「さあ、チップを持っていって」と冗談を言った
  • Bardは初期の数週間、計算資源を強化したにもかかわらず既存の問題を繰り返した
    • ChatGPTと同様にBardも、ハルシネーション(hallucination)不適切または不快な応答を頻繁に生成した
    • 初期バージョンでは、深刻なほど滑稽な人種的ステレオタイプがしばしば発生した
      • インド系の名前を入力するとその多くを「ボリウッド俳優」とし、中国系男性の名前は「コンピュータ科学者」として描写した
    • 元社員によれば、Bardの応答は「危険ではなかったが、ただ愚かだった」という評価だった
    • 一部の社員はBardの突拍子もない応答をスクリーンショットで共有して笑いものにした
      • 例:"Three 6 Mafiaスタイルで海に車のバッテリーを捨てるラップ"を頼むと、人をバッテリーに縛りつけて海に沈める内容まで生成した
  • グーグルには、決められた100日の間にできる限り多くのエラーを潰すこと以外に方法がなかった
    • 児童虐待画像の検知などを担当していた外部契約スタッフまでBardのテストに投入された
    • ピチャイは自由時間のあるすべての社員にBardのテストを要請し、結果として約8万人がテストに参加した
  • シャオと経営陣はBardのミスを完全には防げないと認識し、製品自体を「実験(Experiment)」として位置づけた
    • これはOpenAIがChatGPTを「リサーチプレビュー」と紹介した戦略に似ていた
    • ユーザーや外部評価者に完成品ではないことを強調することで、ブランド毀損リスクの最小化を図った
    • このような戦略は、かつてMicrosoftのTwitterチャットボットTayがナチス発言をした事件以後、業界で広く認識されるようになったリスク回避策だった

Bardのリリース過程と致命的な失敗

  • かつてのGoogleでは、AI製品のリリース前に「責任あるイノベーションチーム」が数か月かけてバイアスや欠陥の検証を行っていた
    • Bardの場合は、スケジュールの圧力により検証プロセスが大幅に縮小された
    • 最高法務責任者のケント・ウォーカー(Kent Walker)は迅速な公開を主張した
    • 新モデルや新機能があまりに速いペースで登場し、レビューチームは残業や週末勤務をしても追いつけなかった
  • Bardの公開延期を求める警告もあったが、無視されるか無力化された
    • これに対しGoogleはWIREDに対し、「いかなるチームも公開反対を正式に勧告していない」と主張
      • 多くのチームがテストに参加しており、特定のチームが全面的に責任を負う構造ではなかったと説明した
  • 100日プロジェクトのおよそ3分の2にあたる2023年2月、GoogleはChatGPTがBing検索に統合される予定との情報を入手
  • 検索市場シェアでは依然としてGoogleが圧倒していたが、生成AI機能の不在は長期的な脅威だった
  • 株価下落を避けるため、Microsoftの発表前日の2月6日、ピチャイはBardの限定テスト公開を電撃発表した
  • マーケティング動画では、Bardは**「情報を整理する」というGoogleの使命を継承するAIアシスタント**として描かれた
  • 動画内の質問: 「James Webb宇宙望遠鏡の新発見のうち、9歳の子どもに説明できるものは?」
    • Bardの回答: 「JWSTは太陽系外惑星の最初の写真を撮影した」
  • 直後にReutersが事実誤認を報道: その写真は宇宙望遠鏡ではなく**地上望遠鏡(VLT)**が撮影したものだった
  • Alphabet株は9%下落し、時価総額で約1000億ドルを喪失
  • チーム内部には衝撃が走った
    • 質問を作成したマーケティング担当者は自責の念にかられ、同僚たちは「法務チームもPRチームも確認したが、誰もミスに気づかなかった」と慰めた
    • ChatGPTにも誤りは多かったため、このような小さな誤解が株価に大きく影響するとは予想できなかった
  • シャオはこれを「無邪気なミス」と表現
    • BardはGoogle検索結果をもとに回答を構成しており、NASAブログの「最初の写真」という表現を誤解した可能性がある
    • リーダーシップは「この件で誰も解雇されない。だが迅速に教訓を得なければならない」と強調した
  • シャオ: 「私たちはスタートアップではなくGoogleだ。技術的な欠陥として片づけることはできない。必ず責任ある対応をしなければならない」
  • Bardチーム外部の不満も高まった
    • 社内フォーラムMemegenには「Bardの公開と人員整理は、性急で、失敗し、近視眼的だった」という批判投稿が掲載
    • Googleロゴがゴミ箱の中で燃える画像も共有された
  • それでもGoogleはBardにさらに多くのリソースを投入
    • 数百人を追加配置し、チーム文書にはピチャイのプロフィール写真アイコンが毎日現れるほど直接的に関与していた

GPT-4の登場と技術格差

  • 2023年3月中旬、OpenAIのGPT-4公開はGoogle社内に再び衝撃を与えた
    • ある上級研究者: 「口があんぐり開いたし、Googleはもっとスピードを上げる必要があると痛感した
  • その1週間後、Bardは米国と英国で正式公開
    • ユーザーはメール作成やレポートの下書きなどで有用だと評価
    • しかしChatGPTも同じことをよりうまくこなしており、乗り換えを促す動機は弱かった
  • ピチャイはHard Forkポッドキャストで、Googleは「チューニングしたCivicで強力なスポーツカーと競争していた」と自嘲
    • 結論: 「より良いエンジンが必要だ

Gemini開発: DeepMindとGoogle Brainの統合、そして文化衝突

  • 2つのAI研究組織の違い
    • DeepMindはAlphabetの「Other Bets」に分類され、長期的な科学・数学上の問題解決に集中
    • Google BrainはGmailの自動補完や曖昧な検索語の処理など、商業的に実用的なAI技術を主に開発
  • 元上級エンジニアによれば:
    • Google Brainは自律性重視で、ジェフ・ディーン(Jeff Dean)は「人々が自分でやるに任せる」スタイルだった
    • 一方のDeepMindは統率の取れた軍隊のように動き、デミス・ハサビス(Demis Hassabis)は「単一の指揮官の下にある高効率組織」を運営していた
  • ディーンはニューラルネットワーク研究のベテランで、Google創業初期から活動してきた
  • ハサビスはビジョン主導型のリーダーで、AIによる病気の治療を夢見ており、「見て、聞いて、助けるAIエージェント」を構想していた
  • Google DeepMind(GDM)の発足

    • 2023年4月、Googleは両組織を統合してGoogle DeepMind(GDM) を発足
      • ハサビスが統合組織のCEOに任命された
      • 社内の空気は「目的がよみがえった」「遊びの時間は終わった」だった
    • Geminiモデルを迅速に構築するため、8つのタイムゾーンをまたぐ協業が必要だった
    • 何百ものチャットルームが作られ、徹夜で働く文化が定着
      • ハサビス: 「一日一日が一生のように感じられる
    • GDMはマウンテンビューのGradient Canopyというセキュリティ保護された建物へ移転
      • ドーム型の構造物で、アート作品に囲まれていた
      • 同じフロアにピチャイCEOのオフィスがあった
    • **セルゲイ・ブリン(Google共同創業者)**が頻繁に訪れて激励した
    • 出社日数の増加が求められ、一般のGoogle社員はこの建物に立ち入れなかった
    • GDMの中核コードにも他組織からはアクセスできなかった
  • GeminiプロジェクトがGoogleのリソースを吸収するなか、ヘルスケアや気候変動など他分野の研究者はサーバー不足に悩まされた
  • 論文発表の制約も生じ、研究者たちの不満は高まった。論文は主要なキャリア資産だからだ
    • GoogleはOpenAIに情報が流出する可能性を懸念し、制約を強化した
    • Geminiの訓練レシピは企業の生存を左右する中核資産だった
  • GeminiもBardと似た問題に直面した
  • Googleの機械学習・クラウドAI部門バイスプレジデント、アミン・ヴァーダット(Amin Vahdat):
    • 10倍の規模に拡張すると、あらゆるものが壊れる
  • 公開を前に、ヴァーダットは専任のwar roomを設置し、バグやシステム障害の解決に集中した

Gemini公開前の最終点検と倫理的な葛藤

  • Google DeepMind(GDM)の責任ある開発チームは、Gemini公開前の製品レビューに総力を挙げた
    • モデルは強力だったが、それでも奇妙または不適切な応答を生成するケースが残っていた
  • 公開された報告書によれば:
    • 医療アドバイスいじめ関連の応答には特に改善が必要だった
    • 画像入力時、「この人の学歴は?」のような質問に対して根拠のない推論を行う問題も発生
  • 責任あるイノベーション担当ディレクターのドーン・ブロックスウィッチ(Dawn Bloxwich)は、これを「公開を止めるレベルではない」と判断
    • しかし大衆の創造的な(あるいは奇妙な)使い方まで予測する時間は足りなかった
  • この時点でGoogleは速度を落とすこともできたが、そうしなかった
    • OpenAIはすでに「AI界のKleenex」となっており、世界的な注目を集めていた
    • ChatGPTは技術への希望と社会問題の象徴になっていた
    • 労働者は仕事への脅威を感じ、クリエイターはデータ搾取への補償を求めた
    • 親たちはチャットボットが子どもに不適切な内容を伝えうることを認識していた
    • AI研究者の間では「p(doom)」――技術が人類を脅かす確率――が議論されていた
  • 伝説的なGoogle AI科学者ジェフリー・ヒントン(Geoffrey Hinton)は、倫理的懸念から2023年5月に退社
    • AIが偽情報や高度に洗練された毒物によって人類を脅かしうると警告した
  • ハサビスも、さらに時間が必要だと感じていたが、それでもなお万能AIアシスタント病気の治療という夢に向かって前進した

Gemini公開と最初の成功

  • 2023年12月、グーグルはGeminiを正式に公開
    • リリース後に株価が上昇
    • 32の標準テストのうち30でChatGPTを上回る
    • 論文やYouTube動画の分析、数学・法律関連の質問への応答能力を強化
  • ハサビスはロンドンオフィスで小規模な祝賀パーティーを開催
    • 「私は祝うのがあまり得意ではない。いつも次のことを考えている」と振り返った
  • 同じ月、ジェフ・ディーンは「Goldfish」という新しいチャットルームに招待され、次の技術的進展を知る
    • 名前は冗談だが、中身は正反対で、長い記憶力を持つGeminiのバージョンを開発していた
  • 高速チップネットワークによる分散処理を通じて、数千ページのテキストやテレビシリーズ全体の分析も可能
    • この技術は「ロングコンテキスト(long context)」と呼ばれる
  • ディーン、ハサビス、マニカは、これをグーグルのAI製品群に統合する方法を模索
  • マニカが最初に望んだ機能は、PDFを自動でポッドキャスト形式に要約する機能だった
    • 「arXivに毎週押し寄せる論文をすべて追うのは難しい」とWIREDに語った

Gemini移行後の安定と新たな危機

  • コードレッドから1年後、グーグルの雰囲気は回復基調に転じた
    • 投資家は静かになり、BardとLaMDAは**「Gemini」という単一ブランド**に統合された
  • シシ・シャオのチームは、テキストから画像を生成する機能の開発でOpenAIとの差を縮めた
  • Gemini Liveという新機能も準備中だった
    • ユーザーが友人や相談相手のように長い会話を継続できる機能だ
  • 強化されたGeminiモデルのおかげで、経営陣は自信を回復
  • 安定化ムードの中でも、CEOのピチャイは追加の構造改革を指示
    • 広告売上は伸びたものの、ウォール街の期待には届かなかった
    • プライバシーおよびコンプライアンス責任者まで退任
      • ユーザー保護を担っていた上級幹部の退任は、「懸念は認めるが、進行の妨げは禁止」というメッセージとして受け止められた
  • 画像生成器そのものは比較的簡単に構築できたが、レビューは骨の折れる反復テスト作業だった
    • 問題のある応答が出ないよう、フィルタリング用の命令文を作成しなければならなかった
  • テストにすべての社員がアクセスできたわけではなかったため、少数の人員に過度な負担が集中した
    • 例: 「rapist(強姦犯)」というプロンプトで肌の色が濃い人物が高頻度で生成される → 人種バイアスへの懸念
    • これを受けて、人物画像そのものを生成不可にすべきだという社内要請もあったが、退けられた
  • ある元レビュアーは「何が何でもリリースするという空気だった」と振り返る
    • 懸念が受け入れられずに退職したレビュアーもいた
  • 2024年2月、画像生成器がGeminiアプリ内で正式リリース
    • 予想されていた人種差別的・性差別的な画像問題はほとんどなかったが、逆方向の別の問題が発生した
  • 例: 「1800年代の米国上院議員」という画像を要求すると、黒人女性、アジア系男性、先住民女性の画像が生成された
    • 白人男性はまったく生成されなかった
  • さらに衝撃的な例として、ナチス・ドイツの兵士が有色人種として生成された
  • これに対し、米共和党議員やイーロン・マスクらがグーグルの「woke AI」を強く批判
    • マスクは関連チームの社員を実名で挙げて集中的に攻撃し、その社員はSNSアカウントを閉鎖し、身の安全への懸念まで抱くことになった
  • グーグルは人物画像生成機能を全面停止し、Alphabetの株価も再び下落
  • 論争直後、グーグルの幹部数十人が緊急協議を開始
    • 副社長やディレクターらがロンドンへ飛び、ハサビスと対面で会議した
  • 結果:
    • ハサビスのチーム(Geminiモデル)シャオのチーム(Geminiアプリ) の双方に、信頼性・安全性の専門家採用が承認された
    • 合計15件の「Trust & Safety」関連の新規ポジションが設けられた
  • Gradient Canopy本社で、シシ・シャオは画像生成問題を解決する時間をチームに十分与えた
  • ジェームズ・マニカとともに、Geminiに関する公開原則(public principles) を新たに策定
  • この原則はすべて**ユーザー中心の表現(“you”)**で書かれている
    • Geminiは「あなたの指示に従う
    • あなたの必要に合わせて調整される
    • あなたの体験を保護する
  • 重要な強調点の1つは次の通り
    • Geminiの応答はグーグルの立場や信念を反映しない場合がある
    • Geminiの出力の大半はあなたが求めたものに基づく—Geminiはあなたが作るものだ
  • これは将来問題が起きた際に、グーグルの責任を最小化できる論理的な装置でもある
  • しかし、こうした原則についてグーグル自身がどのように責任を負うのかは明確にされていない

AIポッドキャスト実験: Westminster Watch

  • 2024年3月の午後6時30分ごろ、Gradient Canopyのイエローゾーンで興味深い実験が公開された
  • Google Labs所属の社員2人が、ジョシュ・ウッドワード(Josh Woodward) に新しいプロジェクトを披露
    • ウッドワードは、グーグルの実験的新製品を素早く立ち上げるGoogle Labsの責任者だ
  • プロジェクトの内容:
    • 英国議会の会議録(transcripts)ロングコンテキスト機能を搭載したGeminiを活用し
    • AI司会者のKathとSimonが進行するポッドキャスト『Westminster Watch』を生成する
  • 最初のエピソードでのSimonのオープニングコメント:
    • 「今週も議会では、たっぷりのドラマと討論、そしてちょっとした歴史までありましたね」
  • ウッドワードはこの実験に深い印象を受け、その後ピチャイを含む主要人物たちに直接共有した

AI音声要約と検索革新、そしてもう一つの論争

  • AIが文書や会議録をポッドキャスト形式で要約する機能であるNotebookLM Audio Overviews
    2024年5月のGoogle I/Oで正式発表
  • ジョシュ・ウッドワードによれば、中核チームは昼夜を問わず数千本のAIポッドキャストをテストしながら開発を進めた
  • しかし発表会場では、別の2つの発表がより大きな注目を集めた:
    • Astra: リアルタイム映像分析が可能な次世代AIアシスタント(ブリンが自ら実演)
    • AI Overviews: 検索結果を要約してページ上部に表示する機能
  • Project Magiチームが開発したAI Overviewsは、検索結果を要約して**要約ボックス(Box)**に表示
  • 初期の責任あるイノベーションチームは、バイアス・正確性の問題およびトラフィック減少による倫理的影響を懸念し、監視を要請
    • しかしプロジェクトはチーム再編と分散作業によって体系的な監視が難しくなった
  • リリース後、奇妙な応答事例が多数発生:
    • 「1日に石を何個食べるべきですか?」→「UCバークレーの地質学者によれば、1日に小さな石を1個摂取することが推奨されます」
    • 「ピザにチーズがくっつきません」→「無毒のりを1/8カップ、ソースに追加してください」
  • こうした応答の大半はRedditの冗談投稿などインターネット・ミームに由来していたが、
    AI Overviewsは事実のように提示し、信頼性の問題を生んだ
  • グーグルは一時的にこの機能の表示を減らし、再調整を行った
  • グーグル社内の反応とユーザーフィードバック

    • 検索部門の主席科学者パンドゥ・ナヤク(Pandu Nayak):
      • 「すべての問題を事前に防ぐことはできない。私たちにできるのは継続的な改善を約束することだけだ」
      • 「うまく動いているとき、人は黙っている。おかしいときだけ不満を言う」
    • 社内では正確性への懸念を提起していた社員たちが失望
      • Bard→Gemini、画像生成器、AI Overviewsまで「虚構生成機の連続」だと評価
      • 情報へのアクセス性を高めるというグーグルの使命が、「たわごとの書き取りツール」へと転落しつつあるとの懸念も出た
    • 一方で、検索チームはユーザー満足度に注目
      • AI Overviewsはオフにする選択肢なしで全面維持
      • その後、Google Maps、天気アプリなどにもAI要約機能を導入
    • Pixel向け天気アプリの例:
      • 従来のグラフィックだけで十分だという一部エンジニアの意見もあったが、テスト結果では90%が「良い」フィードバック
  • 回復の兆しと戻ってきた人材たち

    • 2024年12月、ChatGPTの衝撃から2年を経て、ジェフ・ディーンは前向きな雰囲気でWIREDの取材に応じた
      • Geminiモデルが公開ベンチマークで1位を達成
      • ある幹部は通勤時に姉妹の代わりにGemini Liveと会話していると語った
    • NVIDIA CEOのジェンスン・フアン(Jensen Huang)NotebookLM Audio Overviewsを強く推薦
    • 過去に慎重すぎる文化への不満から去っていた人材も復帰
      • **Transformerの考案者の一人であるノーム・シャジア(Noam Shazeer)**も再び合流
        • かつてはLaMDAを外部公開しない会社方針に失望して退職していた

Geminiの未来、課題、そしてAI戦争の継続

  • グーグル社内の空気と成長への自信

    • ジェフ・ディーンはインタビューで過去の判断ミスを認めつつ、今やグーグルはリスク回避から抜け出して前進していると評価
    • 現在、グーグルの主要サービス7つ(Chrome、Gmail、YouTubeなど)はすべてGeminiベースの機能を導入中
    • ディーン、ノーム・シャジア、ほかのリーダーたちは全社的な要求事項を調整中:
      • 日本語翻訳の改善
      • コーディング機能の強化
      • Astraで使われるリアルタイム映像分析の改善 など
    • ディーンとシャジアはアイデアを共有するため、Gradient Canopyのマイクロキッチンで頻繁に会議
  • AIコンテンツ生成中心へと戦略拡大

    • シャジア: 「情報を整理することは1兆ドル市場だが、今クールなのは1000兆ドル(Quadrillion)だ」
    • アルファベット株はChatGPT登場時の底値と比べてほぼ2倍に上昇
    • ハサビスは今やシャオのGeminiアプリチームもあわせて統括し、AIで病気を治療する未来は遠くないと確信
      • 「私たちはどの組織よりも最も幅広く、かつ深い研究基盤を持っている」とWIREDに語った
  • 収益性の問題と広告モデルへの回帰

    • 現時点で大半のユーザーはAI機能に直接お金を払う意思がない
    • グーグルはGeminiアプリに広告を挿入する方式を検討中
    • これはシリコンバレーの伝統的戦略:
      • 「あなたのデータ、時間、関心を提供し、私たちが作ったすばらしいツールを無料で使ってください」
      • 免責同意欄にチェックを入れさえすれば、グーグルは責任を負わない
  • 市場競争とインフラ負担

    • Sensor Towerの資料:
      • ChatGPTアプリの累計ダウンロード数: 約6億件
      • Geminiアプリ: 約1億4000万件
    • AI競合は多数存在:
      • Claude、Copilot、Grok、DeepSeek、Llama、Perplexityなど
      • その多くはグーグルの直接競合または投資先
    • 生成AIは数十億ドル規模の投資と莫大なエネルギー消費を必要とする
      • 老朽化した石炭火力発電所や原子炉の寿命を延ばさなければならないほどのエネルギー使用
      • 業界全体がいまだ収益化の方法を明確に見いだせていない
  • グーグルが直面する追加リスク

    • 今後数年で、検索広告売上の最大25%が独占禁止訴訟によって失われる可能性(JP Morgan分析)
    • 社内でも財務補填への圧力認識が高まっている
      • シャオのチームの一部は3年連続で冬季休暇なしで勤務
      • 共同創業者ブリンは最近社員に対し、「週60時間労働がAI競争で最も効果的なsweet spot」だと述べた
    • WIREDの取材に応じた社員たちは、継続的な解雇、燃え尽き、法的リスクへの不安が深いと語った
  • AGIへの執着と哲学的課題

    • ハサビスは依然として**AGI(汎用人工知能)**の開発目標を堅持
      • Astraのプロトタイプを手にロンドンを歩きながら、世界のあらゆるものを認識する未来を想像
    • しかしAGIは推論、計画、実行力がすべて向上してはじめて可能になる
  • OpenAIとの「エージェントAI」競争

    • 2025年1月、OpenAIはOperatorサービスを公開
      • 実際のウェブサイト上でクリックやタイピングを行い、作業を代行するエージェント型AI
      • 旅行予約、フォーム入力などが可能だが、速度は遅くエラーも多い
      • 料金プラン: 月額200ドル
    • グーグルも同じ方向へ機能を拡張中:
      • 現在のGeminiは献立を組めるが、今後のバージョンでは食材を買い物かごに入れ
        次の段階では玉ねぎを切る際のリアルタイムフィードバック提供まで目標としている
  • ミスは繰り返されても、スピードは止まらない

    • 2025年1月、スーパーボウル前の広告でGeminiは「世界のチーズ消費量の半分以上はゴーダ(Gouda)だ」と回答する、笑えない失敗をした
    • しかしグーグルはGeminiを単なる情報マシンではなく、生活の一部であり、人生コーチであり、万能アシスタントへと育てている
    • ピチャイは語る: 「私たちは慎重に前進している」
    • だが彼と経営陣は頂点に立てば、二度と再び後れを取りたくはないはずだ
  • AI競争は続く

4件のコメント

 
joone 2025-05-24

ところで、こういう話ってどうやって記事化されるのでしょうか? なんだかGoogleの宣伝記事のような文章に見えますね。
「私たちは一生懸命やっている」...

 
halfenif 2025-03-28

海外ドラマを見ている感じですね。

ところで、Appleはどこへ行ったのでしょうか?

 
ide127 2025-03-28

あのときのスプートニク・ショックを受けた時代みたいですね

 
GN⁺ 2025-03-28
Hacker Newsの意見
  • 当初は懐疑的だったが、GoogleはOpenAIとの競争でうまくやっていると思う。Gemini 2.0 ProとFlashモデルは素晴らしい。Deep Research機能もよく実装されている。コンテキストウィンドウはいまだに業界最高だ。検索、Gmail、Googleオフィススイート、Google Meet、Androidなどとの統合も優れている

    • 今では十分に優れたモデルを持ち、既存の製品ポートフォリオ、クラウドインフラ、現代の業務生活に深く根付いている
    • Appleと違って、より厳格でないプライバシーポリシーのおかげで、訓練データへのアクセス制限が少ない
  • Googleが直面している最大の問題は、万人向けの軽量モデルを導入しようとしていることだ。検索で使っているモデルはおそらく8B級で、Flash 2.0は悪くないが、それでも軽量モデルだ

    • 人々は今やGoogle AI/Geminiを、ひどい検索結果や質の悪い回答と結び付けている
    • 一方で、最先端モデルは強力であり、Gemini 2.5はAIの王座を獲得した可能性がある
  • OpenAIは上場企業ではなく、利益も出していない。Googleは利益を出している。それにもかかわらず、Google Meet/Zoomと同様にTransformerデコーダを製品化できなかったのは失策だった。(BERTのようなエンコーダは広く使われている)

  • Googleのリーダーシップは慎重なアプローチを取っており、製品のリリースもより完成度が高く見える。2000年代のAppleのような、魅力的な0から1への転換を感じる

  • Googleの主要な問題は、複数のグループが同じ製品を作り、ユーザーの注意を引くために競い合っていることだ

    • Google AI Studio、Geminiアプリ、Gemini Advancedユーザー向けGeminiアプリ、Vertex AI、NotebookLMなど、さまざまな製品がある
    • ChatGPT.comと比較される
    • Search Google. Search. 今のように右側のカラムに検索結果を広告付きで表示し、左側にGeminiを配置すれば簡単だ
  • 小口投資家として:Alphabet/Googleは、SundarではないCEOのほうがもっとうまくやれると思う

    • さらに:サブスクリプションに誘導するサービスを運営する企業への投資を検討すべきだ(例:YouTube Premium、かつてのNetflix)
  • Googleの問題は、技術に詳しくない人々がAIをGoogle(検索)とは別の製品として見始めていることだ

    • 検索の代わりにAI(例:ChatGPT)を使おうとしており、Googleはこの認識戦争で負けつつある。すぐに解決できる問題ではない
    • GoogleがAI分野で一般の人に示してきたものは、Bard(覚えている人はいる?)であり、今はGeminiに変わった
    • 差別化要因は何なのか? Googleは競合より多くの無料サービスを提供しているのか? 一般の人は数学の問題を解けるかどうかには関心がない
    • 人々がAIと検索を別物だと考えている限り、Googleは苦戦するだろう
  • GoogleのAI戦略に自信を持っているGooglerに会ったことがあるだろうか? 私が話した人たちは皆、深刻な懸念を抱いているようだったが、これは小さなサンプルかもしれない

  • Eric Schmidtが約10年前に「誰もがアシスタントを必要とするようになる」と言っていた気がする(おそらく2016年ごろ)。会話のようなものを実装できたはずなのに、なぜそうしなかったのか分からない。代わりにMailboxなどに関する仕事に没頭していた