OpenAI CEOサム・アルトマンのSora、エネルギー、AI帝国構築に関するインタビュー
(a16z.substack.com)- a16zポッドキャストで、OpenAIのビジョンを個人向けAIサブスクリプションサービス、大規模インフラ構築、そしてAGI研究の統合として説明し、この3要素が垂直に接続された1つのスタックを構成すると強調
- OpenAIの目標は「個人向けAIサブスクリプションサービス」であり、研究・インフラ・消費者向け製品を垂直統合してAGI開発と実利用を同時に追求すること
- Sora公開の戦略的意図は、単なる動画生成製品の公開を超えて、社会が強力な動画モデルの登場に備えられるようにし、ワールドモデル開発を通じてAGI研究を前進させること
- GPT-5によってAI科学者の時代が到来しつつあり、モデルが実際に科学的発見を行う初期事例が現れていて、今後2年以内に重要な科学的発見が実現するとの見通し
- エネルギーとAIの融合、著作権におけるフェアユース原則の適用可能性、そしてAGIは予想よりも漸進的に到来し社会が適応する時間を持てるという楽観的な見通しを示し、AIが科学の進歩を加速させる時代はすでに始まっていると評価
OpenAIのビジョンと構造
- OpenAIは消費者向けAIサブスクリプションサービス、大規模インフラ、研究所の3つの柱で構成されている
- 目標は、個別最適化されたAIによってユーザーの文脈を理解し、真の個人アシスタントとして機能するサブスクリプションサービスを提供すること
- ほとんどの人が1つの個人AIサブスクリプションを持ち、一部は複数を使うようになると予想
- ユーザーはさまざまなサービスにログインし、専用デバイスを通じてAIを活用するようになる
- AIがユーザーを学習し、非常に有用に機能することが目標
- インフラはAGI開発とサービス提供を支えるための必須要素
- 現時点では、他社に生のインフラとして販売する計画はない
- 規模があまりに巨大なため、他用途を検討する必要が出る可能性は残している
- 人類史上最大のデータセンター、より正確には最大のインフラプロジェクトを構築中
- 当初は垂直統合に懐疑的だったが、現在は「垂直統合なしにAGIは実現できない」という立場へ転換
- 投資家視点からオペレーター視点への転換を経験
- 経済は効率的で企業は1つのことをうまくやればよいという理論は、OpenAIには当てはまらない
- OpenAIの物語は、ミッション達成のために想定以上のことをやらなければならない方向へ展開してきた
- iPhoneをテック業界が生み出した最も驚異的な製品と評価し、極度に垂直統合された事例として挙げる
- 研究が優れた製品を可能にし、インフラが研究を可能にするという垂直スタック構造が必要
Sora公開の戦略的意図
- Soraは表面的にはAGIと無関係に見えるが、ワールドモデル構築はAGIにとって重要になると見ている
- ChatGPTが社会をAGIに備えさせたように、Soraも社会がAI生成動画の現実的な波及力に適応するのを助ける役割を持つ
- 動画はテキストよりも感情的共鳴がはるかに大きいため、社会がそれを理解することが重要
- まもなくディープフェイクや望むものを何でも見せられる驚異的な動画モデルが登場するだろう
- AIは効率的であるだけでなく、楽しさも提供すべき
- 計算資源全体の中で大部分を割いてはいないが、絶対量としては相当な資源を投入している
- 新しいSoraはソーシャルネットワーキング機能を追加し、興味深い方向へ進化している
- 「社会と技術は共に進化しなければならない」として、AI登場前に実験し適応する過程の重要性を強調
AI科学者の登場
- GPT-5を通じてAIが科学的発見を行う初期事例が現れている
- 新しい数学的発見、物理学や生物学研究における小さな貢献事例
- 今後2年以内にモデルがより大規模な科学を行い、重要な発見をするだろうと予想
- サム・アルトマンは、チューリングテストに近いものはAIが科学を遂行できる能力だと考えている
- それは世界に本当の変化をもたらす
- 科学的進歩は長期的に世界をより良くする最も重要な要素
- チューリングテストはすでに通過したが、世界は不可能なほど大きく変わったわけではない
- AGIも同様に到来するが、シンギュラリティは実際には起こらず、予想より漸進的に変化するだろう
- 猛烈な勢いで研究が進んでも、社会は予想より速く学習すると見ている
- 人間と社会は思っている以上に適応力が高い
- AGIが来るという認識の更新を経験し、それを受け入れ、平静を見いだす
- 想像よりはるかに連続的な変化になる
AI-人間インターフェースの進化
- モデルはすでに基本的なチャットボット対話の面では非常に高い水準に達している
- しかし「がんを治して」のような依頼はまだ実行できない
- テキストインターフェースのスタイルはなお大きく発展しうる
- リアルタイムレンダリング動画がインターフェースになる世界へ拡張していく
- AIが周囲の環境を認識し、必要な瞬間だけ情報を表示するアンビエントデバイス
- テキスト通知を無差別に送るのではなく、文脈を理解して適切なタイミングで情報を提供
- 長期的には「AIがユーザーを理解し、先に最適な会話スタイルを決めるインターフェース」へ進化する
- ユーザー個別化の重要性
- 数十億人が同じ頭脳と会話するのは不自然
- ユーザーごとに望むAIの振る舞いは大きく異なる
- ChatGPTがユーザーにインタビューし、好みを把握して自動調整する方向へ進化している
インフラ、協業、そしてエネルギー
- OpenAIはAMD・NVIDIA・Oracleなどと協業しながら、大規模インフラ拡張を進めている
- OpenAIの存在理由はAGI構築であるため、研究が優先され、GPUは製品より研究へ優先配分される
- 新機能がバイラルに広がるような特殊な場合のみ例外
- 大規模容量構築の目的は、こうした痛みを伴う意思決定をしなくて済むようにすること
- 優れた研究文化は、初期段階の投資会社を運営するのに似ている
- 創業者に賭け、支援するやり方
- 製品会社を運営するのとは異なるアプローチ
- エネルギーについては「豊富で安価なエネルギーこそ人類の質を高める鍵」と強調
- 短期的には天然ガス、長期的には**太陽光+蓄電および先進原子力(SMR・核融合)**が主流になるとの見通し
- 原子力規制の緩和が必須であり、価格が急激に下がれば移行速度も非常に速くなると説明
モデル能力の評価
- 静的ベンチマークスコアは関心を失いつつあり、ひどくゲーム化されている
- 科学的発見が長期間使える評価指標になる
- 収益も興味深い評価指標として考えられている
AI安全性と規制に関する見方
- 技術がまだ本当に恐ろしく巨大なリスクを生んでいないからといって、今後もそうだという意味ではない
- 本当に奇妙で恐ろしい瞬間がいくつか起こると予想
- 過去の技術と同様に、いくつか本当に悪いことが起きるだろう
- 「AI技術は必然的に危険な瞬間を迎える」として、社会的セーフガード構築の必要性を認める
- 大半の規制は多くの欠点を持つ可能性があるため、超高性能モデルにのみ限定的な規制を適用する案を提示
- モデルが本当に極めて超人的な能力を持つようになったとき、そのようなモデル、そしてそのようなモデルだけが非常に慎重な安全テストを受ける価値がある
- 能力の低いモデルができる多くの有益なことに、規制負担が集中しないことを望んでいる
- 欧州型の全面的な取り締まりは非常に悪い
- 中国はそのような制約を持たないため、米国がAIで遅れを取ることは世界にとって非常に危険
- 過度な規制はむしろ世界的リスクを高めうる
著作権、オープンソース、そしてコンテンツの未来
- 学習データについては、**「学習はフェアユース」**と見なされる可能性が高いと予測
- ただし、キャラクター・スタイル・IPベースのコンテンツ生成には新たな商業モデルが必要
- 人間の作家が小説を読んで着想を得ることはできても、小説を複製はできないのと同じ
- 一部の権利者が「自分のキャラクターの登場が十分でない」と不満を述べるなど、コンテンツ協業構造の再編が進んでいる
- オープンソースモデルgpt-ossは前向きに評価され、中国製モデルの独占的拡大を牽制する必要性にも言及
エネルギーとAIの融合
- 2つの主要関心事であるAIとエネルギーが同じものへ収束している
- 歴史を見れば、人々の生活の質向上に最も大きな影響を与えたのは、より安く豊富なエネルギーだった
- エネルギーをさらに強く推進するのは良い考え
- 短期的には天然ガスが米国の純増ベースロード電力の大半を占めると予想
- 長期的には太陽光+蓄電装置と原子力が支配的なエネルギー源になる
- 先進原子力(SMR、核融合など)を含む
- 原子力が他のすべてに比べて経済的に圧倒的に安ければ、急速に進展するだろう
- 歴史的にも、より安価なエネルギー源への転換時には世界は非常に速く動いてきた
- 原子力は地球上、あるいはどこであっても最も安価なエネルギー形態であるべき
収益化とユーザー信頼
- Soraの動画生成コストは高く、新たな収益化モデルが必要
- グループチャットで自分や友人の面白いミームを作るなど、想定外の利用パターンが見られる
- 1日に何百回も使う人向けの別の収益化手段が必要
- GPUコストが高いため、**従量課金(pay-per-generation)**モデルが必要になるだろう
- コンテンツ生成に関する従来の前提の変化
- 1%がコンテンツ生成、10%がコメント、100%が閲覧するという従来モデル
- はるかに多くの人がコンテンツを作りたいと思っていたが、難しかっただけ
- 広告には前向きだが、信頼維持が核心
- 「ユーザー信頼を損なわない範囲でのみ可能」
- Instagram広告は純粋な価値を追加する好例(それまで知らなかった製品の発見)
- ChatGPTとユーザーの高い信頼関係を壊してはならない
- 「どのコーヒーメーカーを買うべきですか?」という質問に、最善ではなく対価を受け取った製品を勧めれば信頼を失う
初期OpenAIの回顧
- 初期のOpenAIはビジネスより研究中心だったが、CEOとして「運営と組織の心理的複雑さを学んだこと」が最大の変化だった
- 最初の数年は最も楽しい職業人生の時期で、最も賢い人々と研究所を運営し、歴史的な仕事をしていた
- ChatGPT公開後、人生は完全に一変した。ほぼ3年が過ぎ、時間がたつほど少しずつ狂騒的になるが、慣れてきた
- 投資家からCEOへの転換
- 会社経営に自然な適性があったわけではない
- 投資家として会社に助言するマインドから、実際に会社を運営しなければならないことを理解するようになった
- 時間とともに、組織を動かすのに必要なことを多く学んだ
未来への助言
「次世代の巨大企業はOpenAIを模倣するのではなく、OpenAIが築いた技術基盤の上に新しく現れる」
「未来の産業を予測しようとする試みの大半は外れであり、自ら作り、実験し、学ぶことだけが答えだ」
- 深い謙虚さを学んだ。予測は常に外れる
- 肘掛け椅子に座ってQBのように評論すれば賢そうには聞こえるが、他の誰かが言っていることと大差ない
- 正しい確信を得るのは本当に難しい
- 唯一知る方法は、アイデアを探る最前線に深く入り込むこと
- 多くの人と話し、物を作り、技術で遊び、現実の世界に出ていくこと
- 投資家がこの種のものを支援しようとする意欲は、失望するほど低い
- 多くの企業は現在のトレンドを追うだけ
- 人々が新しいことに挑戦することを望んでいる
AGI後の世界に対するビジョン
- アルトマンは「AIは科学・エネルギー・経済全般の持続的進歩を導く中核的原動力」だと定義する
- AIは他のあらゆるものを研究し観察することに魅了される:人間アルゴリズム全体に関心を持つようになると予想
- OpenAIがミッションを達成すれば、ほぼ無料に近い大規模AGIが可能
- 具体的な予測は難しいが、技術で遊び、人と対話し、世界に出ることを通じて発見していくべき
- AGIは爆発的変化ではなく連続的な進化プロセスとして社会に浸透し、人類はAIとともに「継続的な共同学習の時代」へ入っている
まだコメントはありません。