12 ポイント 投稿者 GN⁺ 2024-02-16 | 6件のコメント | WhatsAppで共有
  • Soraは、テキスト指示に従って現実的で想像力豊かなシーンを作り出すAIモデル
  • ユーザーのプロンプトに忠実でありながら視覚的品質を維持し、最長1分の動画を生成可能
  • 詳細なシナリオを提供するさまざまなプロンプトに基づいて生成された動画の例を紹介
    • このページのすべての動画はSoraが直接制作したもので、一切修正されていない
  • 現在、Soraはリスク評価のために「レッドチーム」に提供されており、ビジュアルアーティスト、デザイナー、映画制作者からフィードバックを受けている
  • OpenAIは研究の進捗を共有することで、外部からのフィードバックを得るとともに、AI能力の未来を一般に示したいとしている

Soraの能力

  • 複雑なシーンや多数のキャラクター、特定の動き、被写体と背景の正確なディテールを生成できる
  • ユーザーのプロンプトだけでなく、物理世界における存在のしかたも理解する

Soraの安全性

  • OpenAI製品にSoraを統合する前に、複数の安全対策を講じる予定
  • 誤解を招くコンテンツを検出するツールの開発、動画がSoraによって生成されたかを判定できる分類器の開発などが含まれる

研究技術

  • Soraは、ノイズだらけの動画から始めて徐々にノイズを取り除きながら動画を生成する拡散モデル
  • GPTモデルに類似したトランスフォーマーアーキテクチャを使用し、優れたスケーリング性能を提供する

GN⁺の見解

  • Soraは、テキストベースの指示によって動画を生成する革新的なAI技術であり、創造的な専門家に新たな可能性を提供する
  • 安全対策とフィードバックを通じて現実世界での利用を学習し、AIシステムを段階的に安全にしていくうえで重要な役割を果たす
  • この技術は、将来のAGI(汎用人工知能)実現に向けた重要なマイルストーンになるとみられる

6件のコメント

 
draupnir 2024-02-17

本当に感嘆するしかないですね。
7兆もらえそう……?

 
laeyoung 2024-02-16

本物の動画なのか、AIが作った動画なのか、ざっと見ただけでは分からないですね。

 
edunga1 2024-02-16

わあ……早く使ってみたいです。
拡散モデルというのは、Stable Diffusion と同じような方式ということですよね?

 
dothx 2024-02-16

stock photo や stock video の市場は厳しくなりそうですね..

 
xguru 2024-02-16

生成品質がものすごいですね。こんなに早く進化するんですか

 
GN⁺ 2024-02-16
Hacker Newsの意見
  • あるユーザーは、技術的な成果にもかかわらず、将来への懸念を表明している。社会的セーフティネットが不十分で、ユニバーサル・ベーシックインカム(UBI)にも近づいていないと考えている。また、1社があまりにも多くの権力を持つことへの恐れも示している。
  • 別のユーザーは、コンピューター生成モーションの質に深い感銘を受けている。特にモーションキャプチャとは異なり、コンピューターアニメーションで現実のような動きを実現するのは難しいが、今回は非常にリアルに感じられるとしている。
  • また別のユーザーは、画像/動画という側面を超えて、物理法則や物体同士の関係への理解を示すこのモデルの重要性を強調している。失敗例として挙げられた事例が、実際にはモデルの世界理解の強さを示す重要なケースだと評価している。
  • The Hollywood Reporterによると、業界の多くの人々がAIツールの進化によって仕事への不安を感じている。一部は業界を去ることを検討しており、AIツールは特に広告制作分野の雇用に影響を与えると予想されている。
  • あるユーザーは、現在公開されているモデルをはるかに上回る成果だと言及している。
  • 別のユーザーは、東京の動画で見つかった小さな誤りに注目し、生成コンテンツには常にこのような誤りが存在するのか、そして幼い頃から生成コンテンツに触れて育つ子どもたちがこうした誤りに無感覚になってしまうのかと疑問を呈している。
  • あるユーザーは、Gemini 1.5モデルはすでに旧式になっており、Googleがブログを通じて発表したことに驚きを示している。
  • あるプログラマーは、AIの進歩による不吉な予感を表明しており、それは単に仕事を失うかもしれないという恐れを超えるものだとしている。動画の品質については、信じられないほど印象的だと評価している。
  • あるユーザーは、動画生成の仕組みに関する技術的な疑問を投げかけ、モデルがシーンの幾何学的構造とカメラをどのように分離しているのかを知りたがっている。
  • 最後のユーザーは、技術の進歩が文化的な変化をもたらすと考えており、劇場で人間による演劇、講演、コンサートをもっと見たくなるだろうとしている。Vinylの人気が再び高まったように、劇場も再び人気を集めるかもしれないと予想している。