- Soraは、テキスト指示に従って現実的で想像力豊かなシーンを作り出すAIモデル
- ユーザーのプロンプトに忠実でありながら視覚的品質を維持し、最長1分の動画を生成可能
- 詳細なシナリオを提供するさまざまなプロンプトに基づいて生成された動画の例を紹介
- このページのすべての動画はSoraが直接制作したもので、一切修正されていない
- 現在、Soraはリスク評価のために「レッドチーム」に提供されており、ビジュアルアーティスト、デザイナー、映画制作者からフィードバックを受けている
- OpenAIは研究の進捗を共有することで、外部からのフィードバックを得るとともに、AI能力の未来を一般に示したいとしている
Soraの能力
- 複雑なシーンや多数のキャラクター、特定の動き、被写体と背景の正確なディテールを生成できる
- ユーザーのプロンプトだけでなく、物理世界における存在のしかたも理解する
Soraの安全性
- OpenAI製品にSoraを統合する前に、複数の安全対策を講じる予定
- 誤解を招くコンテンツを検出するツールの開発、動画がSoraによって生成されたかを判定できる分類器の開発などが含まれる
研究技術
- Soraは、ノイズだらけの動画から始めて徐々にノイズを取り除きながら動画を生成する拡散モデル
- GPTモデルに類似したトランスフォーマーアーキテクチャを使用し、優れたスケーリング性能を提供する
GN⁺の見解
- Soraは、テキストベースの指示によって動画を生成する革新的なAI技術であり、創造的な専門家に新たな可能性を提供する
- 安全対策とフィードバックを通じて現実世界での利用を学習し、AIシステムを段階的に安全にしていくうえで重要な役割を果たす
- この技術は、将来のAGI(汎用人工知能)実現に向けた重要なマイルストーンになるとみられる
6件のコメント
本当に感嘆するしかないですね。
7兆もらえそう……?
本物の動画なのか、AIが作った動画なのか、ざっと見ただけでは分からないですね。
わあ……早く使ってみたいです。
拡散モデルというのは、Stable Diffusion と同じような方式ということですよね?
stock photo や stock video の市場は厳しくなりそうですね..
生成品質がものすごいですね。こんなに早く進化するんですか
Hacker Newsの意見