OpenAIが「Sora 2」を発表、ユーザーがAI生成動画に出演できるソーシャルアプリも
オープンAIは、これまでで最も先進的な動画・音声生成システムであるSora 2を、AIが作成した動画コンテンツをTikTokスタイルのフィードに表示する新しいソーシャルアプリとともに発表した。
Sora」とも呼ばれるこのアプリは、「カメオ」と名付けられた機能により、ユーザーがAIが生成したシーンに自分自身を挿入し、共有された動画に声と映像の両方を提供することができる。
Sora 2、AI動画にリアルな物理演算と複雑な動きをもたらす
ソラ2』は、AI映像のリアリズムを大きく前進させた。
テキストプロンプトを満足させるために「物体を変形させ、現実をデフォルメする」ことが多かったこれまでのモデルとは異なり、『空2』は物理法則により忠実に従っている。
OpenAIは、ビーチバレーのゲーム、スケートボードのトリック、体操のルーチン、飛び込み台のキャノンボールジャンプなどの例を強調し、すべての正確な動きともっともらしい結果を実証した。
「テキストによるプロンプトを成功させるために、物体を変形させたり、現実を変形させたりする。例えば、バスケットボール選手がシュートをミスした場合、ボールは自然にフープにテレポートするかもしれません。Sora 2では、バスケットボール選手がシュートをミスすると、ボールはバックボードから跳ね返ります。"
このモデルは、映画のような、リアルな、あるいはアニメのような、一貫したワールドステートとビジュアルスタイルを維持しながら、マルチショットの指示を扱うことができる。
また、台詞、背景音、効果音などの音声要素を映像と同期して生成する。
カメオ出演でユーザーはAI動画の一部になれる
Soraアプリは、AIが生成したコンテンツと対話する新しい方法を紹介する。
カメオ」を通じて、ユーザーは1回限りのビデオと音声の録音をアップロードして、自分の外見と声を確認することができ、生成されたあらゆるシーンに登場することができる。
ユーザーが管理する権限で友達を参加させることができ、複数の人が出演する共同ビデオを作成できる。
OpenAIはこの機能を、「テキストから絵文字、音声メモ、没入型ビデオカメオへと進む、コミュニケーションの自然な進化」と説明している。
アプリで作成した動画は、TikTokやInstagram Reelsに似たフィードで共有できる。
フィードのレコメンデーションは、ユーザーのアクティビティ、位置情報、過去のエンゲージメント、さらにはChatGPTの会話履歴の影響を受けるが、このデータはオフにすることもできる。
無限スクロールの制限やアルゴリズムによるパーソナライズ設定など、ペアレンタルコントロールにより、10代の若者の閲覧やメッセージのやり取りが制限される。
そら」「そら2」のアクセス・利用方法について
Soraアプリは現在、米国とカナダで招待制となっており、今後、より広い範囲で提供される予定だ。
Sora 2ビデオジェネレーターは、使用量は計算機の容量に依存しますが、最初は無料で、制限も十分にあります。
ChatGPT Proユーザーは、より高品質なSora 2 Proモデルを利用できるようになり、Sora 1 Turboはレガシーコンテンツで引き続き利用できる。
下書きを含め、生成された動画はすべて、カメオの被写体がアクセス可能な状態に保たれ、被写体はいつでも許可を取り消したり、コンテンツを削除したりできる。
AI動画生成の競合と業界事情
Sora 2は、Google、Runway AI、Midjourneyなど、短いビデオクリップを短時間で制作する競合分野に参入した。
Metaは最近、独自のAIビデオフィード「Vibes」をMeta AIアプリで開始し、AIが生成するビジュアルを使ったユーザー実験を奨励している。
OpenAIは、リアルな映像を提供すると同時に、大規模なAI計算が社会や環境に与える影響、特にスクリーンタイム、中毒、欺瞞的なコンテンツに関する懸念を管理するという2つの課題に直面している。
AIビデオとソーシャルアプリは、コンテンツの作成と共有方法を変えられるか?
OpenAIのSora 2とSoraソーシャルアプリは、AIのリアリズムとインタラクティブなソーシャル機能を組み合わせた野心的な試みである。
Coinliveは、この技術が素晴らしい忠実性と制御性を示す一方で、コンピューティングの需要、ユーザーの安全性、コンテンツの悪用など、普及にはハードルがあると指摘している。
カメオ」のコンセプトは説得力があるが、AIが生成したコンテンツにユーザーが自分の肖像を入れることは、典型的なソーシャルメディアの悪用にとどまらないリスクを伴う。
このプロジェクトの成功は、技術的な革新だけでなく、信頼、倫理的なモデレーション、エンゲージメントの持続可能性にかかっており、このようなプラットフォームが、ユーザーのウェルビーイングを損なうことなくデジタル創造を再構築できるかどうかという問題を提起している。