OpenAI が文章から動画を生成してくれる超高性能AIが発表！ / Credit:OpenAI

artificial-intelligence

テキストの指示だけでハイクオリティ動画を制作！OpenAI の動画生成AI「Sora」

2024.02.19 18:00:14 Monday

イラストに続き、ついに動画もAIが作ってくれる時代になりそうです。

chatGPTで知られるOpenAI 社は2月15日、打ち込んだ文章をもとにリアルな動画を制作してくれるAI「Sora」を発表しました。

文章をもとにイラストを生成するAIが社会で広く話題を呼びましたが、文章から美麗な動画を作成してくれるAIが普及すれば、YouTubeなどの動画についても、特別な知識や技術なしにハイクオリティの作品を簡単に制作できるようになるかもしれません。

今回は命令文からどんな動画が作られるかを紹介しつつ、Soraにかんする基本的な仕組みを解説したいと思います。

Introducing Sora, our text-to-video model. https://twitter.com/OpenAI/status/1758192964222988506

【歴史で学ぶ量子力学】量子力学を理解しているものは一人もいない？量子力学とは

MLBのホームラン増加に地球温暖化が影響していた！？

かわいそう…優しすぎて絶滅した海獣「ステラーカイギュウ」

恐竜が絶滅した日、地球上では何が起きたのか？隕石衝突後…

動画一覧

動画もAIに作らせる時代がきた

「未来の映画監督はAIかもしれない」というのは、もはや空想の話ではないかもしれません。

OpenAIが2月15日（米国時間）発表した「Sora」は、まるで魔法のようにテキストから動画を生み出すAIモデルです。

OpenAIと言えば、会話型AIのChatGPTや画像生成ツールのDall-Eでその名を馳せていますが、動画を生成するAIツールとしては、Soraがその初陣を飾ります。

Soraの魔法は、ただの動画を超えたもの。最大60秒の長さで、細部までこだわり抜かれたシーン、カメラワークの鮮やかな動き、感情豊かなキャラクターたちを生み出します。これまでの動画生成AIがせいぜい数秒のクリップに留まっていたことを考えると、動画の長さはもちろん、その質においてもSoraはこれまでのAIを圧倒しています。

さらにSoraは、ただ複雑なシーンを生成するだけではありません。

複数のキャラクター、特定のモーション、そして対象物や背景の細かなディテールまで、ユーザーが提示した命令書を分析し、それらが現実世界でどのように存在するかまで把握できるのです。

OpenAIのSoraは、私たちが動画に求めるクリエイティビティの枠を大きく広げ、AIの可能性を新たに提示しています。

Soraのデモンストレーションを見ると、これまでの自動生成動画にはないリアリティと映像美が感じられます。

以下に、実際の命令文と、それに対してSoraが出力した動画を紹介していきます。

文章から作られた動画のデキをみてみよう

Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf

— OpenAI (@OpenAI) February 15, 2024

以下では動画作成のために入力されたプロンプト（命令文）と実際に作成された動画をいくつか紹介します。

命令書①

美しい雪の東京の街は賑わっています。カメラはにぎやかな街路を移動し、美しい雪の天気を楽しんだり、近くの屋台で買い物をしたりする数人の人々を追っています。華やかな桜の花びらが雪の結晶とともに風に乗って飛んでいきます。

命令書②

数頭の巨大な毛むくじゃらのマンモスが雪の草原を踏みしめながら近づいてくる。雪に覆われた木々、遠くに見えるドラマチックな雪を頂いた山々、うっすらとした雲と遠く高い位置にある太陽が暖かな輝きを放つ昼下がりの光、そして低いカメラアングルからの眺めは、美しい写真と被写界深度で毛皮をまとった大きな哺乳類を見事に捉えている。

命令文③

アニメーションのシーンは、溶けた赤いろうそくのそばにひざまずく背の低いふわふわしたモンスターのアップが特徴です。画風は3Dでリアル、照明とテクスチャーに重点を置いている。モンスターは大きな目と口を開けて炎を見つめている。そのポーズと表情からは、無邪気さと遊び心が感じられる、そのポーズと表情は、まるで初めて周囲の世界を探検しているかのような、無邪気で遊び心のある感覚を伝えている。暖色系の色使いとドラマチックな照明が、画像の居心地のよい雰囲気をさらに高めている。

命令書④

温かく光るネオンとアニメーションの街の看板で埋め尽くされた東京の通りを、スタイリッシュな女性が歩いている。彼女は黒い革のジャケット、赤いロングドレス、黒いブーツを身に着け、黒い財布を持っている。彼女はサングラスをかけ、赤い口紅を塗っている。彼女は自信に満ち、さりげなく歩いている。通りは湿っていて反射し、カラフルなライトのミラー効果を作り出している。多くの歩行者が歩いている。