動画もAIに作らせる時代がきた
「未来の映画監督はAIかもしれない」というのは、もはや空想の話ではないかもしれません。
OpenAIが2月15日(米国時間)発表した「Sora」は、まるで魔法のようにテキストから動画を生み出すAIモデルです。
OpenAIと言えば、会話型AIのChatGPTや画像生成ツールのDall-Eでその名を馳せていますが、動画を生成するAIツールとしては、Soraがその初陣を飾ります。
Soraの魔法は、ただの動画を超えたもの。最大60秒の長さで、細部までこだわり抜かれたシーン、カメラワークの鮮やかな動き、感情豊かなキャラクターたちを生み出します。これまでの動画生成AIがせいぜい数秒のクリップに留まっていたことを考えると、動画の長さはもちろん、その質においてもSoraはこれまでのAIを圧倒しています。
さらにSoraは、ただ複雑なシーンを生成するだけではありません。
複数のキャラクター、特定のモーション、そして対象物や背景の細かなディテールまで、ユーザーが提示した命令書を分析し、それらが現実世界でどのように存在するかまで把握できるのです。
OpenAIのSoraは、私たちが動画に求めるクリエイティビティの枠を大きく広げ、AIの可能性を新たに提示しています。
Soraのデモンストレーションを見ると、これまでの自動生成動画にはないリアリティと映像美が感じられます。
以下に、実際の命令文と、それに対してSoraが出力した動画を紹介していきます。
文章から作られた動画のデキをみてみよう
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
以下では動画作成のために入力されたプロンプト(命令文)と実際に作成された動画をいくつか紹介します。
命令書①
美しい雪の東京の街は賑わっています。カメラはにぎやかな街路を移動し、美しい雪の天気を楽しんだり、近くの屋台で買い物をしたりする数人の人々を追っています。華やかな桜の花びらが雪の結晶とともに風に乗って飛んでいきます。
命令書②
数頭の巨大な毛むくじゃらのマンモスが雪の草原を踏みしめながら近づいてくる。雪に覆われた木々、遠くに見えるドラマチックな雪を頂いた山々、うっすらとした雲と遠く高い位置にある太陽が暖かな輝きを放つ昼下がりの光、そして 低いカメラアングルからの眺めは、美しい写真と被写界深度で毛皮をまとった大きな哺乳類を見事に捉えている。
命令文③
アニメーションのシーンは、溶けた赤いろうそくのそばにひざまずく背の低いふわふわしたモンスターのアップが特徴です。画風は3Dでリアル、照明とテクスチャーに重点を置いている。モンスターは大きな目と口を開けて炎を見つめている。そのポーズと表情からは、無邪気さと遊び心が感じられる、そのポーズと表情は、まるで初めて周囲の世界を探検しているかのような、無邪気で遊び心のある感覚を伝えている。暖色系の色使いとドラマチックな照明が、画像の居心地のよい雰囲気をさらに高めている。
命令書④
温かく光るネオンとアニメーションの街の看板で埋め尽くされた東京の通りを、スタイリッシュな女性が歩いている。彼女は黒い革のジャケット、赤いロングドレス、黒いブーツを身に着け、黒い財布を持っている。彼女はサングラスをかけ、赤い口紅を塗っている。彼女は自信に満ち、さりげなく歩いている。通りは湿っていて反射し、カラフルなライトのミラー効果を作り出している。多くの歩行者が歩いている。
作成された動画はどれも命令文の内容を忠実に再現しており、まるで人間の監督や演出家の力添えがあるかのような、ドラマチックでエモい風景を映し出してくれました。
特に命令書③で作られた動画は、命令文をどんどん追加して先を作成していけば、大手映画制作会社の新作のような雰囲気を醸し出せるかもしれません。
また命令書④で作成された動画も、出演者ゼロでも映画に近い映像を作り出せる可能性を感じさせます。
これまで高いクオリティーの動画を作り出すためには多くの時間や資材が必要でしたが、これからは必要な動画資料は自分で作れる時代が来るかもしれません。