科学を好きな人を増やすメディア、ナゾロジー！世の中にある沢山の不思議を冒険しよう！

Love science , enjoy !

youtubeチャンネルナゾロジー

モナリザが喋った！どんな顔写真にも好きな音声データを話させるAIを開発！ — モナリザが喋った！どんな顔写真にも好きな音声データを話させるAIを開発！ / Credit: HumanAIGC.GitHub – Institute for Intelligent Computing, Alibaba Group(2024)

artificial-intelligence

モナリザが喋った!?どんな顔写真も音声に併せた口パク動画にできるAIを開発！

2024.03.04 17:11:39 Monday

中国を代表する世界的なテクノロジー企業・アリババグループはこのほど、顔画像と音声データを組み合わせてポートレート動画を生成するAIシステム「EMO（Emote Portrait Alive）」を開発したと報告しました。

EMOを使えば、静止画の中の人物に好きな音声データを違和感なく喋らせることができます。

対象とする画像は写真、絵画、アニメ、AIの生成した顔など何でもOK。音声データも会話と歌の両方に対応しています。

つまりはモナリザにラップを歌わせることだって可能なのです。

研究の詳細は2024年2月27日にプリプリントサーバー『arXiv』に公開されました。

EMO: Emote Portrait Alive – Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions https://humanaigc.github.io/emote-portrait-alive/ AI system can convert voice track to video of a person speaking using a still image https://techxplore.com/news/2024-03-ai-voice-track-video-person.html Alibaba’s new AI system ‘EMO’ creates realistic talking and singing videos from photos https://venturebeat.com/ai/alibabas-new-ai-system-emo-creates-realistic-talking-and-singing-videos-from-photos/

EMO: Emote Portrait Alive — Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions https://doi.org/10.48550/arXiv.2402.17485

youtubeチャンネルナゾロジー

恐竜よりも昔の地球はどんな環境だったのか「ペルム紀末の大量絶滅が起きるまで」

恐竜よりも昔の地球はどんな環境だったのか「ペルム紀末の大量絶滅が起きるまで」

恐竜が絶滅した日、地球上では何が起きたのか #shorts

恐竜が絶滅した日、地球上では何が起きたのか #shorts

地球の歴史46億年を8分半で巡る！衝突・凍結・絶滅・誕生

地球の歴史46億年を8分半で巡る！衝突・凍結・絶滅・誕生

【宇宙】星を生みながら移動する巨大な超大質量ブラックホール

【宇宙】星を生みながら移動する巨大な超大質量ブラックホール

目次

自然な表情で完璧な口パクができる！

研究者たちはこれまで、顔の静止画を処理してアニメーションバージョンを作成するAIシステムの開発を進めてきました。

アリババのAI研究チームは今回、ここに音声データを追加することで新たなステージへと突入しています。

チームが開発したEMOは、自分の選んだ好きな顔画像にどんな内容の音声データでも喋らせることのできる画期的なAIシステムです。

しかもただ単純に喋るのではなく、発話のトーンや歌の抑揚に合わせて、首をかしげたり眉根を寄せたり、目を見開いたりと自然な表情を作り出すことができます。

ざっくり言ってしまえば、EMOは顔写真に完璧な口パクをさせるシステムといえるでしょう。

好きな顔画像に音声データを自然な表情で喋らせる — 好きな顔画像に音声データを自然な表情で喋らせる / Credit: HumanAIGC.GitHub – Institute for Intelligent Computing, Alibaba Group(2024)

しかもEMOのシステムに必要なのは、たった一枚の「顔画像」と一つの「音声データ」だけです。

従来のように、顔画像のモーションピクチャーを生成するにあたって、3Dモデルやランドマーク（目や鼻の位置など顔の特徴を抽出する上で目印となるポイント）のような中間段階は要りません。

顔画像と音声データをEMOに投げ込めば、自然なポートレート動画が生成されるように訓練されているのです。

では、それを可能にするEMOのシステムはどのような仕組みになっているのでしょうか？

EMOの仕組み

EMOは2段階のプロセスを経てポートレート動画を生成する仕組みになっています。

1つ目は「フレーム・エンコーディング（Frames Encoding）」と呼ばれる段階です。

チームは映画やテレビ番組、スピーチや歌唱パフォーマンスの映像を延べ250時間以上も収集し、その動画データでAIをトレーニングすることで、人が会話したり歌うときにどんな表情や頭の動きをするのかを学ばせました。

これを元にフレーム・エンコーディングでは、参照する顔の静止画の特徴を分析して、あらゆる表情や頭の動きに対応できるようにします。

2つ目は「拡散プロセス（Diffusion Process）」と呼ばれる段階です。

ここでは対象とする音声データの波形を分析して、声の高さや強さ、抑揚などを理解し、それとシンクロするような口の開き、顔の表情、頭の動きの生成を開始します。

EMOの「フレーム・エンコーディング」と「拡散プロセス」 — EMOの「フレーム・エンコーディング」と「拡散プロセス」 / Credit: HumanAIGC.GitHub – Institute for Intelligent Computing, Alibaba Group(2024)

こうして訓練されたEMOのシステムは、たった一枚の顔画像と音声データを投げ込むだけで、自然なポートレート動画を生成できるようになりました。

これを使えば、写真・映画・絵画・漫画・アニメ・CGなどから切り抜いた好きな人物に、好きな音声内容を喋らせることが可能です。

完成したポートレート動画の長さは、元の音声データの長さによって決まります。

例えば、こちらはレオナルド・ダ・ヴィンチの名画『モナ・リザ』に、シェイクスピアの戯曲『お気に召すまま』の一節を喋らせたもの。

まるでモナリザが生きている人のように自然な表情と動きで喋っています。

この他にもアニメの少女やモノクロ映画の俳優を使ったでも映像が多数紹介されています。

ぜひ、こちらのリンクからご覧ください。

https://humanaigc.github.io/emote-portrait-alive/

これまでにも、好きな音声データをアバターに喋らせるAI技術は存在していましたが、ここまで人間らしい自然な表情と完璧なリップシンクを再現したのはEMOが初めてだという。

EMOは今後、映画やゲーム内での俳優・キャラクター生成のほか、バーチャルアーティストやボーカロイドの品質向上など、エンターテインメント業界での活用が期待できます。

またAIで生成した空想の彼氏や彼女と自然な会話ができるようになるかもしれません。

その一方で、EMOは政治的な悪用や芸能界のゴシップの偽造など、危険な側面も秘めていることは確かです。

EMOのようなAIシステムは使い方次第で、善にも悪にもなるでしょう。

コメントを書くキャンセル

人気記事ランキング

Amazonお買い得品ランキング

日用品

1位

エマールハリ感チャージ成分２倍配合！洗うたびシワカタチ回復リフレッシュグリーンの香りつめかえ用１４００ｇ

エマールハリ感チャージ成分２倍配合！洗うたびシワカタチ回復リフレッシュグリーンの香りつめかえ用１４００ｇ

2位

by Amazon ごみ袋半透明シャカシャカタイプ 45L 200枚(100枚×2箱)

by Amazon ごみ袋半透明シャカシャカタイプ 45L 200枚(100枚×2箱)

3位

さらさ洗濯洗剤液体 1900g 無添加植物由来の厳選成分配合ほのかでやさしい柑橘系の香り詰め替え

さらさ洗濯洗剤液体 1900g 無添加植物由来の厳選成分配合ほのかでやさしい柑橘系の香り詰め替え

4位

【カンタン！たのしい！どうぶつ砂絵セット】知育玩具のシルバーバック幼稚園小学校入園入学お祝いプレゼント準備 ([バラエティ])

【カンタン！たのしい！どうぶつ砂絵セット】知育玩具のシルバーバック幼稚園小学校入園入学お祝いプレゼント準備 ([バラエティ])

5位

レック(ポチデザイン) 純水99% ウエットシート手・口ふき「ポチ」 60枚入×20個 (1200枚) 【Amazon.co.jp限定】

レック(ポチデザイン) 純水99% ウエットシート手・口ふき「ポチ」 60枚入×20個 (1200枚) 【Amazon.co.jp限定】

スマホ用品

1位

iphone 充電ケーブル【1M/2M 各２本正規MFi認証品】ライトニングケーブル充電器ケーブル高速データ転送最大2.4A急速充電 lightning ナイロン編み断線防止超高耐久iPhone14/14 Pro/13/13 Pro/12/11/X/8/8plus/7/6/iPad 各種対応

iphone 充電ケーブル【1M/2M 各２本正規MFi認証品】ライトニングケーブル充電器ケーブル高速データ転送最大2.4A急速充電 lightning ナイロン編み断線防止超高耐久iPhone14/14 Pro/13/13 Pro/12/11/X/8/8plus/7/6/iPad 各種対応

2位

エレコムモバイルバッテリー 10000mAh 15W 3ポート Type-C×1 USB-A×2 microB(入力専用) 機内持ち込み可 PSE技術基準適合しろちゃん(ホワイト×ブラック) EC-C37WF

エレコムモバイルバッテリー 10000mAh 15W 3ポート Type-C×1 USB-A×2 microB(入力専用) 機内持ち込み可 PSE技術基準適合しろちゃん(ホワイト×ブラック) EC-C37WF

3位

スマホホルダー車ワイヤレス充電マグネット【15W急速充電+真空吸盤の最強コンビ】安定性拔群車スマホスタンド【超強磁力】24×N55磁石 Mag-safe 車載【360°回転な台座×多角度自由調節】カー用品車載スマホホルダー LEDライトマグセーフ車載充電器片手操作 1秒で着脱車用品携帯ホルダー折りたたみ式高級合金素材 iPhone&Android多機種と多車種が対応

スマホホルダー車ワイヤレス充電マグネット【15W急速充電+真空吸盤の最強コンビ】安定性拔群車スマホスタンド【超強磁力】24×N55磁石 Mag-safe 車載【360°回転な台座×多角度自由調節】カー用品車載スマホホルダー LEDライトマグセーフ車載充電器片手操作 1秒で着脱車用品携帯ホルダー折りたたみ式高級合金素材 iPhone&Android多機種と多車種が対応

4位

GameSir Tarantula Pro ワイヤレス PC コントローラー, PC/Switch/Switch２/Android/IOS用、ゲーミングコントローラー、GameSir Mag-Res™ TMR Stick付きゲームパッド、ブルートゥースコントローラー、切り替え可能フェイスボタン、9のマッピング可能ボタン、ターボ、MFi、Steam，switch 2対応プロコン

GameSir Tarantula Pro ワイヤレス PC コントローラー, PC/Switch/Switch２/Android/IOS用、ゲーミングコントローラー、GameSir Mag-Res™ TMR Stick付きゲームパッド、ブルートゥースコントローラー、切り替え可能フェイスボタン、9のマッピング可能ボタン、ターボ、MFi、Steam，switch 2対応プロコン

5位

スマホ防水ケース【完全防水・暗闇で光る蓄光設計】最大7.9インチ対応 IPX8+ 防水スマホケースタッチ操作高透過率画面指紋認証/顔認証水中撮影ロックがしやすい両手解放ストラップ付き長さ調整可能携帯ケースお風呂海プール釣り雨潜水水泳温泉適用 iPhone/AQUOS/ARROWS/Pixel/Xperia/Galaxyに対応

スマホ防水ケース【完全防水・暗闇で光る蓄光設計】最大7.9インチ対応 IPX8+ 防水スマホケースタッチ操作高透過率画面指紋認証/顔認証水中撮影ロックがしやすい両手解放ストラップ付き長さ調整可能携帯ケースお風呂海プール釣り雨潜水水泳温泉適用 iPhone/AQUOS/ARROWS/Pixel/Xperia/Galaxyに対応

ゲーム

1位

【任天堂純正品】Joy-Con充電グリップ

【任天堂純正品】Joy-Con充電グリップ

2位

【2025年新登場】For Switch 2 ドックテレビ接続出力 4K@60Hz スイッチドック直接にTV出力ドック多機能 Type-C to HDMI変換軽量化高性能チップ遅延なし持ち運び便利小型アダプター

【2025年新登場】For Switch 2 ドックテレビ接続出力 4K@60Hz スイッチドック直接にTV出力ドック多機能 Type-C to HDMI変換軽量化高性能チップ遅延なし持ち運び便利小型アダプター

3位

ドラゴンクエストトレジャーズ蒼き瞳と大空の羅針盤 -Switch

ドラゴンクエストトレジャーズ蒼き瞳と大空の羅針盤 -Switch

4位

エレコム Nintendo Switch2専用セミハードポーチ EVA素材耐衝撃スリム設計ソフト収納ポケット付きダブルファスナーブラック GM-NS225EVSBK

エレコム Nintendo Switch2専用セミハードポーチ EVA素材耐衝撃スリム設計ソフト収納ポケット付きダブルファスナーブラック GM-NS225EVSBK

5位

マジカルクラフト猫と魔法のドレス -Switch 【早期購入特典】ときめき着せかえ帖同梱

マジカルクラフト猫と魔法のドレス -Switch 【早期購入特典】ときめき着せかえ帖同梱

小説

1位

プロジェクト・ヘイル・メアリー　上

プロジェクト・ヘイル・メアリー　上

2位

プロジェクト・ヘイル・メアリー　下

プロジェクト・ヘイル・メアリー　下

3位

忌録: document X

4位

国宝上青春篇 (朝日文庫)

5位

文庫版　近畿地方のある場所について (角川文庫)

文庫版　近畿地方のある場所について (角川文庫)

AI・人工知能のニュースartificial-intelligence news

もっと見る

役立つ科学情報

注目の科学ニュースpick up !!