フェイク顔映像を自動判別するプログラム「SYNTHETIQ VISION」
ディープフェイクにより多くの人が被害に遭う可能性があります。
そこで、国立情報学研究所(NII)では、映像が本物か作られたものか真贋判定を行うための「SYNTHETIQ VISION」というプログラムを開発しました。
SYNTHETIQ VISIONは大量のデータを学習したAI(深層学習)により偽物かどうか自動的に識別し、人間による分析を一切必要としません。
深層学習とは、機械がデータを解析し学習することに基づいて判断を行う機械学習の一つです。
深層学習では、上記のように入力層、中間層、出力層の3層に分かれています。
入力層にデータを入力すると、中間層でデータを変換や結合を何度も繰り返し、出力層に送られます。
中間層における層の数が増えれば増えるほど、人間の能力では理解ができないレベルでの高度な分析が可能です。
上図は、中間層により変換や結合が繰り返されている様子を示したものです。
最初は目と口の上の部分だけ赤色となり、そこに機械が注目していることが分かります。
しかし、徐々にデータのどこを注目しているのかぼやけていき、最後のほうはただの青い画像であることしか分かりません。
しかし、機械は細かいデータの差異や規則性を検出できるため、同じような青い画像から特徴を見出すことができるのです。
SYNTHETIQ VISIONも、この深層学習の仕組みを活用しています。
人間にとってはまったく同じに見えるディープフェイクのわずかな差異や規則性を見つけ出し、フェイク動画かどうかを判断します。
SYNTHETIQ VISIONがどのような画像データを覚えさせたのか、どのようなアルゴリズムで真偽を判定するのか、そういったことは現時点(2023年9月)では公開されていません。
ただ、さまざまな画質の映像も学習済みで、圧縮されて画質が落ちた映像でも信頼度の高い判定が可能です。
上記の画像は、右と左のどちらかがフェイクなのですが、どちらがフェイクか分かるでしょうか?
2つ映像はまったく同じような動きで同じように話していますが、映っている人物の顔は異なります。つまり片方は本物の映像で、もう片方はその映像をもとにして別の人物が合成されたフェイク映像ということになります。
何となく映像の解像度に違いはあるように見えますが、どちらも自然な動きをしていて、人の目で正しく判別するのは困難です。
しかし、SYNTHETIQ VISIONを使用すれば、左が本物で右がフェイク映像だと判別できます。
この技術があれば、人間が偽物の映像に振り回されることは無くなります。
また、SYNTHETIQ VISIONの優れている点として、知識のない素人でも操作可能である点があります。
このような技術を実際の映像に適用するためには、ディープラーニングを操作できる知識や技能が必要でした。
しかし、SYNTHETIQ VISIONはサーバーに該当の映像をアップロードするだけで画像や映像の真贋判定が可能です。
これにより、企業や個人が活用しやすくなっています。
サイバーエージェントによる実用化が決定
2023年1月、サイバーエージェントが展開する新サービス「デジタルツインレーベル」で、SYNTHETIQ VISIONを採用することが発表されました。
これは、SYNTHETIQ VISIONが実用化される国内初の事例です。
デジタルツインレーベルとは、著名人の全身の3Dデータ、モーションデータ、音声データを取り込み、まるで分身のようなコンピュータグラフィック「デジタルツイン」を制作するサービスです。
まさにシンセティック・メディアの活用例と言えるでしょう。
デジタルツインでは、まるでその人が動いて話しているような映像を作成できるため、本人の代わりにテレビに出演する、本人と合成映像による共演をする、といった活用方法が可能です。
本来はできない、ダンスや外国語を話すことも可能で、スキルを拡張した表現もできます。
つまり、悪用されると大きな損害が発生するディープフェイクの有効活用といえます。
こういった技術を作り出した以上、悪用を防止することも開発企業の義務といえます。
そこで、サイバーエージェントではディープフェイクによる悪用検知にも積極的に取り組むため、SYNTHETIQ VISIONを採用することになりました。
サイバーエージェントでは、ディープフェイクの悪用を検知し著名人の著作権や肖像権を守ることにより、メディアの信頼性確保や、技術の正しい活用を目指しています。
今後の見通し
シンセティック・メディアを正しく活用されれば、映像として作られる本人の負担減や、本人の分身など目新しい映像開発につながります。
ただ、フェイク映像として悪用されると、本人の評価を下げる動画が公開されたり、多くの人が騙されたりと社会的に大きな問題が発生する恐れがあります。
SYNTHETIQ VISIONなどの技術がどんどん活用され、フェイク映像により人々が振り回されない社会になるとよいですね。