artificial-intelligence

音声だけで話者の「顔」を復元できるAIが開発される (2/2)

2019.05.29 Wednesday

前ページ数百万人の「声」と「顔」のデータを学習

<

1

2

>

ある声の波長域に共通する「平均的な顔」が生成される

その結果、「Speech2Face」は以下のような精度を実現させることができた。ボイスクリップも「github」から確認できる。

Credit:github

一方で研究チームは「AI開発の目的は話者の顔に忠実な画像を生成することではなく、声の情報から身体的な特徴を復元することだ」と話す。

「Speech2Face」は話者個人を再現するのではなく、ある声の波長域に共通する「年齢・性別・髪の色」などを抜き出すことに特化している。そのため生成される画像は、あくまでもある音声領域における平均的な顔という訳なのだ。

そのため、顔と声に大多数の人とは異なるギャップが見られると正確な画像生成ができないという。

もしこの技術が進歩しアプリとしてスマホなどに搭載されれば、電話口の相手の顔がすぐに分かってしまうかもしれない。

末恐ろしい技術だが、おそらくクロちゃんは正確に復元されないだろう。

ついにAIが存在しない「全身像」を自動で作り出す

reference: futurismgithub / written & text by くらのすけ

<

1

2

>

コメントを書く

※コメントは管理者の確認後に表示されます。

人気記事ランキング

  • TODAY
  • WEEK
  • MONTH

Amazonお買い得品ランキング

AI・人工知能のニュースartificial-intelligence news

もっと見る

役立つ科学情報

注目の科学ニュースpick up !!