中国の国営通信社である「新華社通信」が、24時間ニュースを読み上げ続けることができる「AIアナウンサー」を発表しました。デビューしたのは「英語」担当と「中国語」担当の2人。
「不気味の谷」に落ちることなく、知らずに見たら人間と間違うほどの自然さです。
動画の中で丁寧に自己紹介をする「英語担当」の彼ですが、その姿は人間さながら。モデルとなったのは、実際に新華社通信所属しているアナウンサーZhang Zhaoさんとのこと。プロジェクトに協力したのは、北京を中心に検索エンジンを手がける企業 “Sogou(搜狗)” です。
ここにどのような技術が用いられているのかについて、詳しいことは分かっていません。しかし、映像のベースに実際の人間のレイヤーが敷かれ、口や表情などをアニメーション化して動かしていると思われます。そして、これを合成音声と組み合わせることにより、従来のCGI技術よりも格段に速く、AIアナウンサーにニュースを読ませることに成功しているのです。
何と言っても「休み」をとる必要がないのが「AIアナウンサー」の大きな特徴。新華社通信は彼らの登場をコストカットにつなげ、より効率的な運営を実現させようとしています。
とはいえ、まだ彼らは「人間のアナウンサー」と同等の能力を持っているわけではありません。表情のバリエーションには限界があり、声も人工的な響きが含まれています。しかし、今日における機械学習の発展は目覚ましく、将来的に人間と見分けがつかないAIアナウンサーが登場することも想像に難くありません。
これを単にAI技術の発展と喜ぶ見方もありますが、情報統制が厳しい中国においては、その利用の仕方に懸念が集まるところです。もし誰かに似せた「ニセ」のAIアナウンサーがプロパガンダを読み上げるようなことがあれば、世にも恐ろしい出来事が起こりかねません。
日本でも「初音ミク」をはじめとした多くのボーカロイドキャラクターが大流行したように、合成音声は文化的な成功を収めました。しかし、今回この中国の「AIアナウンサー」が示したように、この技術は「目新しさ」の粋を出て、これからは「実用的なもの」として世界中で活躍していくのかもしれません。