AIの声、本当に人間と区別できない?
AI音声技術の進化は、私たちの生活に大きなインパクトを与えています。
バーチャルアシスタントや自動応答サービス、オーディオブックのナレーションまで、あらゆる場面でAIの声が使われています。
特に注目されているのが「ボイスクローン」と呼ばれる技術です。
これは特定の人の声をAIが模倣することで、本人そっくりの音声を数分のサンプルから再現するものです。

では、この最先端技術がどれほど本物に近づいているのか。
それを調べるため、英ロンドン大学クイーン・メアリー(QMUL)の研究チームは大規模な実験を行いました。
実験では、40人分の本物の人の声と、AIが生成した2種類の音声(ゼロから作られた汎用AI音声と、特定人物の声を模したクローン音声)を用意。
イギリス在住の成人被験者に「どれが本物の人間の声か」「どれがAIか」を判定してもらいました。
その結果は驚くべきものでした。
ゼロから作られたAI音声については、まだ6割近くの人が「これはAIだ」と気付くことができました。
しかし「ボイスクローン」音声については、半数以上が「本物の人間の声」と誤認し、正解率は偶然レベルにまで低下したのです。
「どちらが本物か」はもはや直感に頼るしかなく、多くの人が自信を持てなくなったのです。
さらにAI音声と人間の声は「どちらがより本物らしいか」という評価でもほぼ互角。
AIが「人間の声以上にリアル(ハイパーリアリズム)」になる現象はまだ観測されていませんが、「人間の声とまったく同じくらいリアル」と感じる人が多数派となったのです。