39の音素
ベネットさんの脳は、音素を生成するための指示を出すことはできますが、筋肉がその命令を実行することはできません。
そこで研究者たちは、単語全体を認識できるようにAIを訓練するのではなく、音素から単語を解読するようAIを訓練しました。
これらは、文字が書き言葉を形成するのと同じように、話し言葉を形成する音声の単位です。 「Hello」という単語を例にすると、「HH」、「AH」、「L」、「OW」の 4 つの音素が含まれています。
また、このAIは、どの単語が他の単語の前に来るべきか、どの音素がどの単語を作るかを理解するようにも訓練されています。そのため、いくつかの音素が誤って解釈されたとしても、正しい推測ができるのです。
このアプローチにより、コンピューターは39の音素を学習するだけで、英語のあらゆる単語を理解できるようになりました。この結果、システムの精度が向上し、処理速度も3倍となったのです。