「文を理解するAI」は最先端モデルよりも高い結果を出した
さて、例えで考えてきたように、ウイルスの突然変異と文の構造把握には共通点があります。そのため、NLPアルゴリズムを応用することで、ウイルスの突然変異を見つけることができるのです。
このアプローチの目的は、すべての突然変異を予測し、調べていくことではありません。
ウイルスの感染力を低下させずに免疫系を欺ける変異、つまり、文法的に正確で意味が異なる変異だけを予測したいのです。
そして言語概念的な方法であれば、条件に該当する変異を見つけ出すのは比較的容易です。
これは、私たちが【黒い、とげの大きな微生物】という文から、文法が正しく意味が異なる変形文を比較的簡単に探しだせるのと同じです。
実際、研究チームは3つの異なるウイルスから取得した数千の遺伝子配列でAIを学習させ、コロナウイルス株に対する予測指標0.85を取得しました。
予測指標とは予測精度を0.5(偶然)~1(完璧)で表したものであり、今回の結果は最先端の他の予測モデルよりも優れていたとのこと。
現在、新型コロナウイルスの変異が見られており、今後も新たに変異していくかもしれません。
そのためにも変異を素早く予測することは大切です。
しかし従来の方法は、病院で患者からウイルスを採取し、ゲノム配列を確定。その後、研究室でその変異を再現するというもの。これには数週間かかります。
今回開発されたNLPアルゴリズムを利用すれば、このプロセスが一気に加速します。潜在的な変異を予測できるので、いきなり研究室での作業に移れるのです。
今後研究チームは、NLPアルゴリズムを進展させるとともに、言語と生物学の類似点への理解を深めていく予定です。