たった2年で「2億」種類のタンパク質の構造を解明
2020年、ハサビス氏とジャンパー氏は、タンパク質の構造解析にAI技術を使った「AlphaFold2(アルファ・フォールド2)」を開発しました。
AlphaFold2は人工ニューラルネットワークと呼ばれる人間の脳の神経回路を模した仕組みを備えており、これまでの研究で解明されていたタンパク質の構造と、アミノ酸の連なりの関係を「学習」することが可能でした。
人間で例えるならば、アミノ酸配列(問題)とタンパク質構造(答え)を記した問題集を延々と解かされ続けたことになります。
人間ならば、こんなものを「学べ」と言われても「無理です」と言うでしょう。
しかしAIはそんな泣き言は言いません。
人間には無理な課題であったとしても、学べと言われたら学ぶだけです。
研究者たちはアミノ酸の1次元的な並びとタンパク質の3次元的な立体構造の関係を、AIの脳であるニューラルネットワークに徹底的に叩き込みました。
すると学習量がある一定の段階に達すると、奇跡が起こりました。
AlphaFold2は、アミノ酸の連なりを見ただけで、最終生産物であるタンパク質の構造を言い当てられるようになったのです。
しかも正解できる範囲には、AlphaFold2がこれまで見たことがないアミノ酸配列にも及びました。
AlphaFold2は学習を完遂することで、人間には不可能だった配列から構造を予測する能力を身に着けていたのです。
そしてその精度の中央値は100点満点中90点(CASPスコア)にもなり、既存のX線結晶構造解析に匹敵するレベルに及んでいました。
さらに驚くべきことに、2022年にAlphaFold2の開発チームは、開発から2年足らずで2億種類のタンパク質の構造を予測することに成功しました。
この2億という数は、これまでの人類が多様な生命から採取してきたDNAデータベースに収集されている、全てのタンパク質量をカバーするものでした。
(※また同じ時期にMeta(旧フェイスブック)が作ったAIは、まだよく知られていない細菌やウイルスなどが持つ、まだ特性がわかっていないタンパク質約6億種の構造をわずか2週間で全て予測することにも成功しました。ただこちらはAlphaFold2に比べて速度に優れるものの正確性がやや劣るようです)
このようなAIによるタンパク質構造解析は、生物学や製薬の分野に革命的な変化をもたらしました。
実際、以来現在に至るまでAlphaFold2を使ってタンパク質構造解析を行った論文は2万件に及んでいます。
ノーベル賞の中には発見から数十年を経て受賞するものもありますが、AlphaFold2は開発から僅かな期間での受賞となりました。
短い期間で受賞したということは、この技術がいかに全てを変えてしまったかを物語っています。
一方で、残る1人であるベイカー氏の業績は、2人の逆をいくという点で革新的でした。