『なぜ生命の暗号はムダだらけ?――遺伝コード削減の狙いとは

私たちの身体をつくるための情報は、すべてDNAという物質に書き込まれています。
このDNAは、「A」「T」「G」「C」という4種類の化学文字(塩基)の並びでできています。
この化学文字を3つずつ組み合わせたものが「コドン」と呼ばれる遺伝情報の単語で、それぞれのコドンがどのアミノ酸を使うかを指定しています。
こうして指定されたアミノ酸が、数珠つなぎになってタンパク質が作られます。
言ってみれば、DNAはタンパク質という生命活動の主役を作るための設計図のようなものです。
しかし、このDNAの設計図にはちょっと不思議な特徴があります。
それは、20種類のアミノ酸しか使っていないのに、なぜかアミノ酸を指定するコドン(指定札)は64通りも用意されていることです。
アミノ酸は20種類だけなのに、コドンは64通りもあるということは、当然、余分なコドンが生まれます。
(※理論上は20種類のアミノ酸に対してそれぞれ1つのコドンが対応する20通りに加えて、開始と終わりを示すコドンをプラスして22通りまで圧縮できると考えられています。)
実際、ほとんどのアミノ酸は1つだけのコドンではなく、複数のコドンを持っています。
例えば「セリン」というアミノ酸は、なんと6通りのコドンで表現できます。
これは同じ意味を持つ言葉がたくさんあるのと似ています。
挨拶をするときに「おはよう、こんにちは、こんばんわ」や「やあ」「おはよう」「どうも」など、いろんな表現があるような状態です。
こうした余分なコードのことを「冗長性」と言いますが、なぜ生命はこれほど重複だらけの言葉遣いをするようになったのでしょうか?
実は、この余分に見えるコード(コドン)を整理して、もっとシンプルなものにできないか、というアイデアは以前から注目されていました。
再び言語を例に出せば、日本語の挨拶を全て「こんにちは」にするようにある種の圧縮を行うわけです。
「おはよう」や「こんばんわ」や「やあ」「どうも」などを全て抹消して「挨拶=こんにちは」以外に認めないような圧縮・統一を、全単語に行えば、言語は非常にシンプルになります。
生命も同様で冗長なコードを減らせれば、生命の仕組みをシンプルに理解できるだけでなく、重要な実用的メリットが生まれるからです。
その一つが、ウイルスに感染しにくい細胞をつくることです。
ウイルス(特に細菌に感染するバクテリオファージ)は、自分だけでは増殖できません。
ウイルスは感染した細菌のタンパク質を作る工場を乗っ取り、自分自身を増やすためのタンパク質を作らせます。
ウイルスの遺伝子情報もまた、感染先の細胞と同じ遺伝暗号(コドン)を利用しています。
そこで、細菌側の遺伝暗号からウイルスが利用している特定のコドンをあらかじめ削除してしまえば、ウイルスがタンパク質をうまく作れず、細胞内で増殖できなくなるのです。
ウイルスが日本の機密情報を盗みに来たスパイAIだとするなら、日本語自体を大幅に圧縮・統一してスパイAIが理解できないものにしてしまうのです。
実際に2019年には、ケンブリッジ大学の研究チームが、64種類あるコドンのうち3種類を削除した大腸菌「Syn61」を作り出すことに成功しています。
このとき、Syn61株は多くのウイルスに対して強い耐性を示しました。
ところが後の詳しい研究によって、一部のウイルスはSyn61が削除したコドンを使わなくても感染できる仕組みを持ち込んでいたため、完璧なウイルス耐性とまでは言えないことが判明しました。
つまり、3種類程度のコドン削除では、まだウイルス感染を完全に防ぐことは難しかったのです。
こうした背景から、本研究の研究チームは、これまでよりもはるかに大胆な試みを行うことにしました。
具体的には、これまでのように数種類のコドン削除ではなく、7種類という、これまでにない規模での削減を行いました。
7種類も削ればウイルスが細胞の中で正常にタンパク質を作れる可能性がさらに低くなり、「理論上はどんなウイルス感染にも耐性を持つ細菌」をつくれると期待されたのです。
果たして7種類ものコドンを排除しても生命活動を続けることができたのでしょうか?