共通先祖以前に生まれたタンパク質を探る
研究チームは、新しい視点として「タンパク質全体」ではなく「タンパク質ドメイン」(折りたたみや機能の単位)に注目しました。
そこでまずタンパク質の情報を収めたデータベースから、原核生物(細菌・古細菌)全体にわたって解析し、どのドメインがどの系統樹のどの位置で分岐していったかを追跡。
そのうえで、Archaea(古細菌)とBacteria(細菌)が分かれる前の祖先、すなわちLUCA(Last Universal Common Ancestor)の段階から存在していたドメインを選別しました。
これらの古いドメインをもつタンパク質を集めることで、LUCA時代のアミノ酸利用の傾向を解析。
さらに、それらをやや後期のドメイン(「post-LUCA」)と比較することで、「古い時代ほどどのアミノ酸が少ない・あるいは多かったか」を推定したのです。
結果として、LUCA由来のドメインは小さなアミノ酸を特に多く含み、一方で大きなアミノ酸は後から追加された可能性が高いことが示されました。
とくに、システインやメチオニン、ヒスチジンといった金属結合や硫黄系代謝に直結するアミノ酸は、従来のコンセンサスよりもかなり早い段階で組み込まれていた形跡が見られたのです。
これまでの研究でもグリシン(G)、アラニン(A)、バリン(V)、イソロイシン(I)、トレオニン(T)などは従来も“早期”に加わったとされていましたが、今回の解析でより強い裏付けが得られた形です。
もし遺伝コードとアミノ酸の対応が最初から完成されたものであった場合、このような時間のずれが起こることはあり得ません。
一方、グルタミン(Q)などは、非常に遅い段階(19番目)で追加された可能性が高いことが示唆されました。
これは従来の推定と大きく異なるポイントです。
特に衝撃的だったのは、メチオニン(M)、システイン(C)、ヒスチジン(H)といった、金属結合や硫黄を含むアミノ酸が“意外にも早期”にコードへ組み込まれていた可能性が示されたことです。
先述のように、ユーリー・ミラー実験などの影響で「硫黄含有アミノ酸は後期に追加された」という見方が有力でした。
しかし、実は原始地球は硫黄(S)に富んだ環境だった可能性が高く、実験条件が実際の古代環境を十分に再現していなかったのではないかという指摘が近年出ています。
ヒスチジン(H)についても、「アミノ酸としての生合成は難しいので遅い」と考えられてきましたが、細胞内で合成経路が発達していれば早くから利用可能だったかもしれない、というわけです。
この点は金属イオン結合に注目すると納得がいきます。
ヒスチジンやシステインは金属イオン(鉄、亜鉛、銅など)を巧みに扱い、酵素反応に不可欠な役割を果たします。
「金属を活用した酵素機能が初期生命においてすでに重要だった」という証拠が増えていることからも、金属結合アミノ酸が後期ではなくより早く追加されていたのはむしろ自然な解釈と言えるでしょう。
さらに分析を深掘りすると、LUCAよりもさらに前から存在した(=もっと古い)系統に属するドメインでは、トリプトファン(W)、チロシン(Y)、フェニルアラニン(F)、ヒスチジン(H)といった芳香族リング構造をもつアミノ酸の使用率が高いことがわかりました。
従来、トリプトファン(W)は「20種類のアミノ酸の中で最後に追加された」と考えられてきました。
ところが、今回の結果ではLUCAどころか「pre-LUCA」と分類される、より古い段階のドメインにWがしっかり含まれているのです。
この事実は、「まだ現在の遺伝コードが完成していない段階の生命体が、なんらかの方法でWを利用していた」と考えざるを得ない、非常に興味深い状況を示唆します。
著者たちは、「異なる環境や異なるコード」を持つ古代生物が同時期に存在し、最終的に“標準コード”へ収束した可能性を提起しています。
すなわち、現在の遺伝コードは「複数あった古代コードの中で勝ち残ったもの」ともいえるのです。