DNAに潜むウイルスが「人間らしさ」を作っていた

古代のウイルスが私たちのゲノムに潜ませた謎のDNAは、現代の私たちにどのような影響を与えているのでしょうか?
これらのDNA配列は、具体的にどのように遺伝子を制御し、私たちが人間らしさを獲得する上でどんな役割を担っているのでしょうか?
こうした謎を解明するため、研究者たちはまず、ゲノムに散らばった膨大なウイルス由来のDNA断片を「正しく分類する方法」から見直すことにしました。
これまでの研究では、ウイルスDNAの分類は主に配列の類似度だけを基準にして行われていましたが、この方法ではDNA断片の微妙な違いや本来の関係性を見逃す恐れがありました。
そこで研究チームは、従来のやり方を根本的に見直し、進化的な系統関係(どのDNA断片がどの断片から派生したかという関係性)や、それぞれの断片が霊長類の種間でどれほど保存されているのか、という視点を取り入れた新しい手法を開発したのです。
具体的には、ヒトや霊長類のゲノムに含まれるMER11というウイルス由来のDNA配列に着目しました。
先にも述べたようにこのMER11は、比較的新しい時代(数千万年前)に霊長類の祖先のゲノムに入り込み、その後数千という単位でコピーを増やしていったもので、これまでMER11A・MER11B・MER11Cの3つのグループ(サブファミリー)に分類されていました。
しかし、新しい系統分類の方法を使って詳しく調べてみると、MER11は実はもっと細かな分類に分けられることが分かりました。
従来の3つのグループは再整理され、新たにMER11_G1、MER11_G2、MER11_G3、MER11_G4という4つのグループに分類されたのです。
この結果、それまでの分類法では約20%近く(正確には19.8%、412個)の配列が間違ったグループに入れられていたことが明らかになりました。
この新しい分類方法により、それぞれのMER11グループが、ゲノム内でどの染色体のどの領域に分布しているのかという特徴もより正確に理解できるようになりました。
さらに、それぞれの新しいグループには、DNAの化学修飾や転写因子の結合パターンといった、遺伝子がオンやオフになる際に重要な「エピジェネティックな特徴」にもはっきりとした違いが認められました。
つまり、この新分類法は単に分類を正確にしただけでなく、DNA配列が持つ機能的な性質の違いまで明確に浮かび上がらせることに成功したのです。
しかし、新しい分類が実際に意味を持つのか、つまりMER11のDNA配列が本当に遺伝子のスイッチ(エンハンサー)として働くのかを確かめなければなりません。
この答えを得るため研究者たちは、「レンチウイルスを用いた多数並列レポーターアッセイ(lentiMPRA)」という新しい実験手法を使うことにしました。
この方法は、調べたい何千種類ものDNA配列をそれぞれレポーター遺伝子に連結して細胞に導入し、それぞれの配列がどのくらい遺伝子の活動を高めるのかを一度に測定できるものです。
具体的には、ヒトのiPS細胞(体の様々な細胞に変化できる能力を持つ細胞)と、そこから分化した初期の神経細胞に、MER11由来の約7,000種類のDNA配列を導入しました。
すると、特にMER11_G4という新しいグループの配列が、他のグループと比べて非常に強力な遺伝子活性化能力(エンハンサー活性)を示すことが明らかになりました。
このことは、MER11_G4が、ヒトの発生の初期段階で重要な役割を果たす可能性を強く示しています。
さらに詳しく調べると、MER11_G4の配列には、他のグループには存在しない特徴的な「モチーフ」と呼ばれる特定の配列パターンがありました。
このモチーフは、転写因子(遺伝子をオンにするタンパク質)が結合する目印として機能し、どの転写因子が結合するかによって、そのDNA配列が働く場所やタイミングが決まります。
研究者たちは、このMER11_G4のモチーフが、ヒトやチンパンジーのような大型類人猿には存在するものの、それより下位のサル(例えばマカク)には見られないことを発見しました。
さらにその違いは、たった1つのDNA塩基が欠失するというごく小さな変異によって生まれたことも突き止めました。
つまり、このたった一つの変異が、新しい遺伝子スイッチを生み出し、ヒトやチンパンジーの発生において重要な役割を担う可能性が出てきたのです。
こうした発見から、古代のウイルス由来DNAが、現代の私たちのゲノムの中で実際に新しい調節機能を獲得し、霊長類種間の違いを生み出す「進化の実験場」となっている可能性が見えてきました。
今回の研究ではMER11を中心に調べましたが、研究チームはこの方法を他のウイルス由来配列にも応用しました。
その結果、他にも本手法を53のシミアン特異的 LTR サブファミリーに適用した結果、26サブファミリー中のインスタンス約30%(3807件)が新たに注釈付けされ、合計75の新サブファミリーが提案されました。
これは、私たちのゲノムに隠されている調節配列をより正確に見つけ出し、人間の特性や疾患の謎を解く新しい道を拓くかもしれません。