“99%同じ”はウソだった!ヒトとチンパンジーのDNAに15%のギャップ

研究チームは、チンパンジー、ボノボ、ゴリラ、ボルネオオランウータン、スマトラオランウータン、そしてテナガザルの一種シアマンという6種の類人猿のゲノムを染色体の端から端(テロメアからテロメア)までほぼ完全に解読しました。
最新技術により長いDNA断片を一気に読み取り、それらを高精度に繋ぎ合わせていくことで、各染色体を連続した配列として再現することに成功したのです。
今回は各種について2セットのゲノム(雌雄由来のそれぞれのハプロタイプ)を解析し、全染色体で合計215本分の“ギャップ(未解読領域)のない”配列が得られました。
(※より具体的には290本中215本がギャップなしで残りも平均1–6ギャップのみという高精度の配列が得られました)
この精度はヒトゲノムの最新リファレンス配列に匹敵し、過去の類人猿ゲノムのドラフト配列で問題となっていた欠損やエラーが大幅に解消されています。
ヒトと類人猿を比較する際、これまではヒト側の配列品質が高いために起こるバイアスも指摘されていましたが、今回のデータセットではヒトも他の類人猿も同等の品質で比較できるようになりました。
例えば今回、新たに得られたゲノム配列を用いてヒトとチンパンジーを比較したところ、これまで「揃わないため」に無視されていた領域を含めると、両者のゲノムの違いは最大で15%にも達することが示されました。
従来の“一塩基置換”レベルでの違い(約1~1.5%程度)に加えて、どちらか一方にしか存在しない配列(大規模な挿入・欠失や重複の差異)が全ゲノムの1割以上を占めていたのです。
言い換えれば、ヒトとチンパンジーのゲノムを丁寧に重ね合わせていくと、約8分の1(12.5~13.3%)もの領域で対応する配列同士がずれたり欠落したりして、もはや整合しないことが分かったのです。
これはセントロメアやサブテロメア(染色体の端近く)などに存在する急速に進化した領域で特に顕著でした。
また、従来「1%」と言われた一塩基レベルの違いについても、厳密に測れば約1.5%ほどあることが示されています。
以上を総合すると、ヒトとチンパンジーのゲノムの最大15%(14~14.9%)が何らかの形で相違しているということになります。

では、その「見えてきた差異」とは具体的にどのようなものだったのでしょうか。
大きく分けて、ゲノムの構造そのものの違いと、DNA配列の重複や欠失による違いが見つかりました。
前者の例としては、染色体の一部分が逆向きになっている「倒位」や、染色体上で位置が丸ごと移動した領域などが各所で発見されています。
例えばゴリラでは、ある染色体上で4.8Mbもの大型のDNA断片が12.5Mb(1250万塩基対)離れた下流に「引っ越し」していたことが判明しました。
ボノボでは、多くの染色体でセントロメア(細胞分裂のときに染色体を引き寄せる要所)を形づくる アルファサテライト DNA(同じ短い文字列が延々と並ぶ配列)が、わずか 10 万塩基(100 kb)に満たない “超コンパクト版” でも正常に働いていることが分かりました。
後者の例としては、セグメンタル重複(数万塩基もの長さのDNA配列が重複した領域)の比較により、各種に固有な新しい機能が判っていないRNA配列(トランスクリプト:転写産物のこと)が次々に見出されました。
(※研究チームによれば、各類人猿ゲノムあたり770–1482のまだ機能が判っていないRNA配列がこれら未踏の領域から発見されており、中にはヒトとチンパンジーで片方にしか存在しないものも多数含まれるとのことです。)
こうした大型の反復領域は旧来の手法では解析が難しく詳細が不明でしたが、長鎖リード解析により初めて全容が捉えられたのです。
免疫や脳に関係する遺伝子群でも違いがみられました。
例えば主要組織適合複合体(MHC)と呼ばれる免疫遺伝子の巨大クラスターは種ごとに大きく構造が異なり、ヒト固有のバリアント(変異型)がヒト特有の疾患に関与する可能性が示唆されています。
また脳の発達や機能に関連する遺伝子にも、人類の系統で大きく変化したものが複数見つかりました。
例えば音声によるコミュニケーション能力に関わるある遺伝子では、ヒトに特有の調節配列が追加取得されており、これがヒトの言語獲得能力に寄与している可能性があります。
このように、6種の類人猿ゲノムを網羅的に比較することで、これまで見落とされていた多数のゲノム“ギャップ”や種特異的な重複配列の存在が明らかになりました。
それらの詳細な分析から、各種の分岐年代の再推定やゲノム進化のパターンの比較も行われています。
例えば、本研究によりヒトとチンパンジーの分岐は約550万~630万年前、ゴリラとの分岐は約1060万~1090万年前と見積もられています。
さらに、ゲノム中の系統間の不一致(不完全な系統継承)も詳しく評価され、ヒトとチンパンジーの場合ゲノムの約40%にその痕跡があることが分かりました。
これは以前考えられていたより高い割合であり、ゲノムの未解読領域を含めたことで見えてきた現象だといいます。
このように本研究は、ゲノムの過去から現在までの変遷を細部に至るまで再構築できる新たな資料を提供したのです。