実は完全に完了していなかったヒトゲノム計画
今から20年前、ヒトゲノム計画を推進する機関とセレラ社(Celera Genomics)の双方から、ヒトゲノムの解読が終了したと発表されました。
しかしこの一般的に流布されている話には裏がありました。
実は「終了」したのは「当時の技術で読み取れる範囲」の解読だったのです。
つまり、できる範囲をやったから「終了」したというわけです。
ヒトゲノムの中には解読を阻む難所が複数存在しており、実に全体の約8%にあたる配列が未決定のままでした。
主な難所となっていたのは、DNA塩基配列が繰り返される部分です。
既存の技術は、DNAを細かい断片に分割してから配列を解読し、後でつなぎ合わせて全体を把握する、というものであったため、「AGAGAGAG」のように同じ文字の繰り返しが延々と続く部分では正確に読み取れなかったのです。
しかし今回、研究者たちはオックスフォード・ナノポア社が開発した一度に100万文字が読める技術で繰り返し配列を力技で越えると同時に、パックビオ社が開発したDNAにあてたレーザーの反射から配列を直接的に読み込んでいく超高精度な方法で検証していきました。
結果、本当の意味でヒトゲノムの全ての配列を端から端まで解読することに成功します。
最新の方法で読まれたヒトゲノムにはタンパク質をコードする部分は1万9969個となります。
これは2019年の研究で更新された数(1万9890個)よりも79個多くなります。
どうやらヒトゲノムのタンパク質コード領域は2万個にギリギリ満たない数なようです。
また興味深い点として、今回の研究で解読対象となった細胞は、染色体の数も通常の半分にあたる、23本しかないものが選ばれました。
研究者たちは、いったいどんな細胞のゲノムを読んだのでしょうか?