参考文献
A world in a grain of sand: human history from genetic data
Gen Bio 12:234(2011)
Reconstructing human origins in the genomic era
Nat Rev Gen 7:669(2006)
Mapping Human Genetic Diversity in Asia
Science 326:1541(2009)
ゲノムから見た人類の拡散と適応
木村亮介
人類の移動誌 印東道子編 臨川書店(2013) pp25-37
↑ 常染色体解析の方法についてのわかりやすい解説です。
近年の常染色体解析による研究で何が読みとれるか、という話です。
これまでの遺伝子的手法による人類史の解析は、mtDNAとYchrによるものが主体でした。これらの遺伝子の特徴のひとつは、組み替えが起こらない、ということです。
ヒトは22対の常染色体と1対の性染色体(男はXY、女はXX)を持ちます。
細胞の常染色体は片方が父親由来、片方が母親由来で微妙に異なる2種類の配列を持っています。これが、減数分裂して卵細胞または精細胞になるとき、父親由来の染色体と母親由来の染色体が組み替えを起こして混じり合います。つまり、卵細胞または精細胞は一本分の染色体の遺伝情報を持っていますが、その由来は、
父父父父母母母母父父父母母父父父父父母母母…………
と、モザイクのようになっています。
これを卵子と精子から受け継いで、次世代の染色体が決まるわけなので、ヒトの細胞の染色体は、
父方の(精子由来)
父父父父母母母母父父父母母父父父父父母母母…………
母方の(卵子由来)
父父母父父父母母母母父父父母母母母父父父母…………
と、由来からいえば、かなりモザイクな状態になっているわけです。
ところが、mtDNAは母方からのみ引き継がれますし、Ychr(正確にはNRY(non-recombinant Y-chromosome Ychrの組み替えしない部分))は父方からのみ引き継がれます。組み替えはありません。
mtDNAの染色体の由来は、
母方の(ミトコンドリア由来)
母母母母母母母母母母母母母母母母母母母母母…………
Ychrの染色体の由来は、
父方の(Ychr由来)
父父父父父父父父父父父父父父父父父父父父父…………
と、モザイクに混ざり合うことがありません。
なので、もしどこかで突然変異で配列が変化した場合、それは同じ形で子孫に引き継がれます。離れた場所でもう1つ変異が増えても、それも以前の変異と同時に、同一の個体に引き継がれます。さらに1つ変異が増えれば、こんどは3つの変異がまとまった形でどんどん子孫に引き継がれていきます。なので、ひとりのmtDNAあるいはYchrを調べれば、過去に受けた変異の全てがそこに記録されているのです。50人程度のDNAを調べるだけで人類の系統樹が描けるのは、ひとりひとりに遺伝子変異の痕跡が明白に残っているからなのです。
一方、常染色体では複数の変異をまとめてハプログループを設定するのは組み替えがあるために問題が生じます。離れた部位にある2つの変異は、組み替えのために片方だけしか子に引き継がれなかったり、あるいはまったく引き継がれなかったりします。
しかし、組み替えは無作為に起こるわけでなく、組み替えホットスポットという特定の部位で起きやすいことがわかっています。特にタンパク質をコードしている部位の中で組み替えが起こることは基本的にありません。
組み替えホットスポットから次のホットスポットの間は、基本的には組み替えで分離したりしないで、まとめて子孫に引き継がれていきます。そのためmtDNAやYchrと同様にハプログループを設定することができます。このようなゲノム領域ごとに独立に解析が可能なハプログループが存在するとも言えます。血液型やGm遺伝子の多型をもとにした研究は、このようなタンパク質の一つだけを対象にした研究であったとも言えますが、それでもなおmtDNAの研究以前に人類のアフリカ起源を示唆したりなど、成果をあげていました。ただし、常染色体に起こる変異はそもそも少ないため、ひとつひとつのハプログループの情報量はmtDNAやYchrに劣ります。
とはいえ、常染色体のハプログループはmtDNAやYchrにはない全く別の特性があります。
effective population sizeというものがあり、これは次世代に遺伝子を伝えるのに関わっていると考えられる仮想上の個体数のことです。あるハプログループのTMRCA(Time to the most recent common ancestor 一番最近の共通祖先の年代)はこのeffective population sizeが大きいほど古くなることが知られています。mtDNAのTMRCAが、つまり有名なミトコンドリア・イブであり、その年代は20万年前程度と推測されています。
常染色体の遺伝子は、男女にそれぞれ2種類ずつあるわけですから、男に1種類しかないYchrや女由来のもの1種類しかないmtDNAに比べ、種類が4倍あることになります。4倍ということは、effective polpulation sizeも4倍に相当することになるのです。そのため、常染色体から解析されたハプログループのTMRCAは、mtDNAやYchrのTMRCAよりはるかに古い年代になりえます。またX染色体上のRRM2PMのように極端に古い年代が出るものがあり、それは旧人との交配で得られた遺伝子と推測されています。
mtDNAやYchrは20万年前までしかたどることのできないものですし、出アフリカや新大陸進出など、大きな創始者効果が起こるたびに情報は極めて少なくなります。ところが、常染色体の情報はこのような創始者効果を越えて、さらに昔までたどることができます。mtDNAやYchrの研究だけでは出アフリカ直後などの解析は本質的に困難なのですが、常染色体の研究では解析が可能になります。
近年、次世代シーケンサーの開発により、比較的容易に個人の全ゲノム配列を解読することができるようになりました。その情報量は極めて多く、数人の個人を比較するだけで、過去の遺伝子ボトルネックなど重要な情報を引き出した報告もあります。また適切に民族グループを設定し、多数の人々の解析を行うことで、民族ごとに含まれる変異の由来が見えてきます。
常染色体には多数のSNPs(single nucleotide polymorphisms 一塩基多型)があります。これはDNAのどこか1カ所の塩基が他の塩基に置き換わっているというものです。30億bpあるDNA全体の1000塩基に1つの割でこのようなSNPsがあるとされます。場合によってはこのようなSNPsの違いによって病気へのかかりやすさが変わってきます。たとえばNOD2という免疫に関わるタンパク質のとあるSNPsがあると、クローン病という病気にかかりやすい、など。このような疾患感受性遺伝子というものは、現在非常に多数知られています。
現在は、マイクロアレイという方法で数万個のSNPsを一気に検査できます。マイクロアレイというのは、小さなプレパラートに、SNPsを検出するためのプローブという短いDNA配列を数万個、まるで印刷するように並べてあるもので、このプレパラートにヒトの検体を少量流し入れて反応させて処理するとSNPsによって蛍光が光ります。この蛍光を顕微鏡で自動解析すると、数万個のSNPsが一気に検出されるわけです。これは大量生産である程度安価に作れ、また解析も自動化されているために数千人のそれぞれ数万個のSNPsを検査するという極めて大規模な研究もできます。これは数千人にあるそれぞれ数万個のハプログループを同時に検査しているようなもので、膨大な情報量を含んでいます。
このような研究が、
Mapping Human Genetic Diversity in Asia
Science 326:1541(2009)
です。このような研究が出たことで、2010年にCurrent biologyのレビュー特集が組まれたようです。つまりそれだけ、画期的な研究であったということかと思います。
つづきます。すみません。