Reconstructing the Demographic History of the Human Lineage Using Whole-Genome Sequences from Human and Three Great Apes
Genome Biol Evol 4:1133(2012)
篠田謙一先生の編集された、化石とゲノムで探る人類の起源と拡散(日経サイエンス社:2013)において、ヒトとチンパンジーの分岐年代として引用されていた論文です。
1995年、宝来先生は類人猿のミトコンドリアDNA全配列をもとに、ヒトとチンパンジーの分岐時期を487±23万年と見積もりました。以来、遺伝子の解読技術は飛躍的に向上し、mtDNAのおおよそ20万倍の長さを持つ常染色体を相手に比較検討ができるようになりました。読んだ遺伝子を解析する技術も進歩しており、コンピューター計算速度の向上とともに、膨大な計算量を行う解析法が普通に用いられるようになっているようです。
ただ一方で絶対的な年代を保証するような数値のより所は急増しているとは言えません。具体的にはサヘラントロプスやオロリンなど再初期の猿人の化石年代などですが、発掘された量は豊かとはいえず、そこから確定的な情報を引き出すのはまだ困難といえそうです。
その中で、遺伝子から可能な限り情報を引き出して、年代を決定しようとしたのがこの論文と言えそうです。
彼らはヒト、チンパンジー、ゴリラ、オランウータンの全DNA配列を用いて種の分岐年代とpopulation size(遺伝子継続に関わる1世代の個体数)を決定しようとしました。Marcov chain Monte Carlo法という手法で値を求めていますが、これは乱数的な計算を繰り返して最終的な解へと近づいていく方法です。この方法ではτ=μT (mutation rate x speciation time)つまり変異率×分岐してからの時間、および、θ=4μgN (4 x mutation rate x generation time x population size)、が推測されます。
解析についてはヒトと類人猿のDNA配列を比較のため整列し、ブロック化しています。Marcov chain Monte Carlo法ではそれぞれのブロックが個別の系統を持っていることが必要であるらしく、この報告ではブロック化に工夫を凝らしています。
適切なブロック化の方法を検討するために、彼らは1ブロックのサイズを50bp~5000bpの間で段階的に設定し、またブロックの間隔も500bp以上~5000bp以上、の間で設定し、小規模の解析シミュレーションを行っています。その結果、ブロックサイズが500bp以上では組み替えの影響を被り、またブロック間隔が1000bp以下では隣接するブロックが同一の系統を持つ可能性が高くなることがわかりました。
最終的に彼らはブロックのサイズを100bp、間隔5000bp以上、と設定し、これにより巧みに組み替えによる影響を避けているようです。
また彼らは、DNA配列のうちultramicro inversions, gapped sites, CpG dinucleotide sitesは解析に影響を与えるものとして除外しています。CpG dinucleotide sitesは遺伝子の発現に関わるプロモーター部位にみられる、"CG"という配列に富んだ部位であり、逆にこれ以外の部位では"CG"という配列が非常に少ないことが知られています。この部位でのCはTに変異する可能性が他の部位より15倍も高く、この部位を除外することでより理想的な解析に近づくのだそうです。
計算に与えられる初期値としてDNAの変異率(mutation rate)がありますが、これはHap Mapなどの大規模データベースから推測され、CpG dinucleotide sitesの変異を除外し、また従来のヒト・チンパンジー・ゴリラの研究から一世代(generation time)を20年と設定したうえで、0.436x10-9~0.556x10-9/site/year と設定しています。
また、変異率については、・全てのブロックで同一、・全てのブロックで個別、・全てのブロックで個別で染色体ごとの違いもある、という3つの設定で解析しているようです。
結果ですが、まず彼らは染色体ごとにτ(変異率×分岐してからの時間)がわずかに異なることを確認しています。さらに、X染色体、コード領域、FFD 3rd positions(これは同義置換とほぼ同一です)、についても調べ、それぞれ異なるτ値を持つことを認めています。
このことについて彼らは、ヒトとチンパンジー間のτとヒト/チンパンジーとゴリラ間のτについて、染色体ごとにきれいな相関関係にあることを示し、τの値が違うのは染色体ごとにわずかな変異率の違いがあるからであろう、と結論しています。ただ、変異率が違う原因は不明としています。
コード領域は変異率が低く、FFD 3rd positionsは変異率が高い部位であり、それを反映してコード領域のτは小さく、FFD 3rd positionsのτは大きくなっています。それでも、これらのτ値も染色体で比較した相関関係のグラフの上にきれいに乗ってきます。この結果はτの違いが変異率の違いであるという仮説を支持します。
X染色体については、常染色体よりわずかに低いτ値を取り、これはX染色体がわずかに変異率が低いということかもしれません。以前の報告でX染色体は他の染色体よりやや分岐時期が新しいとするものがあり、そのことからヒトとチンパンジーの分岐はゆるやかで時間がかかり、種が分岐するまでに多く交配し、X染色体は正の選択に働いたために分岐が遅くなったのではないか、という意見があったようなのですが、この報告ではX染色体のτ値については変異率の差で説明すべきもので、ヒトとチンパンジーの分岐は一回のできごとではっきりとわかれたとしています。ただ、分岐後に限定的な少数の交配があったことまでは否定できないとしています。
以上より、ヒトとチンパンジーは単一の大きなイベントで比較的短期間で分岐した。染色体ごとにすこしずつ変異率の差がある可能性がある。と結論しています。
そして、全てのブロックが個別の変異率を持つ、という設定で分岐年代を推測し、
ヒトとチンパンジーの
分岐年代 594万年~757万年前
ヒトとチンパンジー、とゴリラの
分岐年代 761万年~970万年前
ヒトとチンパンジーとゴリラ、とオランウータンの
分岐年代 1470万年~1880万年前
としています。この年代の幅は、最初に設定した変異率である0.436x10-9~0.556x10-9/site/yearによるものであり、よく見られる信頼区間とは意味合いが異なります。(彼らは、設定した変異率の両端である0.436x10-9および0.556x10-9の両者で解析を行い、その結果を年代の両端としています。
オロリンは600万年前、サヘラントロプスは700万年前。また、ヒト/チンパンジー/ゴリラの共通祖先ではないかと推測されている、Nakalipithecusは980~990万年前、Chororapithecusは1000~1050万年前であり、彼らはこの報告による分岐年代が化石年代と合致することを主張しています。
とはいえ、オロリンやサヘラントロプスが、ヒト/チンパンジー/ゴリラの分岐に対しどのような位置づけになるのかが明確でない以上、この報告の年代も、従来の研究と矛盾はしないが推定されている年代の信憑性を特別向上させたとは言えない、という評価になるかと思います。
1995年の宝来先生の研究は、mtDNA全配列のみでの解析であり、時間的な変異率を一定とし、それぞれの遺伝的距離を求めたあとで、その距離のみをもとに系統樹を作成する、という非常に計算量の少ない単純明快な方法で行われたものでした。
それでも、ヒト・チンパンジー・ボノボ・ゴリラ・オランウータンで非同義置換数/RNA領域置換数の一定性が保たれているため、この範囲において時間的な変異率を一定としてよい、という仮定は説得力を持っていると思います。
推定年代は487±23万年前、というものでしたが、これはオランウータンの分岐年代を化石から1300万年前と仮定したことによる結果です。
もし仮に、今回の常染色体解析によるオランウータン分岐年代である1470~1880万年前を採用するのであれば、宝来先生の求めたヒト/チンパンジー分岐年代は、551±26~704±33万年前となり、この報告による594~757万年前、とほとんど重なってきます。
つまり、非常にシンプルに求められた1995年の分子学的推定と、複雑なプロセスで求められた2012年の推定で、結果はほぼ同一なのです。
ただ、この報告に用いられた解析方法は、近隣の種を解析するときに向いているらしく、今後のヒト同士の分岐年代解析などに影響を与えていくことはありそうです。また、年代のもととなった変異率はヒトの大規模データから推測されたもので、それを過去の変異率に当てはめるのは正しいという保証がないのですが、それでもなお化石年代と矛盾しない結果が出るというのは、ひとつの成果と言えそうです。