wang wang - 哈佛医学院、德国马普所分子人类学博士后 祖源分析

中国人祖先起源与迁徙史

命题作文:
1. 在大众的认知中,提到中国人的祖先可能会想到北京人/元谋人/蓝田人/河姆渡人/山顶洞人等等,我们希望知道直立人与智人的区别和关系(包括迁徙时间不同、直立人的灭绝原因等等)

*********************************
我们从哪里来是大家都普遍关心的问题,人类的起源也就成为了科学研究中的一个最重要议题。人猿分离之后,地球上出现的人科物种有许多种,人科这一谱系中已知的最古老的人科物种的化石是在非洲发现的距今大约700万年前南方古猿阶段的撒海尔人乍得种,而在亚洲和欧洲发现的最早的人类化石都属于直立人阶段,不超过200万年,因此对于人类起源的最初地点是非洲这一论断,学界普遍是接受和认同的。但是,亚洲的直立人化石和非洲的直立人化石在年代上还无法区分开,能人是在非洲演化成直立人然后扩散到整个旧大陆还是能人的后代有一部分离开非洲并且在非洲之外演化成直立人随后分布到整个旧大陆至今也未有定论。无论直立人是在非洲演化还是在亚洲演化,最早的古人类是从非洲分散到旧大陆的观点是没有争论的,现代人的起源才是人类学领域争论最为激烈的问题之一。

现代人起源的问题牵涉到两种学说:“出非洲”说和多地区起源说。两种假说都认为直立人起源于非洲的东非直立人,然后大致在100万年前走出非洲,迁移到欧亚大陆。多地区起源学说则认为不同大陆上的古人类独立、连续地进化成了现代人,即由各地的非洲直立人、海德堡人、尼安德特人、东亚直立人各自独立进化到现代人类的几大人种。例如亚洲蒙古人种是由亚洲的爪哇猿人和北京猿人等直立人,经过大荔人和马坝人等早期智人阶段,直系演化发展成柳江人和山顶洞人等晚期智人,再发展到现代的亚洲蒙古人种。还有一些中间学说,比如多地区起源附带杂交,既承认现代人的多地区起源,又认为不同大陆上的古人类有过基因交流。多地区起源说的最强有力的证据来自不同地区保存的从古人类各个阶段直到现代人的完整的化石记录,包括北京猿人和爪哇猿人。古人类学家们依据人类化石和旧石器的考古文化,认为各地区的直立人到早期智人再到晚期智人在人类骨骼和形态上均表现出了连续进化的特征,因此他们的进化应该是连续的。但“出非洲”说认为现代人类起源于10万年前非洲的第二次迁移,走出非洲以后完全取代了其它地区的古人种。支持非洲起源说的证据主要来自分子人类学的研究成果。1987年,艾伦•威尔逊等人组成的来自美国加州大学伯克利的研究小组提取了来自亚洲、欧洲、非洲、新几内亚以及澳洲土著群体的共147名妇女的胎盘细胞中的线粒体DNA进行研究,并绘制了线粒体DNA的系统树,这个系统树的根部出现在非洲,时间约距今20万年。威尔逊诙谐地说:“我们可以将这位幸运女性称为夏娃,她的世系一直延续至今”,这就是著名的“线粒体夏娃”学说。许多后续研究也支持了“线粒体夏娃”学说,比如复旦大学金力实验室用严格父系遗传的Y染色体证据分析包括中国人在内的东亚人群起源问题。

两种学说争论的焦点就在于其他古人种能否与解剖学上的现代人杂交及他们对现代人的基因库是否有贡献。尼安德特人(尼人,Neanderthal)为解决上述问题提供了线索。尼人是已经灭绝了的古人种,他们2.5万年前生活在欧洲以及中亚和西亚的部分地区。化石证据显示尼人与早期现代人极可能共存了2万年。如此长时间的共存,尼人与现代人的栖居地在中东和欧洲甚至还有重叠,这就极大增加了尼人和现代人基因交流的可能性。解决这问题的一条途径是直接将尼人和现代人的DNA 序列进行比对。已有的众多尼人的线粒体DNA 数据无一例外均证明尼人对现代人的基因库没有贡献。但也可能尼人可与现代人杂交,只不过他们的线粒体基因经漂变而逐渐丢失了。2010年,德国马普所Pääbo领导的研究组对尼人全基因组分析就得到了稍有不同的结果,非洲现代人中依旧没有发现任何尼人的遗传成分,但是在非洲之外的现代人群中,都发现有1%—4%的尼人基因组成分。而且,这些基因交流是在大约7万年前现代人刚刚走出非洲的时候发生的,其后就再也没有发生过,虽然现代人与尼人在欧洲共存了数万年。所以走出非洲以后分化形成的世界各地的人群中都保存了相同的尼人基因比例。4万年前生活在北亚的丹尼索瓦人(丹人,Denisovan)的全基因组也被成功解析,在亚洲大陆上的现代人群中没有发现任何丹人的遗传成分。反而,在大洋洲的新几内亚土著人群中发现了大约6%的遗传比例。很有可能新几内亚土著的祖先在迁徙途经中南半岛时接触到了丹人群体,发生了基因交流。所以可以确定,丹人的地理分布很广泛,至少从北亚到东南亚都存在,而且人口不少,有机会把可观的遗传基因流传到新几内亚现代人中。东亚现代人为何没有与丹人发生基因交流,这是一个不容易解释的事实。研究者曾经期待早期的东亚现代人会有更多的尼人或者丹人遗传成分。但是,2013年新发布的北京周口店地区4万多年前的田园洞人基因组,却与现代的中国人几乎没有差别,没有更多尼人或丹人的遗传成分,其线粒体也是“出非洲”的支系之一。由此看来,现代人与尼人和丹人之间的基因交流可能发生过,但是非常有限,对现代人的贡献很少。古基因组学的这些研究成果并不能推翻由线粒体和Y染色体得出的现代人起源于非洲的证据,更加不支持多地区起源说中认为现代人源于各地区的古人类的说法。

图片1.jpg

图示:直立人和智人是真人属后期的两大分支(参考自:李辉(2013)遗传学对人科谱系的重构.从基因中重新认识人类进化历程.现代人类学通讯 7:1-11)

nrg3625-f1.jpg

图示:现代人起源、迁徙以及与尼安德特和丹尼索瓦等古人类的混合(参考自:Veeramah, K. R., & Hammer, M. F. (2014)Nature Reviews Genetics, 15(3), 149-162)

*********************************
 
2.展示较为完整的人类迁徙史和中国人祖先迁徙史,包括所有的重要节点(迁徙时间、路线、迁徙原因)
 
这是一个很宏大的命题,人类的迁徙较之于人类起源更复杂、更难以推断,因为人类的迁徙具有层次性、反复性,也就是多次迁徙与人群回流,对于特定人群、特定迁徙路线和事件的解释有很多,当然争议更多,来自考古学、语言学、民族历史学、遗传学等多学科不同学说纷繁复杂,我这里仅讨论遗传学方面得出最新成果。
 
人群的迁徙和分布与气候的变迁有着密切的关系,为便于从不同角度探索和认识人群演变规律,这里先介绍一些近10 万年来的气象学的材料。在距今约 11 万-1 万之间,也就是考古学上的旧石器时代到中石器时代,地球处于末次冰 期,那段时间的海平面远低于现在,许多现在的岛屿与大陆相连,成为了人 类迁徙的重要通道。距今 2.65 万年到 1.9-2 万年是末次冰盛期,是末次冰期中气 候最寒冷、冰川规模最大的时期,亚洲的绝大部分、北欧和北美都被冰雪覆盖, 人类的生存空间也随冰川蔓延而逐渐缩小。大约 1.5 万年前,气温开始转暖,冰川也开始退却,现代人才迎来了迁徙的黄金时期。 

Untitled-1.jpg

图示:从常染色体角度看人类的迁徙和混合(参考自:Lazaridis I, et al. Nature, 2014, 513(7518): 409-413)

首先,从常染色上来看, 世界人群可分为两大类,一类是非洲人群,另一类是走出非洲后的欧亚人群,欧亚人群又分为遗传差异很大的欧亚西部人群和欧亚东部人群,欧亚西部人群主要包括欧洲、中东等,欧亚东部人群主要包括东亚、东南亚、大洋洲等,而中亚、南亚和部分西伯利亚人群基本可以看作是东西两方混合的结果。
 
在欧亚西部,又分为三类人群:西欧的采集狩猎人群、西伯利亚采集狩猎人群(比如贝加尔湖两万多年前的古人MA1)以及近东的农业人群。近东的农业人群与采集狩猎人群的区别在于他们有着一种来自欧亚人群底层的古老遗传成分,这一成分和欧亚人群是兄弟支系。而1万5千多年前到达的美洲的美洲土著是由西伯利亚采集狩猎人群和东亚人群混合而成的,东亚成分占到60%-70%。在欧亚东部,主要分为两类人群:一类是东亚人群(主要是中国人、日韩、部分中南半岛人群),另一类是南亚和东南亚、大洋洲岛屿上的土著,比如安达曼人、巴布亚人、澳大利亚人等。现在学界争论的焦点是这些岛屿上的土著是按“南方路线”先于欧亚人群到来的吗?还是仅仅由于适应当地环境才形成了独特的体质特征(身体矮小、肤色棕深等)?
 
其次,从父系Y染色体的角度来看,全世界的男性都可以追溯到二十多万年前的一个东非晚期智人男子。进而,全世界又可以分为20种主干类型,称为单倍群,编号从A到T。最古老的A和B单倍群都没有走出非洲,C和D单倍群最早来到了澳洲和亚洲,E单倍群来到了亚洲又回到非洲 (图a),F单倍群衍生出GHIJ等单倍群在西方形成欧罗巴人种,衍生出K单倍群并形成NOPQ等单倍群在东方形成蒙古人种(图b),其中O单倍群成为了中国人的主流,而Q单倍群成为美洲土著印第安人的主流。
 
在DE/CF和C/F分支之间只发现了很少的SNP位点,这表明DE、C和F很可能是在一千年内相继产生的。自单倍群F和C分开之后,在1.8万年的时间内我们都没有看到F支系里有大的分支事件,表明F支系经历了强烈的瓶颈效应。值得注意的是全部的初级单倍群,也就是G, J, N, O, Q和R都是在末次冰期前(约2万年前)分支出来的,并且大部分现在已知的欧亚大陆东部支系是在旧石器时代晚期(1万年前)产生的。进化树上7千年前的分支都是二叉的,这表明在旧石器时代缓慢的群体增长率、瓶颈效应或遗传漂变淘汰了大部分曾经存在过的支系 (图c)。
 
末次冰期之后,尤其是进入新石器时代有了农业之后,人群开始了大量增长,表现在Y染色体上就是出现了大量的下游分支节点。最惊人是在O-M324下发现了三个星状扩张,既是在M117下游、M134xM117复合单倍群的下游以及002611下游,我们将其依次命名为Oα、Oβ和Oγ (图d),这些父系支系在很短的时间内(500年内)成功扩张。这三个支系在现在的大部分东亚族群里的频率都很高,总共占到了现今全部汉族的40%,其中Oα占到16%、Oβ占11%、Oγ能占到14%,也就是说现在大约有3亿男性是新石器时代晚期三个男人的父系后裔。这三个支系的扩张时间分别是5400、6500和6800年前,而中国北方全面转入农业阶段的时间也正好是6800年前,也与黄河中游的6900-4900年前的仰韶文化、黄河上游6000-4900年的马家窑文化以及黄河下游7400-6200年前的北辛-6200-4600年前的大汶口文化等的时间相契合。由此,我们认为这三个在新石器时代晚期快速扩张的支系奠定了东亚的父系遗传基础。与狩猎、采集相比,农业提供了更稳定的食物供给,足以养活更多的人口,而且使男性远离危险的狩猎活动,所以狩猎相关的男性死亡率的降低。
 
末次冰期之后,也就是万年左右的时间尺度内,这些支系(图d)就能很好地和语系族群对应了,比如说O-M119在中国东南沿海、侗傣族群、台湾原住民中集中分布。O-M95在华南、南方少数民族、中南半岛及印度Munda人群中分布较多。O-M176则最主要集中于朝鲜半岛、朝鲜族和日本人中。O-M7在苗瑶和孟高棉人群中高频出现,但在汉族中却不足5%。在历史时期,也就是距今千百年的时间尺度里,Y染色体还可以追溯家族的源流。Y染色体类型(C-star cluster 星簇)可能是成吉思汗或者其近亲宗族的父系类型,出现在了从太平洋一直延伸到里海广阔地域,占到了全世界男性的0.5%。爱新觉罗家族的类型可能属于C-M401这一类型。

13560_1_figure_268069_mm3332.png


13560_1_figure_268083_mmbbk5.png


13560_1_figure_268070_mmyyy2.png


13560_1_figure_268071_mm7772.png

 
最后,从母系线粒体DNA(mtDNA)来看,mtDNA 的支系分布也是很有地域特异性的,例如非洲大陆特异地单倍群 L 比欧亚人群中发现的类型都要古老,L 单倍群被分成 L0,L1,L2, L3, L4,L5 和 L6 这几支, 产生于13-20多万年前,其中 L3 是欧亚人群中的 mtDNA 的祖先类型。非洲以外的所有 mtDNA 分为 由L3单倍群在大约6-7万年前衍生而来的M 和 N 两大超级单倍群,其中 N 包括了所有欧亚西部特异的谱系 H、I、J、K、T、U、V、W 和 X,东亚特异的 A、B、R9,N9 以及大洋州特异 的 P 单倍群也属于 N 分枝;M 单倍群的下游分支有分布在东亚 C、D、G、M7、 M8、M9 等以及在南亚和东南亚常见的 M 根部支系。美洲土著人群的分析则表明他们大多只属于 A、B、C、D 这 4 种单倍群,很少的个体属于 X 单倍群。
 
我们前面提到父系Y染色体在新石器时代有了农业之后开始了大规模的扩张,而母系mtDNA则是在末次冰期刚结束,也就是1万5千多年前就已经开始了人口膨胀,各类型的地理分布差异也就愈发明显。在东亚北方和南方的mtDNA单倍群分布非常不同,东亚北方主要由A,C,D4,D5, G, M8, M9, N9, Z支系组成,而南方为B4, B5a,F, M7, R9等单倍群组成。
 
北方谱系中的C、D、G、M8、M9都是M单倍群的下游分枝,M单倍群只存在于东非、南亚、大洋州,东亚和中亚群体中,而在欧亚西部地区几乎完全缺乏。北亚主要的mtDNA单倍群是C, D, A, B4, G及N9等一些在东亚也高频出现的单倍群,另外混有一些末次盛冰期之后从欧亚西部流入的以H、J、U为主的支系。东亚来源的北亚单倍群有M下的 C, D, G, M3, M7-M11, M13和Z单倍群, N支系下的 A, N9a 和 Y,以及R支系下的 B, F, R9, R11。单倍群C和D在东北亚非常多,在某些群体中所占比例超过50%,甚至能达80%以上。通过对单倍群C和D的样本进行全测序,发现C和D的祖先支系早在3-5万年之前就已经在东亚诞生,并且随即进入南西伯利亚,而大多数的北亚C和D支系都是在末次冰盛期之后才扩张。虽然北亚的主流单倍群是C和D,而单倍群A也在某些群体中高频分布,比如占到了楚克其人的73%。北亚的单倍群B的支系主要是B4和B5,这两个支系分布在偏南的朝鲜和蒙古地区。mtDNA单倍群A在藏族中占到了相当高的比例,平均能达到10%-14%,同时在门巴族(23.5%)和珞巴族(15%)中的频率更高。单倍群D所占比例比A还要高,能达到10%-20%,在珞巴中甚至高达30%。单倍群C在西藏群体中也能占到5%左右。青藏高原藏族中的单倍群A、C、D极可能是由1-2万年前从东亚北方向南进入高原的人群带入的。
 
而在南方,壮侗和南岛语系同时具有高频率的M7,南亚语系的F单倍型频率也比其它语系高出许多。壮侗群体中,频率最高的单倍群是B4a, F1a, M7b1, B5a, M7b*, M*, R9a, R9b, 这些单倍群的频率总和占到了约一半。苗瑶族群与壮侗族群相似,单倍群B5a, B4a, M*,M7b*, C, B4b1, M7b1, F1a, B4*, R9b也能占到一半,而南亚群体中,频率较高的有F1a, M*, D*, F1b, N*, C, M7b*, M7b1, F1a1a, 前三种占到50.8%,与壮侗和苗瑶略有不同。单倍群B, M7, F, R的总频率在台湾原住民中能占到70%,在壮侗中也达到了66.4%,比苗瑶的58.9%和南亚的48.9%更高,而越往北的类群这一数值就越小,例如占汉族40.8%, 占藏缅族群的37.5%, 而仅占到阿尔泰族群的16.3%,由此可见,B, M7, F, R这四类单倍群是可以代表中国南方的特征单倍群。

nrg3966-f5.jpg

图示mtDNA揭示的人类起源和迁徙时间和路线(参考自:Stewart, J. B., & Chinnery, P. F. (2015).Nature Reviews Genetics, 16(9), 530-542)
2016-08-05 • IP属地德国
按热门排序    按默认排序

37 个回复

对于M119在侗傣族群集中分布这是某机构早年所谓的成果,目前大量侗傣族群数据来看M119在侗傣族群比例远少于汉族平均水平。侗傣族群内M95,C3南支,M117都远比M119多。对于某些机构还在引用所谓M119在侗傣族群集中分布的错误说法,只能说所谓专家有时远不如民科。
wang - 哈佛医学院、德国马普所分子人类学博士后
@华姐 在写了
william0509 - 人文地理爱好者
@wang王博士,能发布一份对应时期的母系扩散的话还就更好了。
细思极恐的是,“4万年前的田园洞人,和今天中国人几乎没有差别”,但是我们的父系Y染色体明明1.5万年前才抵达中国境内
蓝星旗 - There is no death,there is the Force. [禁言中]
[ 由于内容不当, 此内容已被隐藏 ]
汉刘一家 - 还原历史真相!
好文章
M117下游、M134xM117复合单倍群的下游以及002611下游
什么叫复合单倍群?M117 = O2a2b1a1;M134 = O2a2b1?
请问四张父系Y染色体图示(a)~(d)的出处?
想问一下现在wegene提供的基因树里已经没有O3了,O2A1C1是否对应原来O3的主支下呢? 是否有新旧基因树图标可供参阅?
好文章,王博士分析得相当透彻!
O-M159 (O2a2a1a1a)  Dai/Tai-Kadai? Austronesian?
丁丁 - 干啥啥不行 学啥啥不会
这王博士老正经了
1.有媒体说藏族彝族有丹尼索瓦人基因,是不是又在胡说?
2.据说还有未能搞清来源的谜样人种的基因像尼安德特人的基因一样融合在晚期智人中,是不是?
大型科普贴
qqcoolj - O1a
这样得贴应该置顶
收了
厉害厉害
收了
收藏本帖
不错
厉害,科普了,还那么详细,涨见识了
难怪非洲美洲大洋洲澳洲还处在原始社会,原来是第一批走出非洲的并且由于大洋阻隔被孤立,文明一直处于几万年前的水平
楚科奇人当年可能在中原生活过,被汉族父系赶去西伯利亚了。因为我的k47,里面有东北亚,且不低,东北亚的坐标就是楚科奇人,完全和现代汉族人没交集。
Screenshot_20200207_222919_com.android_.browser_.jpg
Screenshot_20191124_140427_com.wegene_.future_.jpg
楚科奇人祖先曾在中原生活的证据是?
好文章,没有失望过
君不行兮夷犹 - 东皇太一
又在胡说八道了,东南亚才是人类演化的大本营
Colorfully - WeGene社区常驻活跃分子
学习学习
1zbab
很不错
有意思
搞木清爽:世代居于苏北小县城镇/为什么会掺杂有韩国/南朝鲜卑R基因??/
基因心片海鹏奏 - 2022/11/11一个惦记终身日子/与wjy相遇相识交好生两伢…叫一钢一强还有一个LiLy………38210953303298祖上有姓张、冒、纪、…几乎全O型血
父系单N1a1a1a4/母系G2a/C意味着什么??/是小众人群/基因劣质吗?
学习了知识了
知识大喷发时代…
收藏了
Creator0 - 输入中

要回复问题请先登录注册