wang wang - 哈佛医学院、德国马普所分子人类学博士后 祖源分析

“祖源分析”是什么鬼?

                           
08_0202_0103.gif


 
 相信大家在心底都会有这样一个问题:我是从哪里来?又要到哪里去?我们一直在试图回答这两个终极命题。从哪里来,指的是“祖源”分析,从遗传学角度来描绘你的祖先是谁;到哪里去,也就是健康风险,在疾病和遗传位点关联分析的基础上,来预测你患某些疾病的可能性。我这里主要谈第一个问题。

现代科学告诉我们,我们是从500多万年前的古猿进化而来,我们最晚近的共同祖先生活在20多万年前的非洲,在进化的过程中,我们并不孤单,直到3万多年前,地球上还有着我们的兄弟姐妹,比如欧洲的尼安德特人、西伯利亚的丹尼索瓦人,但他们最终灭绝了。而我们的祖先在5-10万年前也走出了非洲,经由欧亚大陆,到达大洋洲和美洲,最后成功遍布了地球上的各个角落。从遗传学的角度,我们没有办法直接将500万年前的古猿DNA和我们的DNA进行比较,但我们可以理清楚从20万年前到千百年前我们的祖先的迁徙和混合情况,比如说你的体内有多少欧洲人的血统?你是南方人还是北方人?甚至可以回答你是不是可能的三皇五帝的后代?

我们的工具是整合了60万个遗传位点的高密度全基因组芯片,包括了近2万个Y染色体位点和近5千个线粒体(mtDNA)位点,剩余的位点位于22对常染色体和X染色体上。这22对常染色体的每一对染色体都有一条来自父系,一条来自母系,两条染色体在传代过程中对应的部分会发生交换,从而造成混血的效应,就是遗传学上说的重组,使得后代带有父母双方的遗传特征。而Y染色体却直接代表着父系遗传,永远是父子相传的,不会受到任何社会文化和自然因素的影响,而且不同类型的Y染色体有着不同的地理分布,所以研究Y染色体是直接追溯群体或者家族的父系起源的最佳方法,是验证祖先与后代的父系关联的唯一手段。例如,在曹操的后人中分析Y染色体特征,我们就可以了解曹操本人的Y染色体特征。同样地,mtDNA只能有母亲传给子女,代表了单纯的母系遗传,我们可以由mtDNA来追溯母亲的母亲的母亲……。我们所检测的Y染色体和mtDNA位点是世界同行业中最多的,所涉及的支系是最全面的,这也是许多溯祖爱好者选择WeGene的原因。相比于Y染色体和mtDNA所描绘的久远历史,常染色体更能反映近千百年来的混血,比如你带有蒙古人特有的Y染色体,但常染色体上却可能是南方汉族。也就是说,要综合这三部分的结果,才能更全面地解读自己的遗传源流。

图片1_copy.gif



祖源分析其实是一个比较的过程,将你的数据和不同人群的进行比较来看你和哪些人群最相近、你可以模拟成由哪些人群按何种比例混合而成的等。因为要比较,所以参考数据库至关重要。举个简单的例子,可能是由于缺少参考数据,23andme只能将你划分为中国人,而Ancestry更离谱地把你认为是波利尼西亚人。而我们有着涵盖全球200多个族群的数据库,在东亚范围内有着北方汉族、南方汉族、日韩、藏缅语、苗瑶语、侗傣语、南岛语、南亚语以及西北和东北的众多蒙古、通古斯和突厥语人群。有了参考人群之后,提取这些人群各自的特征性遗传标记是后续解构祖源成分的关键。这一步主要是根据遗传位点在人群中的频率分布,简单来讲就是A位点的某分型在A人群中高频出现,而在其他人群中是没有的或极低频的,那我们就可以把A位点的这个分型认为是A人群的特征性位点。推算完这些位点的归属人群,那么我们只要数一数你基因组上的不同类别的遗传位点的数目就大致得出了你的祖源成分。
 
虽然我们对东亚人群的解析度远远高于世界范围内的其他同行,但仍有一些问题是现在难以回答清楚的,比如说谁是“源”谁是“流”,我们难以准确判断某样本中高比例的韩国人成分是由于基因从大陆流向朝韩半岛还是相反(或者两者都有),因为我们参考数据库里的现代人群可能都是复杂混合过了的,解决办法是寻找古代的未经混合的人群来做参考数据,这是我们正在做的。
2016-07-24 • 科隆, 德国 •
已邀请:
按热门排序    按默认排序

9 个回复

wang - 哈佛医学院、德国马普所分子人类学博士后
紫蔻 - 人类一思考,上帝就发笑
请教楼主,有没有可能出现一家子都做祖源分析,结果子女和父母相差甚远的情况?如果有这种情况,是不是说明这家人的杂度较高?
支持老王,膜拜一下。顺便问一下,提取古尸中的dna难度是不是比较大,一颗牙齿也可以提取到吗?现在学界有哪些已确认族群身份的古人dna提取到了?可以拿来参考吗。
chengang - WeGene勤杂工
我还以为是来吐槽的~~
蓝星旗 - 孤独的提纯纯合绿豌豆
涨姿势了,第一,看了图示才知道常染色体重组是母亲的两条染色体互相重组、父亲的两条染色体互相重组0_0我还以为是父母的两条染色体之间重组呢^ ^;(本宝宝是文科汪,不要笑话偶)第二,“A位点在A人群中高频出现,而在其他人群中是没有的或极低频的,那我们就可以把A位点认为是A人群的特征性位点。”这么说某些位点是某些族群特有的??不是每个位点都是所有homo sapiens都有,只是ATGC不一样吗……0_0
此外此篇解说也说明了wg的祖源分析都是单位点的,不涉及@rejwa 童鞋猜测的混血儿被测出有父母都没有的父母两族的中间成分是由于遗传重组造成的问题了……
不过,母亲的母亲不是应该叫外祖母咩。。
那张图对于理解遗传重组很有帮助。但要讲的更全面一点,还可加上X染侧体的遗传重组:女性从父母各得一条,重组后传给下一代(女儿或儿子);但男性只从母亲得到一条,而且只能传给女儿(由于只有一条,这个从父亲到女儿的遗传过程中无重组的可能)。值得提到的是,一个母亲的两条X染色体重组的比例经常显著偏离50%(如20%比80%),而且在少数情况下会将其中一条不经重组直接传给下一代。当然,这会把问题搞得更复杂,可能给初学者增加一些困难。
recombination2.png
recombination1.png
lingsan - 我是生物 我是活物
意思是男性的唯一X染色体来自其外祖父母之一,而女性的其中一X染色体来自外祖父母的重组,另一条来自祖父母的任意一位?
紫蔻 - 人类一思考,上帝就发笑
还是综合考虑了Y,mt和常染的结果.
这么看女性的话常染色体中外公的信息相对较少,因为很多时候一条直接来自母亲,如果来自母亲的那条一直不变,外公就在身上消失啦,是吧。另外,如果没有父母的基因信息就不知道自己哪些常染来自父亲,哪些来自母亲?

要回复问题请先登录注册