大多数论文里面Y单倍群是O-Mxxx格式是怎么回事

我们测出来的为什么不是我这样的命名格式,而是O2a2b1a2a1d1什么的,如何对应到Mxxx的格式?
2018-11-30 • IP属地中国
按热门排序    按默认排序

5 个回复

O2a2b1a2-F114是不是说O2a2b1a2=F114?O2a2b1a2单倍群有没有其他存在的代表性突变位点?比如O2a2b1a2-m112或者f118之类的?
首楼腻害!
多谢解惑!
m代表马普所命名
很多朋友表示看不懂字母所代表的含义,这篇文章带大家了解一点点Y染色体单倍群命名的来龙去脉。
Y染色体在遗传的过程中,每经历一定的世代就会出现一个随机的SNP突变,父系关系更近的男性共享更多的SNP突变,通过这个方法我们可以判断不同男性之间的父系家族关系。将所有男性的Y染色体进行对比,我们就能得到人类父系家族的谱系树。

Y染色体联合会(YCC)在2002年根据已发现的SNP突变位点制定了一套命名规则,将Y染色体的谱系树划分为若干个大的Y染色体单倍群(父系家族),并使用大写字母A-T进行命名,用数字和小写字母对各大单倍群的下游支系进行分类。

单倍群后面所加的由字母打头的一串数字则是SNP突变的名称编号。如O2a2b1a2-F114中,O2a2b1a2是单倍群名称,F114是该单倍群代表性突变位点的名称,F是命名机构的代码(F代表复旦大学),114是编号。



由于是早期人为做出的划分,所以这个命名系统现在看存在着一些比较难以理解的地方。



A群为旁系群而非单倍群,包含了单倍群BT之外的所有支系。单倍群BT实际上相当于A1b2。
单倍群的字母并不是严格按照支系的远近关系划分的。比如由于早期发现的SNP较少,认为C、D、E、F是并列的四个支系,后来发现C和F具有更近的共同祖先,D和E具有更近的共同祖先。L、M、N、O、P、Q、R、S、T也是类似的情况。即字母顺序并不能完全反映分化次序和远近关系。
随着样本的丰富和测试精度的增加,原有的树形不断发生着变化,下游分支的命名也不断随之变化。比如原来O-M175下游分为O1-M119、O2-M268、O3-M122三支,由于后来发现O1和O2共享有更近的共同祖先,所以原O1和O2重新命名为O1a和O1b,原O3重新命名为O2。
Y染色体单倍群只是父系家族的标记,并不能作为种族或者民族划分的依据,事实上以字母命名的大单倍群都有超过三万年的共祖时间,下游家族支系可能早已分散到了不同的种族与民族之中。


另一方面,由于SNP突变发生的速率基本是稳定的,这样我们只要得到两个男性的Y染色体各自积累的特异SNP数量,就可以据此计算出这两个男性个体的最近共祖时间。



研究者通过对全球各人群的样本分析发现,全世界的男性都能追溯到24万年前左右的一个共同的男性祖先,科学家给这个祖先取了一个代号为“Y染色体亚当”。



研究者还发现非洲之外人群中的男性都属于单倍群CT,共享M168等SNP突变,可以追溯到7万年前左右的一个共同男性祖先。这个祖先的两个男性后代分别成为了单倍群CF与单倍DE的祖先。



Y染色体在每个家族的传递过程中都不断有新的突变产生,从最早的共同祖先到现存的每个男性个体所积累的突变数量都是差不多的,所以并不存在“古老”或“原始”的类型(就好比你并不会称呼你的远房堂兄弟为家族中更为“古老”或“原始”的成员)。只存在不同支系之间的相对远近关系。

现在你知道了为什么单倍群命名那么乱了吧,另外我们还知道O2a2b1a2和F114的含义,O2a2b1a2是单倍群名称,F114是该单倍群代表性突变位点的名称,F是命名机构的代码(F代表复旦大学),114是编号。

谢谢大家

要回复问题请先登录注册