田园牧歌 田园牧歌 - 追本溯源 · 微基因 综合讨论组

【新手先看】常见问题集(不断更新)

与网友交流中较常出现的一些问题,通俗的回答,绝不专业,请专家指正~
 
**所有单倍型应以SNP为准,以下使用ISOGG 2016年6月版命名**
 
====关于产品====
 
1. Wegene跟外国几家公司(Ancestry, 23andme, etc)有什么区别?
 
简单来说,wegene的芯片设计考虑到我们东亚人群,芯片所测试的snp更有针对性。
wegene基本须知:https://www.wegene.com/page/help
具体的芯片对比:https://www.wegene.com/question/482
再专业的看白皮书:https://www.wegene.com/question/382​ 
 
====关于祖源====

**********************************************************************************************
如果不想读那么多文字,那么就看一个视频吧。看完就基本上理解分子人类学
相关的基本常识:
http://v.youku.com/v_show/id_XNjkxMjI0ODQ0.html 
**********************************************************************************************

 1. 什么是单倍型/单倍群(Haplogroup)?

简单来说,单倍型是用于把人类“分类”或者“分支”。科学家通过对比人类的基因,发现基因里的一些地方会出现突变(SNP),而这些突变会通过爸爸传给儿子(父系/Y染色体)或者妈妈传给女儿(母系/线粒体),形成一种“标记”。比如说,一个男性有三个儿子:甲、乙、丙。其中甲的基因出现了一个突变,那么这个突变会传到甲的子孙身上,但是乙和丙的子孙就没有这个突变。突变出现的概率很低,可能几代、几十代或更长时间才出现一次。科学家仍在分析和寻找这些“标记”来完善人类的“族谱”,所以您今天看到的单倍型也只是到目前为止所知道的“分支”,将来树图可能会出现调整的。

2. 是不是单倍型越短、祖源越久远就越“原始”?

科学家根据上述的基因突变(SNP)绘制出人类的树图,有些人得出的单倍型很短(比如N1),有些人得出的单倍型很长(比如O2a2b1a1a1a1a)。其实越长只不过代表历代累积下来的突变“标记”越多,跟原不原始没有关系的。比如说甲出现了突变,传下去几百代后他的某个孙子出现了新的突变,再传下去几百代又出现新的突变...这些子孙就累积了很多突变的“标记”,单倍型的名称就变得很长。甲的兄弟乙的子孙可能一直没有出现突变,所以这些突变“标记”就很少,单倍型的名称也就很短~ 当科学家发现某支之下有一些独特的突变,那么科学家就会划出新的分支,在原来的支系名称上再加个数字或字母来代表下游的分支。随着科学家获得更多的数据,这个树图会不断地调整,所以用户们要注意网上一些论坛或文章中出现的单倍型名称是以哪一年的版本为标准,因为有可能已经改名了。要知道最新的树图及命名方法,先要知道自己的单倍型是根据哪些突变来判断的(SNP),再上ISOGG(国际遗传基因组织)的网站找出自己的SNP,就可以知道新的名称是什么了。

比如说,以前2008-2011年网络的文章里较常出现的称号:
原名称 --> 对应的SNP --> 2016年新名称
O1 --> SNP: M119 --> O1a
O2 --> SNP: P31 --> O1b
O3 --> SNP: M122 --> O2
O3a5 --> SNP: M134 --> O2a2b1
O3a4 --> SNP: M7 --> O2a2a1a2

2. 我的单倍型是Oxxxxx是不是代表我的祖先是某某地方的人?父系xxx母系xxx求解读~

就如上面所说的,突变出现的概率很低,而科学在还在做相关的分析。你的父系是Oxxxxx只能说明你拥有这个单倍型定义里的一些突变,不能说明你是哪里人。有些地区的确会有些单倍型比较高频,那只能说明出现这些突变的祖先可能源自那里或者周边,但这指的是几千、上万年前的祖先,不能说明现在的“你”是哪里人或者你的近代祖先的具体迁徙路线是什么。

3. 是不是跟我一样单倍型的人就是我的亲戚?我能不能用单倍型的结果来找到亲戚?

既然突变出现的概率很低,你跟别人有一样的单倍型也只能说明你们可能几千或上万年前有一个共同的男祖先或女祖先(具体要看你的单倍型的共同祖先年代是多久远)。如果“万年亲”在你的“亲戚”定义之内,那么恭喜你,你可以找到很多亲戚!但如果你所说的亲戚是指近代的、同一个姓氏家族的,那么现在单凭单倍型是无法帮你找到亲戚的~
 
注意:单倍型的男祖先指的是你的爸爸的爸爸的爸爸的爸爸。。。。 女祖先指的是你的妈妈的妈妈的妈妈的妈妈。。。要记得你的祖先不是单线的,也不是双线的,你的祖父母有2个人,曾祖父母有4个人,高祖父母有8个人,五代祖有16个人,六代祖有32个人,n代祖有2(n-1)个人。所以你所说的“亲戚”范围非常的广,单倍型再具体也只是小部分而已~

4. 什么是祖源?我明明是南方人,怎么结果是北方汉族的?我祖宗十八代都是汉族,怎么会有少数民族血统?我祖先有韩国人?日本人?泰国人?柬埔寨人吗?

大家不要把祖源想成祖籍或者姓氏来源,所谓的祖源只是一个模拟对比。也就是说,“南方汉族”可能是以现代南方某地方汉族的基因作为“标准”,“北方汉族”可能是以现代北方某地方的汉族作为“标准”。本来“汉族”就没办法定义的,祖源分析也只是拿着你的基因跟一些“标准”作对比,再分析出你的“祖源”结构。你有“韩国”或者“日本”的祖源也只能说明你的基因有一部分跟现代的韩国人和日本人相近。这并不代表你祖先来自韩国或日本。韩国、日本、东南亚人的一些祖先也有可能途径中国区域散播过去,或者反过来,中国人的一些祖先也有可能从这些地方流传过来。所以说“祖源”只是说明你跟现代的哪些群体比较接近,不是说你的祖先就是来自那里。你是江南人,但是“南方汉族”的成分很低,不代表你不是南方人,只是你跟“南方汉族”的“标准”群体不是很接近而已~
 
要专业的解释,请看:https://www.wegene.com/question/799 

5. 那么中国人的起源是怎么样的?能否介绍一下?
 
详见专家分析:https://www.wegene.com/question/858​ 

6. 我看到网上说“40%的中国人的Y染色体来自三个新石器时代的超级祖先”是什么意思?
 
就是有大约40%的汉族属三个单倍型之下(超级祖先):
Oα,俗称“农民甲”(O-M117, O2a2b1a1 --> O-F522, O2a2b1a1a1a)占到汉族人口16%,扩张时间约5400年前
Oβ,俗称“农民乙”(O-F444, O2a2b1a2 --> O-F46, O2a2b1a2a1)占到汉族人口11%,扩张时间约6500年前
Oγ,俗称“农民丙”(O-002611, O2a1c --> O-F11, O2a1c1a)占到汉族人口14%,扩张时间约6800年前
再加上以下两支,就占到汉族过半人口了:
O-M119​,O1a,在中国东南沿海、侗傣族群、台湾原住民中集中分布,占汉族人口约10%,扩张时间约10400年前
C-F1144,C2c1,占汉族人口约10%,扩张时间约6500年前

可另外参考:
 
http://blog.sina.com.cn/s/blog_465ddf790102vj8o.html​ 
http://blog.sina.com.cn/s/blog_465ddf790101ff19.html 

7. 上面这些单倍型我都不是哦,还有哪些单倍型比较典型?

O-M95,O1b1a1a:在华南、南方少数民族、中南半岛及印度Munda人群中分布较多。
O-M176,O1b2:最主要集中于朝鲜半岛、朝鲜族和日本人中。
O-M7,O2a2a1a2:在苗瑶和孟高棉人群中高频出现,但在汉族中却不足5%。

中国人先祖起源,详见专家分析:http://www.wegene.com/question/858​ 
中国回族的起源,详见专家分析:https://www.wegene.com/question/1086​ 

8. 已知的古代名人单倍型有哪些?
 
除非能够出土古DNA,古代名人的单倍型也只能间接推算出来(测他的子孙),已有成果的包括:
曹操家族:O2-M268, O1b(详见:http://blog.sciencenet.cn/blog-348453-558078.html )
曹参家族:O-002611, O2a1c(详见:http://blog.sciencenet.cn/blog-348453-558078.html )
爱新觉罗家族:C-M401, C2b1a3a(详见:http://blog.sciencenet.cn/blog-348453-853796.html )
赛典赤、郑和家族(纳姓、马姓):L-M76, L1a1(详见:https://www.wegene.com/question/1086​ )

9. 网友说测完wegene再测Y-str,有没有必要呢?

有没有必要就看你的目的是什么~ 以当今的数据量,还不能通过snp或者str来判断姓氏族源的。现在来讲,通过wegene测出父母系单倍型已经算是最精准的了。
 
10. 怎么样跟同单倍型的兄弟姐妹们见面?
 
可以加入对应的QQ群,详见:https://www.wegene.com/question/970
 
====关于第三方服务====

1. 报告看完了,都过了一个月了,怎么原始数据还下载不了?
 
从取样到出原数据需要严格把关每一个步骤的,报告出来后一个月只是个大约时间,再过几天就会出来的~ 你的基因值得你等待一下下!

2. 报告看完了,原始数据下载了,我还能怎么玩?

官方报告看完了,还有“微解读”啊~ 给大家推荐几个试一下:
马路杀手要上路了!https://www.wegene.com/crowdsourcing/details/24
给语文成绩差找理由!https://www.wegene.com/crowdsourcing/details/37
数学障碍:理科?文科?商科?https://www.wegene.com/crowdsourcing/details/83​  
你的约会成功率有多高?https://www.wegene.com/crowdsourcing/details/44
补牙快要让宝宝破产了!https://www.wegene.com/crowdsourcing/details/56
还有一些第三方的解读服务是支持wegene的数据的,包括疾病解读、亲缘分析等,详见:
 
基因数据疾病数据库注释网页版http://www.gene-disease.cn/  
RelationshipGO基因关系分析: https://relationshipgo.xyz/  

3. 那是不是把原始数据上传到gedmatch就可以找到亲戚了?
 
你可以试一下第三方的网站,但是gedmatch以美国及西方国家的用户为主,中国人能找到近亲的概率比较低。一般最接近的结果都是5 gen或以上,非常疏远了。要找亲戚,还是等wegene的亲缘关系工具出来再试试看吧~
 
4. 我把原始数据上传到gedmatch,然后呢?

如何解读,看这里:https://www.wegene.com/question/956
5. 我找到一些匹配的“亲戚”,怎么判断对方是什么公司测的呢?
 
原始数据上传gedmatch后,会获得一个标识号码,wegene用户均为"W"字母开头的,而其他公司则以其他字母开头:
A = AncestryDNA
E = Geneticoncept
M = 23andme
T = FTDNA
W = Wegene
Z = 其他公司
 
ISOGG最新的O和C单倍型树图与SNP(2016年6月)
2016-09-17 • 广州, 广东, 中国
按热门排序    按默认排序

41 个回复

田园牧歌 - 追本溯源 · 微基因
由于上ISOGG要翻*qiang,因此我把pdf版上传到上面了~
田园牧歌 - 追本溯源 · 微基因
ISOGG 9月19日新增:
O-F533,O1a1a1a1a1   
O-CTS2458,O1a1a1a1a1~
田园牧歌 - 追本溯源 · 微基因
原始数据上传gedmatch后,会获得一个标识号码,wegene用户均为"W"字母开头的,其他公司则以其他字母开头:A = AncestryDNA
E = Geneticoncept
M = 23andme
T = FTDNA
W = Wegene
Z = 其他公司
田园牧歌 - 追本溯源 · 微基因
2016年9月28日更新
 
O1a1a1a2a:AM00330/AMM480/B386
O1a1a1a2a1:AM00333/AMM483/B387
O1a1a1a2b:SK1555
 
田园牧歌 - 追本溯源 · 微基因
2016年10月5日更新
 
O2a2b1a2a1a3b2b1a:FGC23868
O2a2b1a1a4a1a:Z42620
田园牧歌 - 追本溯源 · 微基因
2016年10月7日更新
 
O1b1a1a1a1a1-Z24081, Z24082, Z24085, Z24087
O1b1a1a1a1a1a-Z24083, Z24086
田园牧歌 - 追本溯源 · 微基因
Oα的定义是O-M117还是O-F522?
Oβ的定义是O-F444还是O-F46?
Oγ的定义是O-002611还是O-F11?
不同文章提供的snp不一样的?@wang
帮忙顶置~
田园牧歌 - 追本溯源 · 微基因
新增了一个微解读,自己顶上去~
田园牧歌 - 追本溯源 · 微基因
ISOGG 2016年12月4日更新
 
O2a2b1a2a1a2a1a增加F1458,F3387,F3614三个位点。
O-M119​,O1a,在中国东南沿海、侗傣族群、台湾原住民中集中分布,占汉族人口约10%,扩张时间约10400年前,这不知道那个大专家做的。                                                                                                                                                                       国内的O1a有95%都是P203,大约占汉族的12%-13%左右,P203最近共祖是9000年左右O-M307 YTree https://www.yfull.com/tree/O-M307/。目前汉族的最常见支系是F81支系也就是CTS2458支系大概占汉族的8%左右扩张时间是4300年左右O-CTS2458 YTree https://www.yfull.com/tree/O-CTS2458/。
别外比较常见的是CTS52*和K644*,O-CTS52 YTree https://www.yfull.com/tree/O-CTS52/.这两人支占汉族3%的人口,F81,CTS52*,K644*这三支占汉族O1a的85%左右,95%都是分布在汉族的。
  侗傣族群的O1a很少占比才6%-7%左右,侗傣族群O1a主要是YP345,Y18196,CTS8920这三支为主和汉族支系分开是6-9千年。
   台湾原住民主要类型是F168*和B388为主,和大陆支系分开6-7千年左右。
qqcoolj - O1a
这种帖子就应该置顶
蓝星旗 - There is no death,there is the Force.
赞,早就该出一个常见问题索引,官方太懒了囧
蓝星旗 - There is no death,there is the Force.
“以当今的技术,还不能通过snp或者str来判断姓氏族源的。”--------------判断姓氏技术上是完全可能的吧,只要检测的位点足够多、可供对比的样本也足够多。。。
wang - 哈佛医学院、德国马普所分子人类学博士后
南方汉族的标准并不是用的客家人
黄隆思 - 红领巾三段
干得漂亮~
请问到底是什么原因导致的基因突变哪?自然环境?为什么不同的环境里会有相同基因类型的人哪?
chengang - WeGene勤杂工
为啥没有『赞赏』功能?
蓝星旗 - There is no death,there is the Force.
突变出现的概率不是几十代上百代啊,几代就肯定会有了吧@wang
顶置
这样的帖子可以出书了,赞一个
孙志军 - gooday sunshine
我这批结果能赶上update吗 意思修正一些功能不足和问题
chengang - WeGene勤杂工
好丰富啊
田园牧歌 - 追本溯源 · 微基因
更新网址:基因数据疾病数据库注释网页版 www.gene-disease.cn
田园牧歌 - 追本溯源 · 微基因
isogg现已步入第12版了!
田园牧歌 - 追本溯源 · 微基因
ISOGG 2017年2月更新
 
新增:O2a1c1a-F13,O2a1c1a1h-CTS2107,O2a1c1a1i-SK1691,O2a1c1a2-PH203
修改:O2a1c1a1-F11
田园牧歌 - 追本溯源 · 微基因
ISOGG 2017年2月更新
 
O新增:O1b2a1a2a1b-A12446, O1b2a1a2a1b1-PH40
田园牧歌 - 追本溯源 · 微基因
ISOGG 2017年2月更新
 
C新增:C2c1a2a1a-F9966. F11237
田园牧歌 - 追本溯源 · 微基因
ISOGG 2017年2月更新
 
O新增:
O2a1c1a1e1a1-Y26383
O2a1c1a1e2-FGC54486
O2a1c1a1e2a-FGC54507
田园牧歌 - 追本溯源 · 微基因
ISOGG 2017年2月更新
 
O新增:
O2a2a1a2b-Y26403
田园牧歌 - 追本溯源 · 微基因
ISOGG 2017年2月更新
 
O新增:
O2a1c1a1a1a1a1a1-F1418
O2a1c1a1a1a1a1a2-Z25097
O2a1c1a-F117
O2a1c1c-CTS498
田园牧歌 - 追本溯源 · 微基因
ISOGG 2017年3月更新
 
O新增:
O2a1a1a1-F852
O2a1a1a1a1a-Z43961
O2a1a1a1a1a1-Z43963
O2a1a1a1b1-Z43966
O2a1a1b1a-Z43975
O2a2b1a2a1d-Y29828
O2a2b1a2a1d1-F735
O2a2b1a2a1d1a-FGC34973
田园牧歌 - 追本溯源 · 微基因
ISOGG 2017年3月更新
 
O新增:
O2a2b1a1a1a2a1-F1442
O2a2b1a1a1a2a1a-F1123
O2a2b1a1a1a2a1a1~-F1369 
田园牧歌 - 追本溯源 · 微基因
ISOGG 2017年3月更新
 
O新增:
O2b1a1-F1025
O2b2-F1055
O2b2a-F3021
对一些常见问题进行了科普,很不错。
田园牧歌 - 追本溯源 · 微基因
ISOGG 2017年5月更新
 
O新增:
O2a2b2a1a2-SK1780
O2a2b2a2b-AM01847
好贴
田园牧歌 - 追本溯源 · 微基因
ISOGG 2017年5月更新
 
O新增:
O2a2b1a2b1a1-A16629
田园牧歌 - 追本溯源 · 微基因
ISOGG 2017年6月更新
 
O新增:
O2a2b1a1a1a2a2-A16636
 
n代祖的数量应该是2的n次方个

要回复问题请先登录注册