费力科思 费力科思 - WeGene勤杂工 综合讨论组

Ancestry, 23andme和WeGene检测数据比较

最近比较了一下公司几个做了Ancestry,23andme和WeGene检测的同事的数据,给大家罗列一下基本情况。下面所说的检测数据都是从各自网站上下载的数据。

总位点数

当前三家下载的数据中显示的位点数分别为:
  • Ancestry:701479
  • 23andme:610544
  • WeGene:596744
Ancestry的位点数量明显比其他两家多,23andme和WeGene没有明显区别。因为下载的数据通常都是经过Imputation分析后的结果,所以在几十万个位点这种数据量级上,下载的数据中的位点数量跟实际检测位点数并没有必然关系。

位点重叠情况

三家公司的数据中的位点的重叠情况如下:
  • Ancestry & WeGene: 262944
  • Ancestry & 23andme: 307481
  • 23andme & WeGene: 460996
  • Ancestry & 23andme & WeGene: 258607
可以看出,WeGene跟23andme的重叠率很高,这从WeGene检测的技术白皮书里也能看到。Ancestry跟WeGene和23andme的重叠率也超过40%,位点数超过了25万个位点。如果用于大规模人群的基因组群体研究和分析,这三家所积累的数据是可以整合在一起使用的。

位点在染色体上的分布情况

we_an_me.png

 
三家的位点在各个染色体上的分布见上图。常染色体基本上一致,稍微奇葩点的是Ancestry在线粒体上没有位点,在Y染色体上的位点不足一千个,而WeGene在Y染色体上有超过2W个位点——WeGene对Y单倍群分析是真爱啊。
 

利益相关:我是WeGene的~~~
2016-04-28 • IP属地深圳
按热门排序    按默认排序

12 个回复

huyu2016 - WeGene末席关注师
图中的排序是字典排序,强迫症表示必须变成1、2、3……X,Y,Mt
banana97 - Wegene加油!
大赞!
费力科思 - WeGene勤杂工
这几份数据的分析发现了一个很诡异的事情~~~
尽管23andMe在理论上测试两千多个Y染色体的位点,该公司对Y染色体位点测试的结果有极高的no call率,通常在45%左右,所以实际上测到的位点也就一千多一点。Geno 2.0的侧重点是通过Y-DNA和mtDNA找到人类迁移的深度祖源,但在Y染色体上测试的位点好像最多也就两万多一点(另有人说一万二)。
 
有人在Family Tree DNA做过Family Finder的测试吗?听说这个测试也包括约700,000个位点。
liuyangyu - 0603
要是全基因检测多少位点?多大数据文件?多少钱?
蓝星旗 - There is no death,there is the Force. [禁言中]
[ 由于内容不当, 此内容已被隐藏 ]
蓝星旗 - There is no death,there is the Force. [禁言中]
[ 由于内容不当, 此内容已被隐藏 ]
蓝星旗 - There is no death,there is the Force. [禁言中]
[ 由于内容不当, 此内容已被隐藏 ]
寂寞的PRDM2基因 [禁言中]
[ 由于内容不当, 此内容已被隐藏 ]
asaki - 神仙
没有用ggplot画图 差评
寂寞的PRDM2基因 [禁言中]
[ 由于内容不当, 此内容已被隐藏 ]
梅赫梅特之高祖 - 物以类聚,人以群分
用Excel或WPS工作表把数据全改成空位点后,就可以用DNA Kit Studio分析位点名和位置完全一样的重合率;或者用工作表把所有空位点改成有数据的再转化格式,接着用DNA Kit Studio分析可以得到最大转化率。当然DNA Kit Studio里也有一些模板文件可以用

要回复问题请先登录注册