那么问题来了……标准版和菁英版原始数据相差较大,同一个人

虽然我知道菁英版是模拟出来的数据,我也知道标准版的每个位点只有两种类型……
不过部分位点的差异还是比较明显的,尤其是Y染色体部分的结果相差比较大
 
然后反映到报告上,就比如说I型糖尿病的风险一个4.x倍一个0.x倍
 
(另外插一句话就是已知我本人Y染色体有倒位,父不知)
 
额外说明:对比的是原始数据(核心数据),已经去掉了v2有,v1没有(或相反)的位点,也排除了--未检出位点




求解原因。

@chengang
@社区小助手
@lily
 

15 28806 1 0.0520724848989794
9 19131 10 0.0470440646071821
29 18164 11 0.159656463334067
15 17538 12 0.0855285665412248
48 12872 13 0.372902423865755
10 11617 14 0.0860807437376259
7 11292 15 0.0619907899397804
13 11234 16 0.115720135303543
62 10523 17 0.589185593461941
5 10142 18 0.049299940840071
18 7094 19 0.253735551170003
38 28874 2 0.131606289395304
9 9162 20 0.0982318271119843
3 5205 21 0.0576368876080692
6 5319 22 0.112803158488438
46 24659 3 0.186544466523379
14 20549 4 0.0681298360017519
10 20992 5 0.0476371951219512
16 24994 6 0.0640153636872849
30 19700 7 0.152284263959391
13 19116 8 0.0680058589663109
10 16642 9 0.0600889316187958
2 3994 MT 0.0500751126690035
15 14259 X 0.105196717862403
145 8541 Y 1.6976934785154
 
附参考数据
第一列为数据不同的条目数
第二列为数据总数(去掉v2有v1没有、未检出等)
第四列为百分比
2018-11-25 • IP属地北京
按热门排序    按默认排序

6 个回复

小助手给出回应了,感谢:)
 
原文转发小助手回应
 
 
 您好,感谢您的耐心等待,我们核实的情况如下:
1. 我们比较了您反馈的1型糖尿病的解读项目,发现芯片检测结果和菁英版检测结果中有一个位点出现了不一致的情况(rs9273363),恰好这个位点是一个权重较高的位点,因此造成了最终解读结果的差异,该位点位于 HLA 区域,目前芯片检测难度较多,相对容易出现一定的误差,我们也一直在监测此区域,尽可能的优化分析方法与参数。

2. 根据您提供的结果,在全基因组范围内芯片和菁英版的一致性是99.85%;在常染色体上的一致性是99.88%,准确性显著高于一般芯片承诺的99%。

此外,WeGene 的V2.0版本中,为了提供更多的解读可能,在120万核心数据中,除了实际检测的数据,也包括了有高解读价值的部分根据 imputation 方法计算的高质量位点。一般来说,这部分位点的准确性会略低于实际检测的部分。
(v1.0版本中部分位点,通过芯片设计,在v2.0版本中,可以通过 imputation 方法计算得到,对大部分相关的解读项目,两者的结果基本上没有差异。)

3. Y染色体的位点,一致性确实较常染色体而言更低。这个是由于芯片检测的原理导致的。由于Y染色体是单倍体,在芯片检测的难度上会高于常染色体的位点,所以不管是 affymetrix 还是 illumina 的芯片都会有Y染色体准确性比常染色体低的情况。 对于这个情况,由于Y染色体上和健康相关的位点较少,主要用于父系祖源的解读,因此我们对该算法进行过多次优化,目前的算法可以容忍偏低的一致性,能给出正确的父系祖源分析结果。

4. 我们对原始数据的优化一直在持续进行,WeGene 2.0版本上线的时间还较短,还有很多可以优化的空间。后续经过不断的优化不仅在核心数据上会提高准确性,在扩展数据的位点数量上也会有更高的提升,希望能在此基础上给您带来更准确、更有价值的解读结果。

对于给您带来的不便,再一次深表歉意,同时也感谢您的积极反馈,我们会不断的优化各项服务,感谢您对我们的支持和谅解。也希望您能持续的关注我们,给我们提出更多宝贵的意见和建议,让我们成为更加优秀的团队,更好的为您提供服务。

18 分钟前
 
 
那么,是模拟的标准版核心数据不准确呢,
还是检测技术的区别导致的呢,
对单个位点来说哪一个可信度更高呢
表示关注,并希望官方能给出各个版本的准确率
咦?at不到了吗
@社区小助手
@chengang
社区小助手 - 专治各项疑难杂症
您好,很抱歉给您带来的不便,刚刚有电话沟通,我们会尽快帮您核实,感谢您的耐心等待。

要回复问题请先登录注册