FishboneD FishboneD - 装古典的逼,扯时尚的蛋,用专业的梗,卖艺术的萌,吐技术的槽。 建议和反馈

关于同一样本不同检测套餐结果不一致的反馈说明

内个,首先感谢wegene赠送了两个套餐,一个标准套餐,一个运动基因套餐。(唔。。。刚才去看了一下,发现运动套餐现在不卖了?)。由于当时没看清以为只送了一个,所以两个套餐我都是用在了自己身上。不过也因此,发现两次检测的结果不一致:运动基因套餐里面的54个位点,其中有3个与标准套餐不一致。
咳。。。其实呢,拿到数据之后,早就想好好看一下玩一下,一直懒,也就一直放着没管。。。然后呢,今天不是推出个微健身的活动嘛,填申请表的时候让我选择用哪个样本数据,一开始想,反正都是我嘛,用哪个不一样呢?然后想起来,啊,好像还没有比较过这两次检测结果是否一致呢。虽然觉得应该没什么问题,但还是严谨一点,先比较一下看看嘛。
蓝而,这一比,还真发现不一致了:

s.png


a.png

上图是运动基因套餐的概览,下图是标准套餐的运动基因概览。其中有两项得分不一致。
 
于是打开细节页面去看,发现运动积极性不一致的原因是rs8097348位点一个检测结果是AG,一个是AA;而代谢效率不一致的原因是rs8192678位点一个是TT一个是TC。
唔。。。
于是又把两次检测的原始数据拿出来,把53个共有位点都比对了一下(运动基因套餐有54个位点,蓝而其中rs28399444位点并没有在标准套餐数据里面找到。另外,搜索snpedia,发现这个点ms没有啥意义?http://www.snpedia.com/index.php/Rs28399444,解读界面里面也没有这个点的解释。),嗯,发现有3个位点的结果都是不一致的:
chr pos 运动套餐 60W位点套餐
rs28399444 19 41354190 TT -
rs8097348 18 1595021 AG AA
rs8192678 4 23815662 TT TC
rs10485057 6 154413255 GA AA
其中位点rs10485057在解读界面也没有。。。
又一个没解读的位点?话说不应该 啊,芯片那么多位点,多放几个少放几个没啥影响,运动基因不是用质谱做的吗?质谱每个位点都有成本的啊,不解读的话测它干啥子哦。。。啊,不行还是抑制不住好奇心,于是把有解读的位点都copy出来看一下。嗯,54个位点里面总共有28个位点是有解读和参考文献的。。。所以。。。那剩下的26个是干啥子的哦。。。看上去也不像是内参位点啊。。。质谱多做一个没意义的位点好像要浪费不少成本呢。。。
不过位点利用率倒是、蛮高的,好多位点都可以用于多个解释:

j.png

 
嘛,所以,主要是两个问题:
一个是,这3个位点不一致是什么原因造成的?虽然说不同技术检测,甚至不同人员不同时间检测都可能有一些不一致,蓝而3/53的不一致率,貌似还是有点过高了。希望能帮忙核查一下,看看样本记录是否有问题(感觉应该不是样本弄混),如果下机数据还在的话,看看下机数据,碱基判定阈值是否模糊或者有什么情况。
另一个是,记得运动基因套餐当时是说按照《sport gene》这本书挑选的位点,按理说测的应该都有比较好的解读才对,蓝而众多位点并没有包括在解读中。所以呢,作为一个有着强烈好奇心的产品经理,对这个产品的开发有那么一点点好奇,有没有啥我不了解的原因导致选了这些位点,却没有进行解读呢?当然,这个问题也不那么重要啦。
 
作为wegene的免费体验用户,一直受着wegene的馈赠,(还给我寄过一箱辣条,感动的哗哗的),蓝而懒,一直没有好好的来体验这个产品也没有提一些有用的建议。但其实还是一直很看好wegene,希望wegene能做的越来越好的。这次挑了一点bug,不是来踢馆的,主要还是希望能帮wegene找到一些不足的地方,是不是碱基识读还可以优化啦之类的。有则改之,无则过来骂我一顿不懂瞎说就行。
就是这样。
愿wegene一统江湖。
2016-10-12 • IP属地中国
按热门排序    按默认排序

3 个回复

因为早期还在调整生产流程,当时内测用户的数据确实没有现在这么好。我们也用标准样品检查过数据,总体质量还是可以接受的,不过3/53的不一致性率,也已经远超过我们的质控要求,应该只是极少数情况,当然,如你所说,也可能是不同检测技术造成的一些偏差。

此外,你到的4个位点:
rs28399444,因为mapping/clustering的错误,已经从dbsnp里面删除了,所以没有再检测(https://www.ncbi.nlm.nih.gov/SNP/snp_ref.cgi?searchType=adhoc_search&type=rs&rs=rs28399444) 
rs8097348,质控表现不稳定,目前还在继续监控,暂时没有向新用户提供这个位点的结果,同时也没有更新老用户的数据。
rs8192678和rs10485057还不错,在我们的标准样品中的表现还是比较稳定的。
 
感谢对WeGene的支持,祝好!
费力科思 - WeGene勤杂工
牵涉的历史比较久远,我来解释一下(说得好像WeGene很有历史似的)
 
照我们的计划,运动基因检测并不提供原始数据下载的。不过,运维出了点纰漏,在过去的很长时间里都开放了运动基因检测的原始数据下载,但好像只有LZ发现了~~~
 
为什么有54个位点:运动基因检测,加上减肥相关的解读,涉及到30多个SNP。一个质谱反应一般是25~30个SNP,所以我们要做两个反应,索性就增加到了50多个SNP。多出来的一些位点是跟心脏等有关的。
 
rs28399444:这个位点已经被dbsnp删除了,所以芯片里面没有了,详见:https://www.ncbi.nlm.nih.gov/SNP/snp_ref.cgi?searchType=adhoc_search&type=rs&rs=rs28399444
 
rs8097348:LZ的芯片数据最早交付的一批。早期芯片数据因为样品量不够,我们的经验也不足,没有根据官方建议的best practice做大规模样品的质控。根据现在SNP calling结果质控,这个位点的探针表现不稳定,我们还在持续监控观察。近期交付的raw data中暂时没有交付这个位点的结果。
 
rs8192678和rs10485057两个位点的质控表现正常。我们最近在药明康德检测的同一批样品的30X WGS数据,和我们自己的芯片结果比较来看,这两个位点的质控结果正常。这里的差异有可能是技术本身的差异,也有可能是早期SNP Calling流程的不足。我们会在未来的raw data更新中进行优化。
 
谢谢LZ一直以来的支持!辣条会有的,fitbit手环可能也会有的,谢谢!
啊,还有内测这么好的活动。
可惜我现在才看到。
 
测试有点小贵,才刚了解你们网站,不知道靠不靠谱…看了bbc那个锻炼的纪录片转到这儿来的。

要回复问题请先登录注册