全基因组测序统计信息比较

有个网站可以方便地得到全基因组测序的统计信息:https://qual.iobio.io/
这是我的微基因菁英版结果

w1.PNG


还有个工具也能得到类似的信息: https://wgsextract.github.io/ 

w2.PNG

 
 从统计信息看,我的Mapped reads比较低,才86.89%, 95%以上才是较为理想的。从每一条染色体来看,有6条染色体均未达到30x的测序深度,很多是27x,就差个那么一点。总的23条染色体的测序深度平均下来是31x,刚刚过了30x的合格线。
Mapped reads比较低是什么原因?除了可能样本里细菌比较多,其他原因呢?@费力科思
各位测过微基因全基因组或者其他公司全基因组的都来比较看看
总体来看,我这个数据只是刚刚及格吧
2021-01-31 • IP属地苏州
按热门排序    按默认排序

6 个回复

元月十号 - 【杜】O-MF2636/外公【崔】T-Y13290/外婆【张】O-F723
161209572857857.jpg
K2 - 炸号狂魔K2
而且基于染色体结构的问题(随体、副缢痕),21、22、13、14、15、9本来就是覆盖度要低一些的,以全染色体长度做分母的话depth就会低很多,这非常符合常理
 
https://en.wikipedia.org/wiki/Chromosome#Human_chromosomes
 
 
K2 - 炸号狂魔K2
口水样本,用raw data的话肯定很多细菌真菌病毒的reads不能map到人基因组上的,80%是很正常的数据,有口腔感染、上呼吸道感染的话就更麻烦了。血液的话就会好很多
 
ps,一般说30X也是说genome-wide的30X,泊松分布嘛,分染色体看肯定有不到30X的,约短的波动越大
 
转一个网上的,同一个人,同样的口水样本,在两家不同的公司测试,一个Mapped reads 99%以上,一个Mapped reads才80%,看来主要问题不是样本是口水不是血液,所以Mapped reads低,而是测试公司不同导致的差异

Nebula.png

 

dante.png

 
 
自己玩了一下数据,原始数据碱基数也就刚好达到了90.4Gbp(603M*150bp),刚过及格线。自己realign到了T2T-chm13v2.0上面,偷懒用WGSExtract看了一下stats,chr9, 13-15, 21-22, X, Y 的 coverage比较低(正常),不过除去其他一些常染也有avg coverage刚好没有过30x的情况出现(总长度做分母的话
我wgs在分版本之前做的,总共119.7Gbp,88% mapped

要回复问题请先登录注册