全基因组测序统计信息比较

有个网站可以方便地得到全基因组测序的统计信息:https://qual.iobio.io/
这是我的微基因菁英版结果

w1.PNG


还有个工具也能得到类似的信息: https://wgsextract.github.io/ 

w2.PNG

 
 从统计信息看,我的Mapped reads比较低,才86.89%, 95%以上才是较为理想的。从每一条染色体来看,有6条染色体均未达到30x的测序深度,很多是27x,就差个那么一点。总的23条染色体的测序深度平均下来是31x,刚刚过了30x的合格线。
Mapped reads比较低是什么原因?除了可能样本里细菌比较多,其他原因呢?@费力科思
各位测过微基因全基因组或者其他公司全基因组的都来比较看看
总体来看,我这个数据只是刚刚及格吧
2021-01-31 • 苏州, 江苏省, 中国
按热门排序    按默认排序

6 个回复

元月十号 - 【杜】o-cts4960/外公【崔】T1a3b2a1b/外婆【张】O2a1c1a1a1a1g
161209572857857.jpg
K2 - 炸号狂魔K2
而且基于染色体结构的问题(随体、副缢痕),21、22、13、14、15、9本来就是覆盖度要低一些的,以全染色体长度做分母的话depth就会低很多,这非常符合常理
 
https://en.wikipedia.org/wiki/Chromosome#Human_chromosomes
 
 
鬼王 - 팬지가 피다
QQ截图20210131172526.png

Average read depth - 38x
Mapped reads - 97.33%
也是在微基因测的……我的文件有76.8GB,请问你的是多大的
K2 - 炸号狂魔K2
口水样本,用raw data的话肯定很多细菌真菌病毒的reads不能map到人基因组上的,80%是很正常的数据,有口腔感染、上呼吸道感染的话就更麻烦了。血液的话就会好很多
 
ps,一般说30X也是说genome-wide的30X,泊松分布嘛,分染色体看肯定有不到30X的,约短的波动越大
 
转一个网上的,同一个人,同样的口水样本,在两家不同的公司测试,一个Mapped reads 99%以上,一个Mapped reads才80%,看来主要问题不是样本是口水不是血液,所以Mapped reads低,而是测试公司不同导致的差异

Nebula.png

 

dante.png

 
 
鬼王 - 팬지가 피다
有没有可能是压缩率的原因……bam文件是sam文件的压缩后格式,如果能用Samtools把bam转化成sam之后再比较,应该能看出来;但sam文件比bam的大,还得事先提取其中一条染色体的bam
 

要回复问题请先登录注册