yhlhhhhh yhlhhhhh - 每日与生物工程斗智斗勇到谢顶 综合讨论组

将微基因给出的全序CRAM文件转为bam

软件:samtools, cmd(windows), 终端(Mac), terminal(Linux)
温馨提示:
1. 此转换过程时间很长,至少我的数据就花了4.5h,所以如果是晚上转换,建议大家洗洗睡吧
2. 一定要准备一个比较大的U盘,因为转换出来的文件大概90G
3. 电脑容易发烫的同学一定要找个方法降温
4. 记得电脑接电源
安装:
Windows:
官网直接下载链接:http://www.htslib.org/download/
利用wget下载命令:
wget https://github.com/samtools/samtools/releases/download/1.11/samtools-1.11.tar.bz2
Mac:
利用brew下载命令:brew install samtools
Linux:
没试过,不知道23333
 
转换:
1. 下载参考序列:human_g1k_v37
2. 打开终端,输入命令:cd 你存储cram文件的文件夹路径
3. 之后输入命令:samtools view -T human_g1k_v37.fasta -b input.cram > output.bam
4. 等着吧
2021-07-27 • IP属地北京
按热门排序    按默认排序

7 个回复

不同格式文件大小真的差好多
想到之前有人来通过文件大小来质疑数据量,太不科学了
三岁妙妙屋
一次一个三岁小妙招
CRAM转BAM可以一步到位:
 
samtools view -bh -@ 16 ./路径/文件名.cram > ./路径/文件名.bam
 
若能找到且找对fasta/fa/fna(或者用bgzip压缩的对应gz格式)参考坐标文件则更好:
 
samtools view -bh -T ./参考路径/ref.fa -@ 16 ./路径/文件名.cram > ./路径/文件名.bam
在Windows环境,建议首选Cygwin或安装Linux虚拟机,缺少前述条件的话再考虑在Powershell(加./)或cmd运行已经被编译好的samtools.exe
west - 早知道基因,早做健康管理哈
实用贴
ViperBoss - 期待基因克隆肉体的那一天
fasta文件就是微基因下载的那个txt核心数据下载的那个文件吗?转换的时候文件名需要修改吗?
ViperBoss - 期待基因克隆肉体的那一天
如果使用多线程解压,命令应该如何使用呢?
 

要回复问题请先登录注册