处理bam文件提取信息

天大地大妈咪最大 提交于 2019-11-27 21:54:17

一般来说,一个bam文件通常只包含一个样本的信息,最多需要进行染色体位置的处理, samtools也提供了简单的处理方式,比如要提取 chr1的reads, 只需要:

samtools view input.bam ch1

 这几天遇到了10x genomicsbam结果,发现单细胞的reads全包含在一个bam文件里,用barcode进行区分,因此可能就需要提取其中的信息,比如提起某一个细胞的reads,那么可以:

samtools view possorted_genome_bam.bam -h | sed -n "/^@\|TCTGAGAAGAAACCAT-1/p" | samtools view -b > result.bam

其实就是多了 sed 的处理过程 ,之所以加以记录,是因为在处理过程中 

samtools -h

 保留的header在将sam结果转化会bam格式是必须的,以防下次忘记.

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!