samtools是一个用于操作sam和bam文件的工具合集。包含有许多命令。
faidx: 对fasta文件建立索引,生成的索引文件以.fai后缀结尾。
对基因组文件建立索引 $ samtools faidx genome.fasta 生成了索引文件genome.fasta.fai,是一个文本文件,分成了5列。第一列是子序列的名称; 第二列是子序列的长度; 最后的数字是genome.fasta文件的大小;第4和5列不知是啥意思。通过此文件,可以定位子序列在fasta文件在磁盘上的存放位置,直接快速调出子序列。 由于有索引文件,可以使用以下命令很快从基因组中提取到fasta格式的子序列 $ samtools faidx genome.fasta scffold_10 > scaffold_10.fasta
参考来源: