从零开始完整学习全基因组测序数据分析: Trimmomatic、SOAPnuke、sickle和seqtk的比较
在第4节开始之前,先来一段插曲。在上一节中,我们说到可以使用Trimmomatic、sickle、seqtk或者SOAPnuke对fastq数据进行过滤。那么也许你会好奇,那他们都有什么特点,都一样好吗或是有哪些差异之处?正所谓,工欲善其事必先利其器,所以这篇文章将会与你一起来解开这几个问题。 因为Trimmomatic的安装已经在 第3节 数据质控 中说的比较清楚了,这里就不再赘述。那么, 先说SOAPnuke的安装,你有两种方式: 第一,确保你的系统中有automake。由于SOAPnuke还使用了多个第三方的c++ 程序库,包括 但不限于 : boost,log4cplus和openssl。因此,需要在你的系统中先安装好这几个库,并修改SOAPnuke代码包的CMakeLists.txt,重新指定里面这几个程序包的路径。同时还需要把上述包的include目录链接到CMakeList.txt中指定的目录(或者你也可以修改到其他目录)下。此外,如果上述三个包的静态库没在默认路径下,那么。。。你还得找到它们,然后修改路径,并涉及到少量代码的修改,再进行编译,然后祈祷。。。至于第三方程序库的安装方法都可以在网上找到。但特别指出一点,建议使用源码安装(特别是log4cplus),防止有些包默认不产生静态链接库。另外,版本不对也会报各种error,包括编译器的error