用Li Heng开发的Minimap+miniasm进行组装,然后用racon+pilon进行纠错。
第一步:用minimap2,拿着80%~90%正确率的原始数据相互比对, 找序列之间的Overlap。
第二步:找到Overlap,用miniasm进行组装。
第三步: 原始的组装结果充满了错误,所以需要进行纠错。纠错分为两种,一种是用三代自身数据,一种是用二代数据进行纠错。当然这两步都是需要的。
首先用minimap2和racon对三代数据进行纠错,一般迭代个三次就差不多。
其次使用二代数据进行纠错。二代数据虽然短,但是测序质量高,所以一般都要用它进行纠错。推荐用30X PCR free的illuminia 测序数据。
Step 1: 数据预处理,过滤低质量短读,去接头。工具很多,常用的是trimmomatic、cutadapter、 fastp(处理标准:平均质量高于Q30,对5‘端进行低质量碱基删除,保留大于100bp的短读)
Step2:用bwa 比对
step3: 用pilon对比对后的BAM文件进行纠错
参考来源:https://blog.csdn.net/u012110870/article/details/82500726