UMI-unique molecular identifiers
UMI分类 UMI 有单端UMI(例如swift)也有双端UMI(例如Illumina TSO500) UMI 也可以分为固定种类的UMI(例如Illumina TSO500)固定种类是120,双端就是120*120,还有就是随机碱基的UMI,例如swift与IDT(双端随机3碱基长度种类就是64*64) UMI 添加种类一种是将UMI添加到测序文库的index位置(swift),一种是将UMI添加到测序文库的reads前端(IDT) UMI预处理 是指将测序过程中的UMI序列以标签的形式添加到SAM或BAM文件中 实现方法一: Illumina下机数据直接从BCL导出到SAM格式,这种情况在实际情况很少遇到不在详细描述 实现方法二: 以swift试剂提供的单端UMI来讲,由于UMI是位于index的位置而不是在测序读长上,因此在数据拆分时需要将index按照常规fastq的形式输出 从BCL2fastq数据拆分的时候,需要修改RunInfo.xml和RunParameter.xml这两个文件 RunInfo.xml: <Read Number="2" NumCycles="8" IsIndexedRead="Y" /> <Read Number="3" NumCycles="8" IsIndexedRead="Y" /> 一般是拆分数据按照单端进行拆分