测序基础知识--整理
测序: 如何计算测序深度,或产出的数据量? 10的9次方=1G 如果测序的read是pair-end的、且每条read长150bp,则,平均测序深度为=(reads数×150bp×2)/(3*10的10次方)。 即:测序得到的碱基总数/人类基因组的碱基对数=平均测序深度。 比如,我想得到30x的测序数据,那么需要的数据量是90G的数据。(此处,还不甚了解,我觉得应该是900G的数据啊) (人类基因组有30亿个碱基对(3*10的10次方)) 测序错误率 :一般选择的阀值是10的-3次方,即测序错误率是0.001。(PCR的错误率是10的-6次方) coverage与depth的概念 :coverage指的是测序数据覆盖的人类基因组的碱基数。depth指的是平均每个碱基被测序read覆盖的次数(即被测到的次数)。 index的含义 :index用来区分不同的样本。单端index共6个碱基,排列组合,共4的6次方个碱基,无法区分66个样本。故,需要采用双端index。 双端index,分为i5和i7端。i5端有8个碱基,i7端有12个碱基。 测序的cycle :一个cycle读取一个碱基。也称为:base call。若有index序列,则测序仪会多读几个cycle。