R语言宏基因组学统计分析学习笔记(第三章-3)
3.4 微生物数据组成分析 早在1897年,皮尔逊就警告说,在器官测量中使用两个 绝对测量值的比值 ,可能会形成“ 伪相关 ”。自1920s以来,地质学的研究人员已经知道,使用标准的统计方法来分析成分数据可能会使结果无法解释。Aitchison认识到关于组成成分的每一个陈述都可以用 成分的比率 来表述,并开发出一套基本原理、各种方法、操作和工具来进行成分数据分析。其中, 对数比变换 方法被地质学、生态学等领域的统计学家和研究人员广泛接受,因为通过对数比变换,可以消除组成数据的样本空间(单纯性)受约束问题,并将数据投影到多元空间中。因此,所有可用的标准多元技术都可以再次用于分析成分数据。 微生物组成的数据分析方法和工具是最近才得到发展的。方法的开发聚集于解除 组成的限制 : 样本中的所有微生物相对丰度之和为1 。约束导致组成数据驻留在单纯形而不是欧几里德空间中。为了恰当地比较微生物的组成,从样本中生物分类的相对丰度(而不是样本中生物分类的总丰度)推断出生态系统中的总分类比(OTU)。 为了避免伪相关,Lovell等提出了 比例 度量用于分析相对数据,因为比例是对相对数据的适当相关性分析。Erb和Notredame进一步提出了部分比例,这是从部分相关中采用的定义。为了确定物种的比例丰度,Erb等人提出了差分比例统计(2017)。它等同于分类比率的单向方差分析。