ANOSIM分析(analysis ofsimilarities)即相似性分析,主要用于分析高维数据组间相似性,为数据间差异显著性评价提供依据。在一些高维数据分析中,需要使用PCA、PCoA、NMDS等方法进行降维,但这些方法并不显示组间差异的显著性指标,此时可以使用ANOSIM分析解决此问题。
ANOSIM为非参数检验方法,用于评估两组实验数据的整体相似性及相似的显著性。
该方法主要有两个数值结果:一个是R,用于不同组间属否存在差异;一个是P,用于说明是否存在显著差异。以下分别对两个数值进行说明:
R值的计算公式如下:
rB:组间差异性秩的平均值(mean rank of between group dissimilarities)
rW:组内差异性秩的平均值(mean rank of within group dissimilarities)
n:总样本个数(the number of samples)
R的范围为[-1,1]
R>0说明组间差异大于组内差异,R<= 0说明组间无差异。R越大说明组间差异越大于组内差异。
R只是组间是否有差异的数值表示,并不提供显著性说明。
P值则说明不同组间差异是否显著,该P值通过置换检验(Permutation Test)获得。
置换检验大致原理:(假设原始分组为实验组和对照组)
1、对所有样本进行随机分组,即实验组和对照组。
2、计算当前分组时的R值,即为Ri。
3、重复当前操作N次,对所有Ri及原始R从大到小排序,R所处的位置除以N即为置换检验P值。
举例说明:
比如我们有case和control两组(Group1 和Group 2),数据如下:
首先需要对样本进行相似性计算,得到如下相似性矩阵:
然后计算相似性秩(即从小到大排序),如此便把相似性矩阵转换为秩矩阵:
接着计算组内平均秩和组间平均秩,rW=13.08,rb = 15.56,如此R=(15.56-13.08)/(0.25*8*7) = 0.17
利用置换检验的方法计算p值,如下的方法重复1000次, rb= 14.06,rw = 15.08
根据1000次随机后获得的Ri与R进行排序,获得P值。
(致谢:以上内容参考 博文 http://www.360doc.com/content/18/0113/21/33459258_721682039.shtml )
来源:https://www.cnblogs.com/ZhengAbel/p/12016362.html