第10章:多元分析
10.1 聚类分析 即群分析,是对多个样本(或指标)进行定量分类的一种多元统计分析方法。对样本进行分类称为Q型聚类分析,对指标进行分类称为R型聚类分析。 10.1.1 Q型聚类分析 (1)样本的相似性度量 对于定量变量,最常用的是闵式距离 绝对值距离 欧几里得距离:最常用,当坐标轴进行正交旋转时,它保持不变 切比雪夫距离 马氏距离:对一切线性变换是不变的 (2)类与类之间的相似性度量 最短距离法 最长距离法 重心法 类平均法 离差平方和法 (3)最短距离法(最近邻法)的计算步骤: clc,clear a=[1,0;1,1;3,2;4,3;2,5]; [m,n]=size(a); d=zeros(m); d=mandist(a'); %mandist求矩阵列向量组之间的两两绝对值距离 d=tril(d); %截取下三角元素 nd=nonzeros(d); %去掉d中的零元素,非零元素按列排列 nd=union([],nd) %去掉重复的非零元素 for i=1:m-1 nd_min=min(nd); [row,col]=find(d==nd_min);tm=union(row,col); %row和col归为一类 tm=reshape(tm,1,length(tm)); %把数据tm变成行向量 fprintf('第%d次合成,平台高度为%d时的分类结果为:%s\n',... i,nd