LDA线性判别
LDA线性判别 LDA线性判别式分析又称为Fisher线性判别,是一种有监督的降维算法,用于针对有类别的样本进行降维,使得降维后类与类之间的分割依然很明显,可以说,LDA从高维特征提取出了最具有类间判别能力低维特征,LDA与PCA分类的区别如图1所示,红色与蓝色代表不同类别的样本。 图1 LDA降维的主要目标在于寻找一个向量 u u u ,使得样本经过向量 u u u 降维后能够最小化类内距离,最大化类间距离。为了实现该目标,计算过程如下: 假设样本共有K类,每类样本的个数为N1,N2,…NK。令 x j i x_j^i x j i 为第 j 类的第 i 个样本, m j m_j m j 为第 j 类的中心, D j D_j D j 为第 j 类的点集, x j i ~ \widetilde{x_j^i} x j i 为 x j i x_j^i x j i 经过向量 u u u 降维之后的坐标, m j ~ \widetilde{m_j} m j 为 m j m_j m j 经过向量 u u u 降维之后的坐标,设向量 u u u 的模长为 a a a 。 为第 j 类的第 i 个样本 。 计算类内距离: 第 j 类的类内距离为: S j = 1 N j ∑ x j i ∈ D j ( x j i ~