协方差矩阵 定义 推导证明 作用

核能气质少年 提交于 2019-12-20 04:49:28

首先,需要先理解什么是方差,什么是协方差,这里不做说明,需要的可以去找考研复习视频去学习下概率论。

=



 

1、首先我们来理解二维
设有函数f(x,y)
其中有n个样本点(n>0),分别为

,对x和y分别求均值为


将所有坐标减去均值的样本点坐标为

 ,这个过程叫数据中心化

将去中心化的样本点表示成矩阵形式为

 ,设为矩阵X,这个矩阵我们称为有两个特征值。

则定义 协方差矩阵 为C =  

  (书上就是这么定义的)

可以看出,C是一个2*2维的矩阵,用样本点表示为

很显然 等于

 

2、对于多维

同样,对于 t 维函数

,有样本点分别为


与二维的方式类似,先进行数据中心化,然后写出t个特征值的矩阵,然后通过C =  

,计算出协方差矩阵。
那么对于 t 维的协方差矩阵简化表示为

 

3、作用
用协方差矩阵可以对原始的维度的数据进行最小损失的降维。通过求取协方差矩阵的特征值(Eigenvalues)和对应特征向量(Eigenvectors),按特征值大小排序,降维就是从特征值小的维度开始剔除。(特征值小,表明对应的那一维特征对整体的影响比较小,比如下面的图中,使用右边的坐标系时,明显y轴的对整体数据的影响比x轴要小,那么可以在右边的坐标系下,对y轴进行降维,是数据从二维变成线性的,降维对于二维可能用处不是太大,但是对于多维的数据,很有必要,可以减少数据的复杂度)
        

4、降维后数据求取
假设我们来对一个二维数据进行降维
设二维数据为

,求取的(特征值:特征向量)对为 k1:(x1,y1),k2:(x2,y2),
如果k1>k2 ,我们选取(x1,y1)作为特征向量。那么原始数据降维操作为


所以原始数据变为

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!