PCA主成分分析

我是研究僧i 提交于 2019-12-28 00:23:34

PCA的流程:

代码参考:https://www.cnblogs.com/clnchanpin/p/7199713.html

协方差矩阵的计算

https://docs.scipy.org/doc/numpy/reference/generated/numpy.cov.html

 

思想:

https://www.cnblogs.com/clnchanpin/p/7199713.html

求解协方差矩阵的特征值和特征向量

为什么PCA第一步是进行去掉数据中的平均值?

因为每列数据减去该列的平均值后才能进行协方差计算。

按照特征值的大小进行排序,用到了numpy 中argsort函数

https://blog.csdn.net/maoersong/article/details/21875705

 

这篇对numpy中的matrix 总结的很好

https://www.cnblogs.com/sumuncle/p/5760458.html

 

三、特征值和特征向量的应用实例

1、主成分分析(Principle Component Analysis, PCA)

(1)方差、协方差、相关系数、协方差矩阵

    方差:

    协方差:

    **方差是衡量单变量的离散程度,协方差是衡量两个变量的相关程度(亲疏),协方差越大表明两个变量越相似(亲密),协方差越小表明两个变量之间相互独立的程度越大。

    相关系数:

    **协方差和相关系数都可以衡量两个表明的相关程度,协方差未消除量纲,不同变量之间的协方差大小不能直接比较,而相关系数消除了量纲,可以比较不同变量之间的相关程度。

 摘自——https://blog.csdn.net/weixin_37721518/article/details/79016226

 

使用python计算协方差的相关系数

https://blog.csdn.net/theonegis/article/details/85059105

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!