【转】协方差与相关系数
转载:http://redstonewill.com/1511/ 什么是协方差(Covariance)? 1 协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。 如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。 协方差是怎么来的? 简单地来说,协方差就是反映两个变量 X 和 Y 的相互关系。这种相互关系大致分为三种: 正相关、负相关、不相关 。 什么是正相关呢?例如房屋面积(X)越大,房屋总价(Y)越高,则房屋面积与房屋总价是正相关的; 什么是负相关呢?例如一个学生打游戏的时间(X)越多,学习成绩(Y)越差,则打游戏时间与学习成绩是负相关的; 什么是不相关呢?例如一个人皮肤的黑白程度(X)与他的身体健康程度(Y)并无明显关系,所以是不相关的。 我们先来看第一种情况,令变量 X 和变量 Y 分别为: X = [11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30] Y = [12 15 17 21 22 21 18 23 26 25 22 28 24 28 30 33 28 34 36 35]