学习目标:熟练使用主成分分析法对自变量进行降维,了解因子旋转的作用,能够对新生成的自变量进行合理解释,进而纳入线性回归模型比较拟合效果。
一、作用
因子分析,通过提取主成分的方式来减少自变量的数量,达到消除多重共线性的效果。
例如,某个餐厅的营业额(y)受到“x1.公交站点广告”、“x2.电台广告”、“x3.电台广告”、“x4.顾客满意度”、“x5.员工满意度”、“x6.天气”、“x7.温度”等多方面的影响。但是,我们发现x1、x2、x3、都与广告有关,x4、x5与‘’满意度‘’有关,x6、x7与气候有关。因而,通过提取主成分,原有的7个变量,有可能就压缩为三个变量,达到了降维效果。
因子分析和相关分析类似,都属于过度性分析,主要为其他分析模型做准备(尤其是线性回归模型)
二、适用条件
在因子分析模型中,公因子的有效提取数量、是否可以得到合理解释都与原有的自变量息息相关。
1、变量的数量
由于因子分析属于降维的一种方法,因此,需要有较多的变量,尤其越多越好。
2、变量间有相关性,并非指线性相关,而是指两个或多个变量同属于某种范畴,往往容易存在多重共线性的现象。
为了检验变量间是否存在相关性,我们可以通过KMO系数及巴特利特球形度检验来完成。
(1)KMO系数
KMO统计量的值在0—1之间(即0<KMO<1),越接近于1,变量间的相关性越强,做因子分析的效果越好。当KMO>0.7时,效果比较明显;当KMO<0.5时,则不适合进行因子分析。
(2)巴特利特球形度检验
原假设H0:变量间不存在显著性相关
备择假设H1:变量间存在显著性相关
当显著性水平p<0.05时,接受H1,说明变量间存在显著相关
来源:https://www.cnblogs.com/LWH999/p/12036532.html