因子载荷

R语言3.11 因子分析因子旋转

两盒软妹~` 提交于 2020-03-12 03:51:06
因子旋转 目的 寻找每个主因子的实际意义 如果各主因子的典型代表变量不突出,就需要进行旋转 使因子载荷矩阵中载荷的绝对值向0和1两个方向分化 方法 正交旋转Varimax(最大方差正交旋转) 斜交旋转Promax Fa2=factanal(X,3,rotation="varimax") Fa2$loadings 因子得分计算方法:回归估计法(方差一致),Bartlett估计法 Fa1$scores(旋转前因子得分) Fa2$scores(旋转后因子得分) plot(Fa2$scores,asp=1) abline(h=0,v=0,lty=3) text(Fa2$scores,labels = rownames(X)) biplot(Fa2$scores,Fa2$loadings) abline(h=0,v=0,lty=3) Fa1$ranks(排名) 因子分析的基本步骤 1.确认数据是否适合作因子分析 一般用KMO与Bartlett’s进行检验 判断标准:KMO>0.9非常适合,0.8~0.9适合,0.7 ~ 0.8一般,0.6 ~0.7不太合适,0.5 ~0.6不合适,<0.5极不合适。 2.构造因子变量 3.旋转因子使其更具解释性 4.计算因子得分并做因子图 R语言因子分析过程 一、因子计算 1.是否适合做因子分析:KMO 2.计算因子分析的对象:factanal(极大似然)

利用因子分析建立信用风险评价体系

蓝咒 提交于 2020-02-27 14:15:46
多维数据在建模过程中,会出现很多问题,在 基于logit模型的客户信用风险预测 一文中,有谈到关于变量降维的几种方法:(1)基于经验,简单但主观性很强;(2)基于变量的统计显著性,模型上可靠但未必实务上可用;(3)变量规约,即用因子分析、主成分分析等方法将多个变量分解或合成为少数几个聚合因子。 之前用的是(1)和(2),这篇文章讨论第三种:主成分分析与因子分析。首先解决两个问题。 什么是主成分分析与因子分析 同:都是统计降维方法,将多个变量浓缩为少数几个新变量(主成分或因子) 异:浓缩方法不同,主成分分析是将原变量进行聚合,新变量(主成分)表示为原变量的线性组合;因子分析是将原变量进行结构,原变量表示为新变量(因子)的线性组合。 主成分分析与因子分析有什么用? (1)对解释变量进行降维处理,输出值作为下一步的输入值,作为其它建模过程的准备部分。 (2)直接作为建模主体,构建指标评价体系。 下面通过一个案例加以说明。 背景与上一篇文章相似,我们依然希望通过一些变量和数据建立起客户(银行)的风险评估体系,具体分为这几个步骤:(1)变量选择;(2)源数据与预处理;(3)数据探索;(4)因子分析;(5)结论。 (一)变量的选择、指标体系的构建 根据指标选取原则,同时参考银行行业规范,考虑从资本充足性、资产质量、流动性、盈利性和成长性5个方面来建立指标体系,具体如表1-1所示: (二

因子分析

烈酒焚心 提交于 2020-01-25 19:09:09
目录: 什么是因子分析 因子分析的作用 因子分析模型 因子分析的统计特征 因子载荷矩阵的估计方法 因子旋转 为什么要做因子旋转 因子旋转方法 因子得分 因子分析步骤 举例 因子分析和主成分分析区别 1、什么是因子分析? 因子分析是一种 数据简化技术 。 它通过研究众多变量间的依赖关系, 探求观测数据中的基本数据结构 ,并且 用少数几个假象变量(因子)来表示其基本数据结构 ; 这几个 假想变量(因子)可以表示原来众多的原始变量的主要信息 ; 原始变量是可观测的显在变量,而假想变量是不可观测的潜在变量,即因子 ; 即一种用来 在众多变量中辨别、分析和归结出变量间的相互关系 并 用简单的变量(因子)来描述这种关系 的数据分析方法 如考察中学生的语文、英语、历史,数学、物理、化学成绩; 语文、英语、历史有很强的正相关; 数学、物理、化学有很强的正相关; 于是可以提取出两个因子:文科因子和理科因子 2、因子分析的主要作用? 寻求基本数据结构 数据简化 强相关问题会对分析带来困难 通过因子分析可以找出少数的几个因子替代原来的变量做回归分析、聚类分析和判别分析 3、因子分析模型 A称为 因子载荷矩阵 4、统计特征 因子载荷$a_{ij}$是第i个变量与第j个公共因子的相关系数; 共同度 :变量$X_i$的共同度是因子载荷矩阵的第i行的元素的平方和,记为$h_i^2=\sum_{j=1}^{m}a

采用主成分法实现因子分析中的参数估计

半腔热情 提交于 2019-12-27 18:50:28
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> factpca<-function(x,score="Bartlett",rotation="varimax") { if(!is.matrix(x)){ x<-as.matrix(x) #x为原始的数据矩阵 } z<-scale(x,center=TRUE,scale=TRUE) #将原始数据矩阵标准化 p<-ncol(x) #求观测变量的个数 if(p<3){ stop("factor analysis requires at least three variables") } cr<-cor(z) #求相关系数矩阵 eig<-eigen(cr) #求矩阵的特征值与特征向量 s=sum(eig$values) tmp=0.0 flag=0 for(i in 1:length(eig$values)){ tmp=tmp+eig$values[i] flag=i if(tmp/s>=0.8) break } rowname<-paste("X",1:p,sep="") colname<-paste("Factor",1:flag,sep="") A<-matrix(0,nrow=p,ncol=flag,dimnames=list(rowname,colname)) #构造因子载荷矩阵,初始化为0 for(j

第10章:多元分析

戏子无情 提交于 2019-11-27 13:03:44
10.1 聚类分析 即群分析,是对多个样本(或指标)进行定量分类的一种多元统计分析方法。对样本进行分类称为Q型聚类分析,对指标进行分类称为R型聚类分析。 10.1.1 Q型聚类分析 (1)样本的相似性度量 对于定量变量,最常用的是闵式距离 绝对值距离 欧几里得距离:最常用,当坐标轴进行正交旋转时,它保持不变 切比雪夫距离 马氏距离:对一切线性变换是不变的 (2)类与类之间的相似性度量 最短距离法 最长距离法 重心法 类平均法 离差平方和法 (3)最短距离法(最近邻法)的计算步骤: clc,clear a=[1,0;1,1;3,2;4,3;2,5]; [m,n]=size(a); d=zeros(m); d=mandist(a'); %mandist求矩阵列向量组之间的两两绝对值距离 d=tril(d); %截取下三角元素 nd=nonzeros(d); %去掉d中的零元素,非零元素按列排列 nd=union([],nd) %去掉重复的非零元素 for i=1:m-1 nd_min=min(nd); [row,col]=find(d==nd_min);tm=union(row,col); %row和col归为一类 tm=reshape(tm,1,length(tm)); %把数据tm变成行向量 fprintf('第%d次合成,平台高度为%d时的分类结果为:%s\n',... i,nd