两类问题介绍:
两个样本之间的比例是否一样,比如两个城市的有钱人和穷人比例是否一致。
两个分类变量之间是否独立,比如时间和级别是否存在依赖关系。时间可以划分n个等级,级别也可以划分几个等级,然后df为(r-1)*(c-1)
二者区别:
感觉上计算卡方值公式都是一样的,但实际上是由区别。
1:抽样顺序不同,前者是已经分好类,再抽,后者是直接抽再分类
2:假设检验的内容不同,前面是各类别的比例等于某个期望概率,后者是两个变量是否相互独立
3:计算前者卡方是∑(实际-期望)*2/期望,后者是概率相乘
计算方法:
1:excel可以用chitest函数
2:r语言用chisq.test
tablefc1<-matrix(c(36.67,66.66,90,93.33,93.33,33.33,63.34,63.33,76.67,76.67),nrow=2,ncol=5)
chisq.test(tablefc1)
来源:https://www.cnblogs.com/marszhw/p/12275398.html