统计测试最常见的领域之一是测试列联表中的独立性。在这篇文章中,我将展示如何计算列联表,我将在列联表中引入两个流行的测试:卡方检验和Fisher精确检验。
什么是列联表?
组/观察 | 观察1 | 观察2 |
---|---|---|
第1组 | ||
第2组 |
给定这样一个表格,问题是第1组是否表现出与第2组
要研究列联表的测试,我们将使用warpbreaks数据集:
<span style="color:#000000"><span style="color:#000000"><code>data(warpbreaks) head(warpbreaks)</code></span></span>
## breaks wool tension ## 1 26 A L ## 2 30 A L ## 3 54 A L ## 4 25 A L ## 5 70 A L ## 6 52 A L
这是一个包含来自纺织行业的三个变量的数据集:中断描述了经线羊毛和张力的
分析目标
我们想确定一种类型的羊毛在不同程度的紧张情况下是否优于另一种羊毛。为了研究我们是否可以找到一些差异的证据,让我们来看看数据:
为了研究链断裂数的差异,让我们可视化数据:
从图中我们可以看出,总体而言,羊毛B与较少的断裂相关联。羊毛A似乎特别低劣,因为低张力。
转换为列联表
为了获得列联表,我们首先需要总结两种类型的羊毛和三种类型的张力的不同织机的断裂。
## wool tension breaks ## 1 A L 401 ## 2 A M 216 ## 3 A H 221 ## 4 B L 254 ## 5 B M 259 ## 6 B H 169
然后我们使用xtabs
(发音为交叉表)函数来生成列联表:
## tension ## wool L M H ## A 401 216 221 ## B 254 259 169
现在,df
我们有了应用统计测试所需的结构。
统计检验
用于确定来自不同组的测量值是否独立的两种最常见的测试是卡方检验(χ2χ2测试)和费舍尔的精确测试。请注意,如果测量结果配对,则应使用McNemar测试(例如,可以识别单个织机)。
皮尔逊的卡方检验
## [1] 7.900708e-07
由于p值小于0.05,我们可以在5%显着性水平上拒绝测试的零假设(断裂的频率独立于羊毛)。根据df
一个人的条目,然后可以声称羊毛B比羊毛A明显更好(相对于经纱断裂)。
调查Pearson残差
另一种方法是考虑测试的卡方值。该chisq.test
## tension ## wool L M H ## A 2.0990516 -2.8348433 0.4082867 ## B -2.3267672 3.1423813 -0.4525797
残留物表明,与羊毛A相比,羊毛B的低张力和高张力断裂比预期的要少。然而,对于中等张力,羊毛B比预期的断裂更多。再次,我们发现,整体羊毛B优于羊毛A.残留物的值也表明羊毛B对于低张力(残差为2.1),高张力(0.41)和中等张力严重( - 2.8)。然而,残留物有助于我们识别羊毛B的问题:它对中等张力的表现不佳。这将如何促进进一步发展?为了获得在所有张力水平下表现良好的羊毛,我们需要专注于改善羊毛B的中等张力。为此,我们可以考虑使羊毛A在中等张力下表现更好的特性。
费舍尔的确切测试
由于计算的因子可能变得非常大,Fisher精确检验可能不适用于大样本量。
请注意,无法指定测试的替代方法,df
我们仍然可以执行Fisher精确检验以获得p值:
## [1] 8.162421e-07
转换为2乘2矩阵
df
:
由于替代方案设置得更大
## [1] "L vs others"
摘要:卡方对费舍尔的精确检验
以下是两个测试的属性摘要:
标准 | 卡方检验 | 费舍尔的确切测试 |
---|---|---|
最小样本量 | 大 | С |
准确性 | 近似 | 精确 |
列联表 | 任意维度 | 通常为2x2 |
解释 | 皮尔逊残差 | 优势比 |