假设检验

亡梦爱人 提交于 2020-01-07 02:15:34


假设检验又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。显著性检验是假设检验中最常用的一种方法,也是一种最基本的统计推断形式,其基本原理是先对总体的特征做出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受做出推断。常用的假设检验方法有Z检验、t检验、卡方检验、F检验等。

例子:有统计资料得知,1989年某地新生儿的平均体重为3190克,现在从1990年的新生儿中随机抽取100个,测得其平均体重为3210克,问1990年的新生儿与1989年相比,体重有无明显差异?

原假设

统计的语言是用一个等式或不等式表示问题的原假设。在新生儿体重这个例子中,原假设采用等式的方式,即
H0:μ=3190 H_0:\mu=3190(克)
这里的 H0H_0 表示原假设。

备择假设

尽管原假设陈述的两个总体的均值相等,却不表示它是既定的事实,仅是假设而已。如果原假设不成立,就要拒绝原假设,而需要在另一个假设中做出选择,这个假设称为备选假设。

两类错误

假设检验中的两类错误是指在假设检验中,由于样本信息的局限性,势必会产生错误,错误无非只有两种情况,在统计学中,我们一般称为Ⅰ类错误,Ⅱ类错误。右图是研究结论和实际情况关系的矩阵:实际情况H0正确H0错误研究结论  拒绝H0I类错误正确接受H0正确II类错误第一类错误(Ⅰ类错误)也称为 α错误,是指当虚无假设(H0)正确时,而拒绝H0所犯的错误。这意味着研究者的结论并不正确,即观察到了实际上并不存在的处理效应。可能产生原因:1、样本中极端数值。2、采用决策标准较宽松。第二类错误(Ⅱ类错误)也称为β错误,是指虚无假设错误时,反而接受虚无假设的情况,即没有观察到存在的处理效应。可能产生的原因:1、实验设计不灵敏。2、样本数据变异性过大。3、处理效应本身比较小。两类错误的关系:1、 α+β不一定等于1。2、在样本容量确定的情况下,α与β不能同时增加或减少。3、统计检验力。(1-β)
在这里插入图片描述
假设检验的基本思想是利用“小概率事件”原理做出统计判断的,而“小概率事件”是否发生与一次抽样所得的样本及所选择的显著性水平α有关,由于样本的随机性及选择显著性水平α的不同,因此检验结果与真实情况也可能不吻合,从而假设检验是可能犯错误的。
一般地,假设检验可能犯的错误有如下两类:
①当假设H0正确时,小概率事件也有可能发生,此时我们会拒绝假设H0。因而犯了“弃真”的错误,称此为第一类错误,犯第一类错误的概率恰好就是“小概率事件”发生的概率α,即
P{拒绝H0/H0为真}=α
②当假设H0不正确,但一次抽样检验未发生不合理结果时,这时我们会接受H0,因而犯了“取伪”的错误,称此为第二类错误,记β为犯第二类错误的概率,即
P{接受H0/H0不真}=β
理论上,自然希望犯这两类错误的概率都很小。当样本容量n固定时,α、β不能同时都小,即α变小时,β就变大;而β变小时,α就变大。一般只有当样本容量n增大时,才有可能使两者变小。在实际应用中,一般原则是:控制犯第一类错误的概率,即给定α,然后通过增大样本容量n来减小B。这种着重对第一类错误的概率α加以控制的假设检验称为显著性检验。

显著性水平

显著性水平是估计总体参数落在某一区间内,可能犯错误的概率,用 α\alpha 表示。
显著性是对差异的程度而言的,程度不同说明引起变动的原因也有不同:一类是条件差异,一类是随机差异。它是在进行假设检验时事先确定一个可允许的作为判断界限的小概率标准。
显著性水平是假设检验中的一个概念,是指当原假设为正确时人们却把它拒绝了的概率或风险。它是公认的小概率事件的概率值,必须在每一次统计检验之前确定,通常取α=0.05或α=0.01。这表明,当作出接受原假设的决定时,其正确的可能性(概率)为95%或99%。
显著性水平代表的意义是在一次试验中小概率事物发生的可能性大小。

P值

P值是用来判定假设检验结果的一个参数,也可以根据不同的分布使用分布的拒绝域进行比较。
P值(P value)就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明原假设情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分。总之,P值越小,表明结果越显著。但是检验的结果究竟是“显著的”、“中度显著的”还是“高度显著的”需要我们自己根据P值的大小和实际问题来解决。
p值是指在一个概率模型中,统计摘要(如两组样本均值差)与实际观测数据相同,或甚至更大这一事件发生的概率。换言之,是检验假设零假设成立或表现更严重的可能性。p值若与选定显著性水平(0.05或0.01)相比更小,则零假设会被否定而不可接受。然而这并不直接表明原假设正确。p值是一个服从正态分布的随机变量,在实际使用中因样本等各种因素存在不确定性。产生的结果可能会带来争议。

单侧检验

所谓单侧检验,是指当要检验的是样本所取自的总体的参数值大于或小于某个特定值时,所采用的一种单方面的统计检验方法。
单侧检验包括左单侧检验和右单侧检验两种。如果所要检验的是样本所取自的总体的参数值是否大于某个特定值时,则采用右单侧检验;反之,若所要检验的是样本所取自的总体的参数值是否小于某个特定值时,则采用左单侧检验。

双侧检验

双侧检验,就是指当统计分析的目的是要检验样本平均数和总体平均数,或样本成数有没有显著差异,而不问差异的方向是否是正差还是负差时,所采用的一种统计检验方法。
应用:
不能根据专业知识判断两种结果谁高谁低时,采用双侧检验。
如果检验的目的是检验抽样的样本统计量与假设参数的差数是否过大(无论是正方向还是负方向),就把风险平分在右侧和左侧。比如显著性水平为0.05,即概率曲线左右两侧各占一半,即0.025。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!