置信水平(置信度)是指总体 参数值 落在样本统计值某一区内的概率,一般用1-α表示,α表示显著度;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。例如,样本数目不变的情况下,做一百次试验,有95个置信区间包含了总体真值,置信度为95%。 图中1-α反应了结论的置信度,直观来看,对应于图中的非阴影区域 等式的右边表示的是将超过基准错误个数的每种情况的样本误分类的概率加起来(阴影部分)应当小于某个显著度α t分布又叫student-t分布,常常用于根据小样本来估计呈正态分布且方差值为知的样本的均值。(如果总体的方差已知的话,则应该用正态分布来估计总体的均值。)(所以一个前提是:t分布的样本的总体必须符合正态分布) 假设X服从标准正态分布即X ~ N(0,1),Y服从自由度n的卡方分布即Y ~ χ2(n),且X与Y是相互独立的,则称 的分布为自由度为n的t分布,记为Z~t(n); t分布的性质:自由度n越小,t分布曲线越低平;自由度n越大,t分布曲线越接近标准正态分布(u分布)曲线,当自由度无限大时,t分布就成了正态分布。 卡方分布:若n个相互独立的随机变量ξ₁,ξ₂,...,ξn ,均服从 标准正态分布 (也称独立同分布于标准 正态分布 ),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布