在上一章讲述了如何描述数据之后,统计的下一项任务就是如何通过抽样推测整体的信息。在统计01:概述中,我们介绍了要得到群体的分布,最准确的办法是收集整个群体的数据,当群体数据量小的时候当然可以这么做,但是当数据量非常大时,就变得不现实了,因此人们想到了抽样的方法以达到“窥一斑而知全豹”的目的。用样本来推测群体的信息,这被称为统计推断(statistical inference)。本章主要介绍统计推断中的参数估计(parameter estimation)部分,即通过样本数据估计出群体分布的参数信息,这具体又可以分为点估计(point estimation)和区间估计(interval estimation)。统计推断的另一部分,为假设检验(hypothesis testing),即我们先对总体的参数作出一个假设,然后搜集样本数据,计算出样本统计量,通过这些数据来推定我们的假设的可信性,并作出接受假设还是拒绝假设的判断。本章将主要介绍参数估计中的点估计部分。
点估计
点估计应用于这样的情形,我们已经知道了群体的分布,但是其中含有未知参数,比如我们知道湘北中学学生的身高服从正态分布,但是我们并不知道这个分布的均值以及标准差。由于湘北中学共计有10000名学生,如果统计全部学生的身高数据有困难的话,我们可以采用参数估计的方法,从10000名学生中抽取1000名学生来进行采样,以此估计出整体10000名学生服从怎样的正态分布。
这个问题可以描述为:
对于Xi,i=1,2,3, ...,10000, Xi~N(μ,σ2)
\( \ahpha +\beta =1 \)
来源:https://www.cnblogs.com/windranger-utjs/p/12570326.html