概率论与数理统计中基于有限样本推断总体分布的方法,基于总体未知参数区间估计的假设检验方法之讨论,以及从数理统计视角重新审视线性回归函数本质
1. 总体与样本 0x1:数理统计中为什么要引入总体和个体这个概念 概率论与数理统计中,一个很重要的研究对象就是总体的概率分布,理论上说,我们希望获得被研究对象的总体样本,基于这份总体样本进一步研究其概率分布,但是遗憾地是,几乎在100%的情况下,我们都不可能获得真正的总体,我们只能获取有限的样本量(例如自然生物里的统计问题),有时候甚至还是非常少的小样本集(例如宇宙星体观测结果),如何有效、准确、误差可控地利用有限的样本集,进行最大程度合理的统计推断,既是一个理论研究课题,也是非常有现实意义的应用理论。 因此概率论与数理统计科学家们提出了总体和个体这个概念,主要观点如下: 在大数定律的理论支撑下,只要我们的个人样本数足够多,个人样本的统计量会在趋近于1的概率下,趋近于总体样本的统计量。这就是我们在没有完整总体样本的情况下,依然能够利用概率论与数理统计这个强大的武器,对未知的事物开展统计研究的理论依据。 同样在大数定律的理论支撑下,即使样本数不够多,基于有限的样本数得到的估计结果,和理论总体之间的误差,也可以可以通过概率分布统计量的形式,定量地给出的,这给统计推断的不确定性决策提供了基础。 0x2:总体与样本 1. 总体的形式定义 在一个统计问题中,我们把研究对象的全体称为 总体 ,也即样本空间全集,构成总体的每个成员称为 个体 ,也即样本子集。 对于具体问题中