CDA 数据分析师 level1 part 3
数据分析师 数据分析师 抽样分布及参数估计 随机的基本概念 随机试验 随机试验是概率论的一个基本概念。概括地讲,在概率论中把符合下面三个特点的试验叫做随机试验: ●可以在相同的条件下重复的进行。 ●每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果。 ●进行一次试验之前不能确定哪一个结果会出现。 随机事件 在概率论中,随机事件(或简称事件)指的是一个被赋予机率的事物集合,也就是样本空间中的一个子集。简单来说,在一次随机试验中,某个特定事件可能出现也可能不出现;但当试验次数增多,我们可以观察到某种规律性的结果,就是随机事件。 随机变量 设随机试验的样本空间 S={e},X=X{e} 是定义在样本空间S上的单值实值函数,称X为随机变量。 正态分布的图像形式 既然介绍变量的分布情况,就要介绍一下正态分布。首先,正态分布是关于均值左右对称的,呈钟形,如下图所示。其次,正态分布的均值和标准差具有代表性只要知道其均值和标准差,这个变量的分布情况就完全知道了在正态分布中,均值=中位数=众数。 抽样分布 中心极限定理 从均值为μ,方差为 \sigma^2 的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ,方差为 \sigma^2 /n的正态分布。 根据中心极限定理,我们知道如果做很多次抽样的话会得到很多个样本均值,而这些样本均值排列起来会形成正态分布