统计-参数估计

偶尔善良 提交于 2020-03-09 05:28:41

基本概念

总体: 总体就是一个概率分布。总体分布为指数分布就是指数分布总体,总体分布为正态分布时称为正态分布总统。

总体与分布簇: 仅含一个参数的分布簇称为单参数分布簇,仅含两个参数的分布称为双参数分布簇,含多个参数则为多参数分布簇。有些情况下,只假定总体有一定的概率分布而又不能明确其数学形式,总体分布不能通过若干参数表达出来,这种情况称为非参数总体。

有限总体与无限总体: 指数分布总体与正态分布总体称为无限总体。实际上,现实世界中,多数情况下,总体总是由有限个个体构成,从而其总体总是有限的,其分布也是离散分布,引入无限总体的概念,在概率论上相当于用一个连续分布的总体去逼近这个离散分布。

样本: 按一定的规定从总体中抽出的一部分个体(每个个体同等机会被抽出,以及在这个基础上设立的某种附加条件)

统计量: 完全由样本所决定的量。也就是说统计量只依赖于样本,而不依赖于任何其他未知的量。不依赖于总体分布中所包含的未知参数。

假设x1x_1, x2x_2, ......, xnx_n为正态总体N(μ,σ2)N(\mu, \sigma^2)中抽出的样本,其中σ2\sigma^2已知,而μ\mu未知,则:xˉ=1n(x1+x2+...+xn)\bar{x}=\frac{1}{n}(x_1+x_2+...+x_n)x1+x2+xn2/σ2x_1+x_2+{x_n}^2/\sigma^2是统计量,这里σ\sigma为已知,两个量均只由样本所决定。而x1μx_1-\mu以及xˉ+λ\bar{x}+\lambda均不是统计量。

统计量有什么作用
统计量由某种需要而设定。

常见的统计量
样本均值xˉ=1n(x1+x2+...+xn)=1n1nxi\bar{x}=\frac{1}{n}(x_1+x_2+...+x_n)=\frac{1}{n}\sum\limits_1^nx_i
样本方差s2=1n11n(xixˉ)2s^2=\frac{1}{n-1}\sum\limits_1^n(x_i-\bar{x})^2
样本k阶原点矩ak=1n1nxika_k=\frac{1}{n}\sum\limits_1^nx_i^k(一介原点矩即分布的期望)
样本k阶中心距mk=1n1n(xixˉ)km_k=\frac{1}{n}\sum\limits_1^n(x_i-\bar{x})^k (二阶中心矩即为分布的方差)
次序统计量x(1)=min(x1,x2,...,xn)x_{(1)}=min(x_1,x_2,...,x_n) ;… ;x(n)=max(x1,x2,...,xn)x_{(n)}=max(x_1,x_2,...,x_n)

参数估计—点估计

设统计总体x f(x;θ1,θ2,...,θn)x~f(x;\theta_1,\theta_2,...,\theta_n),此f(x;θ1,θ2,...,θn)f(x;\theta_1,\theta_2,...,\theta_n)可能是其分布密度函数,或分布函数,这里f(x;θ1,θ2,...,θn)f(x;\theta_1,\theta_2,...,\theta_n)设定为总体分布。以正态分布N(μ,σ2)N(\mu, \sigma^2)为例,其中θ1=μ\theta_1=\muθ2=σ2\theta_2=\sigma^2为其两个参数,该式可以表示为:
f(x;θ1,θ2)=12πθ2e(xθ1)22θ2f(x;\theta_1,\theta_2)=\frac{1}{\sqrt{2\pi \theta_2}}e^{-\frac{(x-\theta_1)^2}{2\theta_2}}
点估计 :设x1x_1, x2x_2, ......, xnx_n为从统计总体这种抽出的样本(独立随机样本,简单随机样本),要根据样本对总体分布中参数θ1,θ2,...,θn\theta_1,\theta_2,...,\theta_n未知值进行估计,可能是θ1,θ2,...,θn\theta_1,\theta_2,...,\theta_n的某一部分,或者他们的某个已知函数g(θ1,θ2,...,θn)g(\theta_1,\theta_2,...,\theta_n),例如要估计θ1\theta_1选出合适的统计量:θ1~(x1,x2,...,xn)\tilde{\theta_1}(x_1,x_2,...,x_n) ,每确定一组观察值x1x_1, x2x_2, ......, xnx_n,代入:θ1~(x1,x2,...,xn)\tilde{\theta_1}(x_1,x_2,...,x_n)之后就得到一个θ1\theta_1的估计值。为此目的而构造的统计量:θ1~(x1,x2,...,xn)\tilde{\theta_1}(x_1,x_2,...,x_n) 就叫做θ1\theta_1的估计量。

由于未知参数θ1\theta_1是数轴上的一点,用θ1~\tilde{\theta_1}去估计θ1\theta_1,就相当于由一点去估计另一点,这样的估计叫做点估计。其核心是估计量的选择。

1 | 矩估计法

1.1 方法

即用矩去估计参数,因为假设参数已知时,可以得到相应的矩,这个由参数得到的矩是理论矩,同时假设样本符合相应分布,则由样本可以获得相应的矩,由样本获得的矩是估计矩。二者划等号,就可以用估计矩(已知样本)去估计参数(未知参数)
已知总体x服从f(x;θ1,θ2,...,θn)f(x;\theta_1,\theta_2,...,\theta_n),及样本x1x_1, x2x_2, ......, xnx_n,建立矩方程:
ai=Exia_i=Ex^i
其中,aia_i为样本的原点矩ai=1n(x1i+...+xni)a_i=\frac{1}{n}({x_1}^i+...+{x_n}^i),解方程组得到参数θ1,θ2,...,θn\theta_1,\theta_2,...,\theta_n的矩估计量:
θ1~=θ1~(x1,x2,...,xn)\tilde{\theta_1} = \tilde{\theta_1}(x_1,x_2,...,x_n)
θ2~=θ2~(x1,x2,...,xn)\tilde{\theta_2} = \tilde{\theta_2}(x_1,x_2,...,x_n)
……
θn~=θn~(x1,x2,...,xn)\tilde{\theta_n} = \tilde{\theta_n}(x_1,x_2,...,x_n)

若要估计g(θ1,θ2,...,θn)g(\theta_1,\theta_2,...,\theta_n),则用g(θ1~,θ2~,...,θ3~)g(\tilde{\theta_1},\tilde{\theta_2},...,\tilde{\theta_3})进行估计

1.2 矩估计实例:

  1. 设正态分布N(μ,σ2)N(\mu, \sigma^2),其中μ\muσ2\sigma^2均未知,现估计两个参数。则可以建立矩方程:
    μ=xˉ\mu=\bar x σ2=m2\sigma^2=m_2
    若要估计标准差σ\sigmaσ=σ2=g(σ2)\sigma=\sqrt{\sigma^2}=g(\sigma^2)进行估计
  2. 设总体分布为参数λ\lambda的指数分布,x1x_1, x2x_2, ......, xnx_n为样本,要估计1/λ1/\lambda
    因为1/λ1/\lambda为一介原点矩(因为指数分布的一介原点矩,即期望为1/λ1/\lambda),由矩方程:xˉ=1/λ\bar x=1/\lambda可得1/λ1/\lambda的矩估计为xˉ\bar x;另因为总体分布的方差为1/λ21/\lambda_2,由矩方程m2=1/λ2m_2=1/\lambda_2,也可得到1/λ1/\lambda的矩估计为m2\sqrt{m_2}。矩估计方法下得出不同的矩估计量xˉ\bar xm2\sqrt{m_2}这里说明同一参数在矩估计法下可能得出不同的统计量
  3. 设总体分布为区间[θ1,θ2][\theta_1,\theta_2]上的均匀分布,即x服从U[θ1,θ2]U[\theta_1,\theta_2]x1x_1, x2x_2, ......, xnx_n为独立随机样本。因为均匀分布的期望为α=(θ1+θ2)/2\alpha=(\theta_1+\theta_2)/2,均匀分布的方差为μ2=(θ1+θ2)2/12\mu_2={(\theta_1+\theta_2)}^2/12。由这两个矩估计方程,联立方程可求解参数θ1,θ2\theta_1,\theta_2的矩估计量。

2 | 极大似然估计

2.1 方法

设总体分布x服从f=(x;θ1,θ2,...,θk)f=(x;\theta_1,\theta_2,...,\theta_k)x1x_1, x2x_2, ......, xnx_n为来自总体的样本,则样本的分布为:
f(x1;θ1,θ2,...,θk)f(x2;θ1,θ2,...,θk)...f(xn;θ1,θ2,...,θk)f(x_1;\theta_1,\theta_2,...,\theta_k)\cdot f(x_2;\theta_1,\theta_2,...,\theta_k)\cdot...\cdot f(x_n;\theta_1,\theta_2,...,\theta_k)
L(x1,x2,...,xn;θ1,θ2,...,θk)L(x_1,x_2,...,x_n;\theta_1,\theta_2,...,\theta_k) 表示,L反映了在此参数θ1,θ2,...,θk\theta_1,\theta_2,...,\theta_k下的总体中抽出当前样本x1,x2,...,xnx_1,x_2,...,x_n的概率(由于每个样本的抽取是独立随机的,所以抽到特定总样本的概率就等于每个样本个体抽取的概率的乘积),在总体分布簇中寻找出那么一组参数,使得在该组参数下总体中出现当前样本的概率最大。
在样本x1x_1, x2x_2, ......, xnx_n下,称L(x1,x2,...,xn;θ1,θ2,...,θk)L(x_1,x_2,...,x_n;\theta_1,\theta_2,...,\theta_k)

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!