样本估计量的有偏估计和无偏估计

戏子无情 提交于 2020-02-23 01:28:09

0.背景

有一组独立同分布的样本{x1,x2,...,xm}\{x_{1},x_{2},...,x_{m}\}服从高斯分布p(xi)=N(xi;μ,σ2)p(x_{i})=N(x_{i};\mu,\sigma^{2})。高斯概率密度函数如下:
p(xi)=12πσ2exp(12(xiμ)2σ2)p(x_{i})=\frac{1}{\sqrt{2\pi\sigma^{2}}}exp(-\frac{1}{2}\frac{(x_{i}-\mu)^{2}}{\sigma^{2}})

1.估计的偏差计算公式

bias(θ^m)=E(θ^m)θbias(\hat\theta_m)=E(\hat\theta_m)-\theta
其中θ\theta是定义数据生成分布的θ\theta的真实值,θ^m\hat\theta_m是m个样本计算得到的θ\theta的估计值,E(x)E(x)是期望算子。

2.常用样本估计量的无偏估计

2.1 样本均值
样本均值:μ^m=1mi=1mxi\hat\mu_{m}=\frac{1}{m}\sum^{m}_{i=1}{x^{i}}

判断样本均值是否有偏,计算下列公式:
bias(μ^m)=E(μ^m)μ=E[1mi=1mxi]μ=(1mi=1mE[xi])μ=(1mi=1mμ)μ=μμ=0bias(\hat\mu_m)=E(\hat\mu_m)-\mu\\=E[\frac{1}{m}\sum^{m}_{i=1}{x^{i}}]-\mu\\=(\frac{1}{m}\sum^{m}_{i=1}{E[x^{i}]})-\mu\\=(\frac{1}{m}\sum^{m}_{i=1}{\mu})-\mu\\=\mu-\mu\\=0
因此样本均值是高斯均值参数的无偏估计量。

2.2 样本方差
样本方差:σ^m2=1mi=1m(xiμ^m)\hat\sigma^2_{m}=\frac{1}{m}\sum^{m}_{i=1}{(x^{i}-\hat\mu_{m})}

判断样本方差是否有偏,计算下列公式:
bias(σ^m2)=E(σ^m2)σm2=E[1mi=1m(xiμ^m)]σm2=m1mσm2σm2=σ2mbias(\hat\sigma^2_{m})=E(\hat\sigma^2_{m})-\sigma^2_{m}\\=E[\frac{1}{m}\sum^{m}_{i=1}{(x^{i}-\hat\mu_{m})}]-\sigma^2_{m}\\=\frac{m-1}{m}\sigma^2_{m}-\sigma^2_{m}=\frac{-\sigma^2}{m}
因此样本方差是高斯方差参数的有偏估计量。

3.为什么样本方差会是有偏估计值呢?

样本方差的无偏估计为σ^m2=1m1i=1m(xiμ^m)\hat\sigma^2_{m}=\frac{1}{m-1}\sum^{m}_{i=1}{(x^{i}-\hat\mu_{m})}
最关键的是,样本与实际并不相同。样本均值是在实际均值上下波动的一个值,其方差不为0。故需要修正方差引起的影响。反过来即是,若其方差为0,则是无偏估计。

参考文献
[1]深度学习(花书)5.4.2节
[2]https://blog.csdn.net/cx1165597739/article/details/93330524

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!