0.背景
有一组独立同分布的样本{x1,x2,...,xm}服从高斯分布p(xi)=N(xi;μ,σ2)。高斯概率密度函数如下:
p(xi)=2πσ21exp(−21σ2(xi−μ)2)
1.估计的偏差计算公式
bias(θ^m)=E(θ^m)−θ
其中θ是定义数据生成分布的θ的真实值,θ^m是m个样本计算得到的θ的估计值,E(x)是期望算子。
2.常用样本估计量的无偏估计
2.1 样本均值
样本均值:μ^m=m1∑i=1mxi
判断样本均值是否有偏,计算下列公式:
bias(μ^m)=E(μ^m)−μ=E[m1∑i=1mxi]−μ=(m1∑i=1mE[xi])−μ=(m1∑i=1mμ)−μ=μ−μ=0
因此样本均值是高斯均值参数的无偏估计量。
2.2 样本方差
样本方差:σ^m2=m1∑i=1m(xi−μ^m)
判断样本方差是否有偏,计算下列公式:
bias(σ^m2)=E(σ^m2)−σm2=E[m1∑i=1m(xi−μ^m)]−σm2=mm−1σm2−σm2=m−σ2
因此样本方差是高斯方差参数的有偏估计量。
3.为什么样本方差会是有偏估计值呢?
样本方差的无偏估计为σ^m2=m−11∑i=1m(xi−μ^m)
最关键的是,样本与实际并不相同。样本均值是在实际均值上下波动的一个值,其方差不为0。故需要修正方差引起的影响。反过来即是,若其方差为0,则是无偏估计。
参考文献
[1]深度学习(花书)5.4.2节
[2]https://blog.csdn.net/cx1165597739/article/details/93330524