基本概念
总体: 总体就是一个概率分布。总体分布为指数分布就是指数分布总体,总体分布为正态分布时称为正态分布总统。
总体与分布簇: 仅含一个参数的分布簇称为单参数分布簇,仅含两个参数的分布称为双参数分布簇,含多个参数则为多参数分布簇。有些情况下,只假定总体有一定的概率分布而又不能明确其数学形式,总体分布不能通过若干参数表达出来,这种情况称为非参数总体。
有限总体与无限总体: 指数分布总体与正态分布总体称为无限总体。实际上,现实世界中,多数情况下,总体总是由有限个个体构成,从而其总体总是有限的,其分布也是离散分布,引入无限总体的概念,在概率论上相当于用一个连续分布的总体去逼近这个离散分布。
样本: 按一定的规定从总体中抽出的一部分个体(每个个体同等机会被抽出,以及在这个基础上设立的某种附加条件)
统计量: 完全由样本所决定的量。也就是说统计量只依赖于样本,而不依赖于任何其他未知的量。不依赖于总体分布中所包含的未知参数。
假设x1, x2, ..., xn为正态总体N(μ,σ2)中抽出的样本,其中σ2已知,而μ未知,则:xˉ=n1(x1+x2+...+xn),x1+x2+xn2/σ2是统计量,这里σ为已知,两个量均只由样本所决定。而x1−μ以及xˉ+λ均不是统计量。
统计量有什么作用
统计量由某种需要而设定。
常见的统计量
样本均值:xˉ=n1(x1+x2+...+xn)=n11∑nxi
样本方差:s2=n−111∑n(xi−xˉ)2
样本k阶原点矩:ak=n11∑nxik(一介原点矩即分布的期望)
样本k阶中心距:mk=n11∑n(xi−xˉ)k (二阶中心矩即为分布的方差)
次序统计量:x(1)=min(x1,x2,...,xn) ;… ;x(n)=max(x1,x2,...,xn)
参数估计—点估计
设统计总体x f(x;θ1,θ2,...,θn),此f(x;θ1,θ2,...,θn)可能是其分布密度函数,或分布函数,这里f(x;θ1,θ2,...,θn)设定为总体分布。以正态分布N(μ,σ2)为例,其中θ1=μ,θ2=σ2为其两个参数,该式可以表示为:
f(x;θ1,θ2)=2πθ21e−2θ2(x−θ1)2
点估计 :设x1, x2, ..., xn为从统计总体这种抽出的样本(独立随机样本,简单随机样本),要根据样本对总体分布中参数θ1,θ2,...,θn未知值进行估计,可能是θ1,θ2,...,θn的某一部分,或者他们的某个已知函数g(θ1,θ2,...,θn),例如要估计θ1选出合适的统计量:θ1~(x1,x2,...,xn) ,每确定一组观察值x1, x2, ..., xn,代入:θ1~(x1,x2,...,xn)之后就得到一个θ1的估计值。为此目的而构造的统计量:θ1~(x1,x2,...,xn) 就叫做θ1的估计量。
由于未知参数θ1是数轴上的一点,用θ1~去估计θ1,就相当于由一点去估计另一点,这样的估计叫做点估计。其核心是估计量的选择。
1 | 矩估计法
1.1 方法
即用矩去估计参数,因为假设参数已知时,可以得到相应的矩,这个由参数得到的矩是理论矩,同时假设样本符合相应分布,则由样本可以获得相应的矩,由样本获得的矩是估计矩。二者划等号,就可以用估计矩(已知样本)去估计参数(未知参数)
已知总体x服从f(x;θ1,θ2,...,θn),及样本x1, x2, ..., xn,建立矩方程:
ai=Exi
其中,ai为样本的原点矩ai=n1(x1i+...+xni),解方程组得到参数θ1,θ2,...,θn的矩估计量:
θ1~=θ1~(x1,x2,...,xn)
θ2~=θ2~(x1,x2,...,xn)
……
θn~=θn~(x1,x2,...,xn)
若要估计g(θ1,θ2,...,θn),则用g(θ1~,θ2~,...,θ3~)进行估计
1.2 矩估计实例:
- 设正态分布N(μ,σ2),其中μ和σ2均未知,现估计两个参数。则可以建立矩方程:
μ=xˉ σ2=m2
若要估计标准差σ由σ=σ2=g(σ2)进行估计
- 设总体分布为参数λ的指数分布,x1, x2, ..., xn为样本,要估计1/λ。
因为1/λ为一介原点矩(因为指数分布的一介原点矩,即期望为1/λ),由矩方程:xˉ=1/λ可得1/λ的矩估计为xˉ;另因为总体分布的方差为1/λ2,由矩方程m2=1/λ2,也可得到1/λ的矩估计为m2。矩估计方法下得出不同的矩估计量xˉ和m2,这里说明同一参数在矩估计法下可能得出不同的统计量
- 设总体分布为区间[θ1,θ2]上的均匀分布,即x服从U[θ1,θ2], x1, x2, ..., xn为独立随机样本。因为均匀分布的期望为α=(θ1+θ2)/2,均匀分布的方差为μ2=(θ1+θ2)2/12。由这两个矩估计方程,联立方程可求解参数θ1,θ2的矩估计量。
2 | 极大似然估计
2.1 方法
设总体分布x服从f=(x;θ1,θ2,...,θk);x1, x2, ..., xn为来自总体的样本,则样本的分布为:
f(x1;θ1,θ2,...,θk)⋅f(x2;θ1,θ2,...,θk)⋅...⋅f(xn;θ1,θ2,...,θk)
用L(x1,x2,...,xn;θ1,θ2,...,θk) 表示,L反映了在此参数θ1,θ2,...,θk下的总体中抽出当前样本x1,x2,...,xn的概率(由于每个样本的抽取是独立随机的,所以抽到特定总样本的概率就等于每个样本个体抽取的概率的乘积),在总体分布簇中寻找出那么一组参数,使得在该组参数下总体中出现当前样本的概率最大。
在样本x1, x2, ..., xn下,称L(x1,x2,...,xn;θ1,θ2,...,θk