概率论——超几何随机变量

╄→尐↘猪︶ㄣ 提交于 2020-01-30 13:20:14

超几何随机变量

1 定义

  假定一个袋子里面有NN个球,其中有mm个白球,NmN-m个黑球,现在随机地从袋子中不放回地取出nn个球,令随机变量XX表示取出来的白球数,则:
P{X=i}=(mi)(Nmni)(Nn)       i=0,1,,n P\{X = i\} = \cfrac{\begin{pmatrix}m\\i\end{pmatrix}\begin{pmatrix}N-m\\n-i\end{pmatrix}}{\begin{pmatrix}N\\n\end{pmatrix}}\ \ \ \ \ \ \ i = 0,1,\cdots,n
一个随机变量XX如果其概率质量函数形如上式,其中N,m,nN,m,n值给定,那么就称XX为超几何随机变量
  注意,ii的取值范围是0到nn,如果ii不满足n(Nm)imin(n,m)n-(N-m)\le i \le min(n,m),那么P{X=i}=0P\{X=i\} = 0,但是上式总是成立的,因为我们规定了在k<0k\lt 0r<kr\lt k时,(rk)=0\begin{pmatrix}r\\k\end{pmatrix}=0

2 超几何随机变量的近似

  现在我们已经知道了从NN个球(白球比例p=m/Np=m/N)中不放回地随机取nn个球,那么取中的白球数为超几何随机变量。现在考虑一种情况,即对与nn来说,如果m,Nm,N都很大的话,那么有放回和无放回地取球没什么差别,因为不管取出来的是什么球,接下来取到白球的概率仍然近似于pp。直观感觉就是,当m,Nm,N相对于nn很大时,XX的概率质量函数应该近似于参数为(n,p)(n,p)的二项随机变量的概率质量函数。我们来推导一下:
P{X=i}=(mi)(Nmni)(Nn)=m!(mi)!i!(Nm)!(Nmn+i)!(ni)!(Nn)!n!N!=(ni)mNm1N1NmNiNm1Ni1Nm(ni1)Ni(ni1)(ni)pi(1p)ni \begin{aligned} P\{X = i\} &= \cfrac{\begin{pmatrix}m\\i\end{pmatrix}\begin{pmatrix}N-m\\n-i\end{pmatrix}}{\begin{pmatrix}N\\n\end{pmatrix}}\\ &=\cfrac{m!}{(m-i)!i!}*\cfrac{(N-m)!}{(N-m-n+i)!(n-i)!}*\cfrac{(N-n)!n!}{N!}\\ &=\begin{pmatrix}n\\i\end{pmatrix}\cfrac{m}{N}*\cfrac{m-1}{N-1}\cdots\cfrac{N-m}{N-i}*\cfrac{N-m-1}{N-i-1}\cdots\cfrac{N-m-(n-i-1)}{N-i-(n-i-1)}\\ &\approx \begin{pmatrix}n\\i\end{pmatrix}p^i(1-p)^{n-i} \end{aligned}
其中最后一个等式成立的条件是p=m/Np=m/Nm,Nm,N相对于nin,i来说都很大

3 参数为(n,N,m)(n,N,m)的超几何随机变量的期望和方差

  按照之前的期望和方差的求法,通过找到递推关系来计算,我们先来计算E[Xk]E[X^k]
E[Xk]=i=0nikP{X=i}=i=0nik(mi)(Nmni)/(Nn) E[X^k] = \sum_{i=0}^ni^kP\{X=i\} =\sum_{i=0}^ni^k\begin{pmatrix}m\\i\end{pmatrix}\begin{pmatrix}N-m\\n-i\end{pmatrix}/\begin{pmatrix}N\\n\end{pmatrix}
利用恒等式i(mi)=m(m1i1)n(Nn)=N(N1n1)i\begin{pmatrix}m\\i\end{pmatrix}=m\begin{pmatrix}m-1\\i-1\end{pmatrix},n\begin{pmatrix}N\\n\end{pmatrix}=N\begin{pmatrix}N-1\\n-1\end{pmatrix}带入上式得:
E[Xk]=mnNi=1nik1(m1i1)(Nmni)/(N1n1) E[X^k] = \cfrac{mn}{N}\sum_{i=1}^ni^{k-1}\begin{pmatrix}m-1\\i-1\end{pmatrix}\begin{pmatrix}N-m\\n-i\end{pmatrix}/\begin{pmatrix}N-1\\n-1\end{pmatrix}
换元令j=i1j = i-1,上式得:
E[Xk]=mnNj=0n1(j+1)k1(m1j)(Nmnj1)/(N1n1)=mnNE[(Y+1)k1] \begin{aligned} E[X^k] &= \cfrac{mn}{N}\sum_{j=0}^{n-1}(j+1)^{k-1}\begin{pmatrix}m-1\\j\end{pmatrix}\begin{pmatrix}N-m\\n-j-1\end{pmatrix}/\begin{pmatrix}N-1\\n-1\end{pmatrix} \\ &=\cfrac{mn}{N}E[(Y+1)^{k-1}] \end{aligned}
其中YY为参数为(n1,N1,m1)(n-1,N-1,m-1)的超几何随机变量。在上式的基础上令k = 1得到期望:
E[X]=mnN=np E[X] = \cfrac{mn}{N} = np
即取出白球数的期望值为mnN\cfrac{mn}{N}。再令k=2k=2得到:
E[X2]=mnNE[Y+1]=mnN[(m1)(n1)N1+1] E[X^2] = \cfrac{mn}{N}E[Y+1]=\cfrac{mn}{N}[\cfrac{(m-1)(n-1)}{N-1}+1]
则方程Var(X)Var(X)为:
Var(X)=E[X2]E[X]2=mnN[(m1)(n1)N1+1mnN]=np(1p)(1n1N1) Var(X) = E[X^2] - E[X]^2 = \cfrac{mn}{N}[\cfrac{(m-1)(n-1)}{N-1}+1-\cfrac{mn}{N}]\\ = np(1-p)(1-\cfrac{n-1}{N-1})
根据上一节的内容,当N,mN,m相对于n,in,i很大时,上式方差Var(X)Var(X)近似于:
Var(X)np(1p) Var(X)\approx np(1-p)
  总的来说,E[X]E[X]与又放回取球(即白球数是参数为(n,p)(n,p)的二项随机变量)是一样的,而当球数很大时,Var(X)Var(X)近似于有放回的情形

参考资料:《概率论基础教程》Sheldon M.Ross

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!