1 伯努利随机变量
对于一个试验,我们将其结果分为两类,成功或失败,当试验结果为成功时X=1,试验结果失为败时X=0。这样,随机变量X的概率质量函数为:
p(0)=P{X=0}=1−pp(1)=P{X=1}=p
其中0≤p≤1是每次试验成功的概率。如果随机变量的概率质量函数为上式的形式,那么就称X为伯努利随机变量。
2 二项随机变量
现在对于上述试验,假设进行n次独立的重复试验,每次试验成功的概率为p,失败的概率为1−p。现在我们令随机变量X表示n次试验中成功的次数,那么此时就称X为参数是(n,p)的二项随机变量,因此伯努利随机变量也是参数为(1,p)的二项随机变量。二项随机变量的概率质量函数为:
p(i)=(ni)pi(1−p)n−ii=0,1,⋯,n
根据二项式定理,可以得出概率和为1:
i=0∑np(i)=i=0∑n(ni)pi(1−p)n−i=(p+(1−p))n=1
3 二项随机变量的性质
首先来推导一下二项随机变量的期望和方差,根据期望的定义可得:
E[X]=i=0∑ni(ni)pi(1−p)n−i=i=1∑ni(ni)pi(1−p)n−i
现在对这个式子进行化简,我们来看式子中的i(ni):
i(ni)=i∗(n−i)!∗i!n!=(n−i)!∗(i−1)!n∗(n−1)!=n(n−1i−1)
将该式替换后,期望变为:
E[X]=i=1∑nn(n−1i−1)pi(1−p)n−i
令j=i−1,再提出适当的参数得:
E[X]=npj=0∑n−1(n−1j)pj(1−p)n−1−j
观察右边的式子(n−1j)pj(1−p)n−1−j可以看出,J是一个参数为(n−1,p)的二项随机变量,对这个式子求和的结果就是1,因此上述期望为:
E[X]=np
现在来推导X的方差,在这之前先考虑Xk的期望:
E[Xk]=i=0∑nik(ni)pi(1−p)n−i=i=1∑nik(ni)pi(1−p)n−i
同样,根据上面的过程我们最终能够得到:
E[Xk]=i=1∑nik(ni)pi(1−p)n−i=npj=0∑n−1(j+1)k−1(n−1j)pj(1−p)n−1−j=npE[(J+1)k−1]
其中J是一个参数为(n−1,p)的二项随机变量,令k=2则有:
E[X2]=npE[J+1]=np∗[(n−1)p+1]
根据方差和期望的关系可知:
Var(X)=E[X2]−E[X]2=np∗[(n−1)p+1]−np=np(1−p)
那么到现在,二项随机变量的期望和方差便推导完毕了:
E[X]=npVar(X)=np(1−p)
二项随机变量的概率质量函数的一个重要性质:如果X是一个参数为(n,p)的二项随机变量(0<p<1),那么当k从0到n时,P{X=k}是先增后减的,当k=[(n+1)p]时取得最大值,([X]表示小于或等于X的最大整数)这一性质的证明可以通过讨论P{X=k}−P{X=k−1}的正负来证明:
P{X=k}−P{X=k−1}≥0
带入公式得:
(nk)pk(1−p)n−k≥(nk−1)pk−1(1−p)n−k+1
化简后得:
p(n−k+1)≥k(1−p)
即当k≤(n+1)p的时候,函数是递增的,在该点取最大值,超过该点则递减。通过讨论还能够得到P{X=k}和P{X=k−1}的递推公式:
P{X=k}=(1−p)kp(n−k+1)P{X=k−1}
4 二项随机变量的分布函数
根据分布函数的定义可以轻松列出分布函数的求法:
P{X≤i}=k=0∑i(nk)pk(1−p)n−k
通过上述的P{X=k}和P{X=k−1}的递推公式便可轻易地编写计算分布函数的计算程序。
参考资料:《概率论基础教程》Sheldon M.Ross