2.1 条件概率,全概率公式,Bayes公式
1.条件概率
对概率的讨论总是限制在一组固定条件下进行。以前的讨论总是假设除此以外再无其余信息可供使用。然而,我们有时却需要考虑:已知某一事件 B B B 已经发生,要求在该情况下另一事件 A A A 发生的概率这样的情况。我们所需要计算的概率实际上是“在已知事件 B B B 发生的条件下,事件 A A A 发生的概率”,我们记这个概率为:P ( A ∣ B ) P(A|B) P ( A ∣ B ) .
定义2.1.1 (条件概率)
设 ( Ω , F , P ) (\Omega, \mathscr{F},P) ( Ω , F , P ) 为一个概率空间,B ∈ F B \in \mathscr{F} B ∈ F ,且 P ( B ) > 0 P(B)>0 P ( B ) > 0 ,则对任意 A ∈ F A \in \mathscr{F} A ∈ F ,记P ( A ∣ B ) = P ( A B ) P ( B ) . P(A|B) = \frac{P(AB)}{P(B)}. P ( A ∣ B ) = P ( B ) P ( A B ) .
并称 P ( A ∣ B ) P(A|B) P ( A ∣ B ) 为 在事件 B B B 发生的条件下事件 A A A 发生的条件概率 .
注:
未经特别指出,在出现条件概率 P ( A ∣ B ) P(A|B) P ( A ∣ B ) 时,均假定 P ( B ) > 0. P(B)>0. P ( B ) > 0 .
由条件概率定义式立即得到:P ( A B ) = P ( B ) P ( A ∣ B ) . P(AB) = P(B)P(A|B). P ( A B ) = P ( B ) P ( A ∣ B ) .
称该等式为: 概率的乘法公式或乘法定理 。
若 P ( A ) > 0 P(A)>0 P ( A ) > 0 ,亦可相应地定义 P ( B ∣ A ) . P(B|A). P ( B ∣ A ) .
下面讨论条件概率的性质:
显见条件概率具有概率的基本性质:非负性、规范性、可列可加性:
1.1 P ( A ∣ B ) ≥ 0 P(A|B) \geq 0 P ( A ∣ B ) ≥ 0 ;
1.2 P ( Ω ∣ B ) = 1 P(\Omega|B) = 1 P ( Ω ∣ B ) = 1 ;
1.3 P ( ∑ i = 1 ∞ A i ∣ B ) = ∑ i = 1 ∞ P ( A i ∣ B ) P(\sum_{i=1}^{\infty}A_{i}|B) = \sum_{i=1}^{\infty}P(A_{i}|B) P ( ∑ i = 1 ∞ A i ∣ B ) = ∑ i = 1 ∞ P ( A i ∣ B ) .
对条件概率,也可由三个基本性质导出其余一些性质:
2.1 P ( ∅ ∣ B ) = 0 P(\empty|B) = 0 P ( ∅ ∣ B ) = 0
2.2 P ( A ∣ B ) = 1 − P ( A ‾ ∣ B ) P(A|B) = 1-P(\overline{A}|B) P ( A ∣ B ) = 1 − P ( A ∣ B )
2.3 P ( A 1 ∪ A 2 ∣ B ) = P ( A 1 ∣ B ) + P ( A 2 ∣ B ) − P ( A 1 A 2 ∣ B ) . P(A_{1}\cup A_{2}|B) = P(A_{1}|B) + P(A_{2}|B) - P(A_{1}A_{2}|B). P ( A 1 ∪ A 2 ∣ B ) = P ( A 1 ∣ B ) + P ( A 2 ∣ B ) − P ( A 1 A 2 ∣ B ) .
(推广的乘法公式)可以将乘法公式推广至任意 n n n 个事件相交的情况:
P ( A 1 A 2 ⋯ A n ) = P ( A 1 ) P ( A 2 ∣ A 1 ) P ( A 3 ∣ A 1 A 2 ) ⋯ P ( A n ∣ A 1 A 2 ⋯ A n − 1 ) P(A_{1}A_{2}\dotsb A_{n}) = P(A_{1})P(A_{2}|A_{1})P(A_{3}|A_{1}A_{2})\dotsb P(A_{n}|A_{1}A_{2}\dotsb A_{n-1}) P ( A 1 A 2 ⋯ A n ) = P ( A 1 ) P ( A 2 ∣ A 1 ) P ( A 3 ∣ A 1 A 2 ) ⋯ P ( A n ∣ A 1 A 2 ⋯ A n − 1 )
当然,此处要求 P ( A 1 A 2 ⋯ A n − 1 ) > 0. P(A_{1}A_{2}\dotsb A_{n-1})>0. P ( A 1 A 2 ⋯ A n − 1 ) > 0 .
2. 全概率公式
如何从已知的简单事件的概率推算出未知复杂事件的概率,是概率论的重要研究课题之一。为达到这个目的,我们经常将一个复杂时间分解为若干个不相容的简单事件之和,再通过分别计算这些简单事件的概率,最后利用概率的可加性得到结果。在此,全概率起着非常重要的作用。
从最简单的情况开始。为计算 P ( B ) P(B) P ( B ) ,找一个和它有关的事件 A A A ,利用关系式:P ( B ) = P ( A B ) + P ( A ‾ B ) = P ( A ) P ( B ∣ A ) + P ( A ‾ ) P ( B ∣ A ‾ ) P(B) = P(AB) + P(\overline{A}B) = P(A)P(B|A) + P(\overline{A})P(B|\overline{A}) P ( B ) = P ( A B ) + P ( A B ) = P ( A ) P ( B ∣ A ) + P ( A ) P ( B ∣ A )
就是最常见的方法之一。
下面研究更一般的状况:
设事件 A 1 , A 2 , ⋯ , A n , ⋯ A_{1},A_{2},\dotsb, A_{n},\dotsb A 1 , A 2 , ⋯ , A n , ⋯ 是样本空间 Ω \Omega Ω 的一个分割,亦称 完备时间组 ,即 A i ( i = 1 , 2 , ⋯ , n , ⋯ ) A_{i}\ (i = 1,2,\dotsb, n,\dotsb) A i ( i = 1 , 2 , ⋯ , n , ⋯ ) 两两互不相容,且∑ i = 1 ∞ A i = Ω \sum_{i=1}^{\infty}A_{i} = \Omega i = 1 ∑ ∞ A i = Ω
这样就有B = ∑ i = 1 ∞ A i B B = \sum^{\infty}_{i = 1}A_{i}B B = i = 1 ∑ ∞ A i B
此处的 A i B ( i = 1 , 2 , ⋯ , n , ⋯ ) A_{i}B \ (i = 1,2,\dotsb, n, \dotsb) A i B ( i = 1 , 2 , ⋯ , n , ⋯ ) 也两两互不相容。
由概率的完全可加性,再利用乘法公式得:P ( B ) = ∑ i = 1 ∞ P ( A i ) P ( B ∣ A i ) P(B) = \sum_{i = 1}^{\infty}P(A_{i})P(B|A_{i}) P ( B ) = i = 1 ∑ ∞ P ( A i ) P ( B ∣ A i )
称该公式为 全概率公式 ,是概率论中使用频率最高的一个基本公式。
3. Bayes公式
若事件 B B B 能且只能与两两互不相容的事件 A 1 , A 2 , ⋯ , A n , ⋯ A_{1},A_{2},\dotsb,A_{n},\dotsb A 1 , A 2 , ⋯ , A n , ⋯ 之一同时发生,即:B = ∑ i = 1 ∞ B A i B = \sum_{i = 1}^{\infty}BA_{i} B = i = 1 ∑ ∞ B A i
由于P ( A i B ) = P ( B ) P ( A i ∣ B ) = P ( A i ) P ( B ∣ A i ) P(A_{i}B) = P(B)P(A_{i}|B) = P(A_{i})P(B|A_{i}) P ( A i B ) = P ( B ) P ( A i ∣ B ) = P ( A i ) P ( B ∣ A i )
故P ( A i B ) = P ( A i ) P ( B ∣ A i ) P ( B ) P(A_{i}B) = \frac{P(A_{i})P(B|A_{i})}{P(B)} P ( A i B ) = P ( B ) P ( A i ) P ( B ∣ A i )
再利用全概率公式即得:P ( A i ) ∣ B = P ( A i ) P ( B ∣ A i ) ∑ i = 1 ∞ P ( A i ) P ( B ∣ A i ) P(A_{i})|B = \frac{P(A_{i})P(B|A_{i})}{\sum_{i = 1}^{\infty}P(A_{i})P(B|A_{i})} P ( A i ) ∣ B = ∑ i = 1 ∞ P ( A i ) P ( B ∣ A i ) P ( A i ) P ( B ∣ A i )
称该公式为 Bayes公式 。