條件機率分布

機率論中的概念

條件機率分佈Conditional Probability Distribution,或者 條件分佈Conditional Distribution )是現代機率論中的概念。已知兩個相關的隨機變量XY,隨機變量Y 在條件{X =x}下的條件機率分佈是指當已知X 的取值為某個特定值x之時,Y機率分佈。 如果Y 在條件{X =x}下的條件機率分佈是連續分佈,那麼其密度函數稱作Y 在條件{X =x}下的條件機率密度函數條件分佈密度條件密度函數)。與條件分佈有關的概念,常常以「條件」作為前綴,如條件期望條件方差等等。

例子

 
如果骰子一側是6點,朝上的可能是4點,但不可能是6點或1點。

假設在桌子上拋擲一枚普通的骰子,則其點數結果的機率分佈是集合 均勻分佈:每個點數出現的機率都是均等的六分之一。然而,如果據某個坐在桌邊的人觀察,向着他的側面是6點,那麼,在此條件下,向上的一面不可能是6點,也不可能是6點對面的1點。因此,在此條件下,拋骰子的點數結果是集合 的均勻分佈:有四分之一的可能性出現 四種點數中的一種。可以看出,增加的條件或信息量(某個側面是6點)導致了點數結果的機率分佈的變化。這個新的機率分佈就是條件機率分佈。

數學定義

更為嚴格清晰的定義需要用到數學語言。當隨機變量是離散或連續時,條件機率分佈有不同的表達方法。

離散條件分佈

對於離散型的隨機變量XY(取值範圍分別是  ),隨機變量Y 在條件{X =x}下的條件機率分佈是:

  

同樣的,X 在條件{Y=y}下的條件機率分佈是:

  

其中, XY 聯合分佈機率,即「 ,並且 發生的機率」。如果用 表示 的值:   那麼隨機變量XY邊際分佈就是:

 
 

因此, 隨機變量Y 在條件{X =x}下的條件機率分佈也可以表達為:

  

同樣的,X 在條件{Y=y}下的條件機率分佈也可以表達為:

  

連續條件分佈

對於連續型的隨機變量XY ,因此對離散型隨機變量的條件分佈定義不適用。假設其聯合密度函數為 XY 的邊際密度函數分別是  ,那麼Y 在條件{X =x}下的條件機率密度函數是:

 

同樣的,X 在條件{Y=y}下的條件機率密度函數是:

 

條件分佈和獨立分佈

在一定意義上,條件分佈和獨立分佈是相對的。如果兩個隨機變量XY 是獨立分佈的,那麼不論是否已知某個關於X 的條件,都不會影響Y 的機率分佈。用數學語言來說,就是:

 

這與獨立分佈的定義是相合的,事實上,隨機變量XY 相互獨立分佈,則:

 

因此

 

參見

參考資料

  • 趙衡秀. 《概率论与数理统计》. 清華大學出版社. 2005.