卜瓦松分布

离散概率分布

卜瓦松分布(法語:loi de Poisson;英語:Poisson distribution)又稱Poisson分布泊松分布布瓦松分布布阿松分布普阿松分布波以松分布卜氏分布帕松小數法則(Poisson law of small numbers),是一種統計機率學裡常見到的離散機率分布,由法國數學家西莫恩·德尼·卜瓦松在1838年時發表。

卜瓦松分布
機率質量函數
Plot of the Poisson PMF
橫軸是索引k,發生次數。該函數只定義在k為整數的時候。連接線是只為了指導視覺。
累積分布函數
Plot of the Poisson CDF
橫軸是索引k,發生次數。CDF在整數k處不連續,且在其他任何地方都是水平的,因為服從卜瓦松分布的變量只針對整數值。
母數 λ > 0(實數
值域
機率質量函數
累積分布函數

,或,或

(對於,其中不完全Γ函數高斯符號,Q是規則化Γ函數)
期望值
中位數
眾數
變異數
偏度
峰度

(假設較大)


動差母函數
特徵函數
機率母函數

卜瓦松分布適合於描述單位時間內隨機事件發生的次數的機率分布。如某一服務設施在一定時間內受到的服務請求的次數,電話交換機接到呼叫的次數、汽車站台的候客人數、機器出現的故障數、自然災害發生的次數、DNA序列的變異數、放射性原子核的衰變數、雷射的光子數分布等等。(單位時間內發生的次數,可以看作事件發生的頻率,類似物理的頻率)。

卜瓦松分布的機率質量函數為:

卜瓦松分布的母數是隨機事件發生次數的數學期望值。

記號

 服從母數為 的卜瓦松分布,記為 ,或記為 .

性質

1、服從卜瓦松分布的隨機變數,其數學期望值變異數相等,同為母數  :  

2、兩個獨立且服從卜瓦松分布的隨機變數,其和仍然服從卜瓦松分布。更精確地說,若   ,則 。反過來若兩個獨立隨機變數的和服從卜瓦松分布,則這兩個隨機變數經平移後皆服從卜瓦松分布(Raikov定理英語Raikov's theorem)。

3、其動差母函數為:

 

推導

期望值:(倒數第三至第二是使用泰勒展開式)

 

 

我們可以得到: 

如同性質:  

相互獨立的卜瓦松分布隨機變數之和仍服從卜瓦松分布:

 

 

 

 


卜瓦松分布的來源(卜瓦松小數定律)

二項分布伯努利試驗中,如果試驗次數 很大,二項分布的機率 很小,且乘積 比較適中,則事件出現的次數的機率可以用卜瓦松分布來逼近。事實上,二項分布可以看作卜瓦松分布在離散時間上的對應物。

證明如下。首先,回顧自然對數 的定義:

 

二項分布的定義:

 

如果令  趨於無窮時 的極限:

 

最大概似估計(MLE)

給定 個樣本值 ,希望得到從中推測出母體的卜瓦松分布母數 的估計。為計算最大概似估計值,列出對數概似函數:

 
 

解得λ從而得到一個駐點(stationary point):

 

檢查函數 的二階導數,發現對所有的  大於零的情況二階導數都為負。因此求得的駐點是對數概似函數 的極大值點:

 

例子

對某公共汽車站的客流做調查,統計了某天上午10:30到11:47來到候車的乘客情況。假定來到候車的乘客各批(每批可以是1人也可以是多人)是互相獨立發生的。觀察每20秒區間來到候車的乘客批次,共觀察77分鐘*3=231次,共得到230個觀察記錄。其中來到0批、1批、2批、3批、4批及4批以上的觀察記錄分別是100次、81次、34次、9次、6次。使用極大似真估計(MLE),得到 的估計為 

生成卜瓦松分布的隨機變數

一個用來生成隨機卜瓦松分布的數字(偽隨機數抽樣)的簡單算法,已經由高德納給出(見下文參考):

algorithm poisson random number (Knuth):
    init:
         Let L ← e−λ, k ← 0 and p ← 1.
    do:
         k ← k + 1.
         Generate uniform random number u in [0,1] and let p ← p×u.
    while p > L.
    return k − 1.

儘管簡單,但複雜度是線性的,在返回的值 ,平均是 。還有許多其他算法來克服這一點。有些人由Ahrens和Dieter給出,請參閱下面的參考資料。同樣,對於較大的 值, 可能導致數值穩定性問題。對於較大 值的一種解決方案是拒絕採樣,另一種是採用卜瓦松分布的高斯近似。

對於很小的 值,逆轉換取樣簡單而且高效,每個樣本只需要一個均勻隨機數u。直到有超過 的樣本,才需要檢查累積機率。

algorithm Poisson generator based upon the inversion by sequential search:[1]
    init:
         Let x ← 0, p ← e−λ, s ← p.
         Generate uniform random number u in [0,1].
    do:
         x ← x + 1.
         p ← p * λ / x.
         s ← s + p.
    while u > s.
    return x.

參見

參考文獻

引用

  1. ^ Luc Devroye, Non-Uniform Random Variate Generation(Springer-Verlag, New York, 1986), chapter 10, page 505 http://luc.devroye.org/rnbookindex.html頁面存檔備份,存於網際網路檔案館

來源