機率論

「機率論」的各地常用名稱
「機率論」的各地常用名稱
中國大陸	概率論
臺灣	機率論
港澳	概率論
日本、韓國漢字	確率論

機率論（英語：Probability theory）是研究機率、隨機性及不確定性等現象的數學分支。機率論主要研究物件為隨機事件、隨機變數以及隨機過程。

對於隨機事件是不可能準確預測其結果的，然而對於一系列的獨立隨機事件——例如擲骰子、扔硬幣、抽撲克牌以及輪盤等，會呈現出一定的、可以被用於研究及預測的規律，兩個用來描述這些規律的最具代表性的數學結論分別是大數法則和中央極限定理。

作為統計學的數學基礎，機率論對諸多涉及大量數據定量分析的人類活動極為重要^[1]，機率論的方法同樣適用於其他方面，例如對只知道系統部分狀態的複雜系統的描述——統計力學，而二十世紀物理學的重大發現是以量子力學所描述的原子尺度上物理現象的機率本質^{[來源請求]}。

數學家和精算師認為機率是在0至1閉區間內的數字，指定給一發生與失敗是隨機的「事件」。機率 $P(A)$ 根據機率公理來指定給事件 $A$ 。

一事件 $A$ 在一事件 $B$ 確定發生後會發生的機率稱為 $B$ 給之 $A$ 的條件機率；其數值為 ${P(B\cap A) \over P(B)}$ 。若 $B$ 給之 $A$ 的條件機率和 $A$ 的機率相同時，則稱 $A$ 和 $B$ 為獨立事件。且 $A$ 和 $B$ 的此一關係為對稱的，這可以由一同價敘述：「當 $A$ 和 $B$ 為獨立事件時， $P(A\cap B)=P(A)P(B)$ 。」中看出。

機率論中的兩個重要概念為隨機變數和隨機變數的機率分布兩種。

生活例子

人們對機率總是有一點觸摸不清的感覺，而事實上也有很多看似奇異的結果：

六合彩：在六合彩（49選6）中，一共有13,983,816種可能性（參閱組合數學），如果每周都買一組不相同的號，一年有52周，則在實驗越多次（一直買直到中獎算一次）之後，平均中獎所花的時間會越接近 ${\frac {13983816}{52}}=268919$ 。

事實上，即使每周買相同的號碼，獲得頭獎的機率也是相同的。但假設每周實際中獎的組合都不重複，268919年的算術推論是正確的，這說明機率和其他數學理論可能導出不同的結論。

六合彩：仍然是六合彩。買5, 17, 19, 24, 33, 49中奬機率高還是買1,2,3,4,5,6的中奬機率高?

古典機率論說：一樣。

但實際上機械或彩球製造上都有些微小的差異，所以每組機率不一定完全相同，但必須累積多期開獎結果後才看得出來。

生日悖論：根據機率論，在每23人當中，至少有兩個人的生日相同的機率大於50％。
輪盤遊戲：在遊戲中玩家可能認為，在連續出現多次紅色後，出現黑色的機率會越來越大。

這種判斷也是錯誤的，即出現黑色的機率每次是相等的，因為球本身並沒有「記憶」，它不會意識到以前都發生了什麼，其機率始終是

{\frac {18}{37}}

。

但輪盤的前後期開獎數字形成時間序列（可能存在自我迴歸模型）。

三門問題：在參賽者面前有三扇關閉的門，其中只有一扇後面有名車，而其餘的後面是山羊。

遊戲規則是，參賽者先選取一扇門，但在他打開之前，主持人在其餘兩扇門中打開了一扇有山羊的門，並詢問參賽者是否改變主意選擇另一扇門，以使贏得名車的機率變大。

正確的分析結果是，假如不管開始哪一扇門被選，主持人都打開其餘兩扇門中有山羊的那一扇並詢問參賽者是否改變主意，則改變主意會使贏得汽車的機率增加一倍。

歷史

作為數學統計基礎的機率論的創始人分別是法國數學家帕斯卡和子碩，其可追溯到公元17世紀。當時的法國宮廷貴族裡盛行著擲骰子遊戲，遊戲規則是玩家連續擲4次骰子，如果其中沒有6點出現，玩家贏，如果出現一次6點，則莊家（相當於現在的賭場）贏。按照這一遊戲規則，從長期來看，莊家扮演贏家的角色，而玩家大部分時間是輸家，因為莊家總是要靠此維生的，而當時人們也接受了這種現象。

後來為了使遊戲更刺激，遊戲規則發生了些許變化，玩家這回用2個骰子連續擲24次，不同時出現2個6點，玩家贏，否則莊家贏。當時人們普遍認為，2次出現6點的機率是一次出現6點的機率的1 / 6，因此6倍於前一種規則的次數，也既是24次贏或輸的機率與以前是相等的。然而事實卻並非如此，從長期來看，這回莊家處於輸家的狀態，於是他們去請教當時的數學家帕斯卡，求助其對這種現象作出解釋。

其他對機率論的發展作出重要貢獻的人還有荷蘭物理、數學家惠更斯，瑞士物理、數學家伯努利，法國數學家棣美弗，法國數學、天文學家拉普拉斯，德國數學家高斯，法國物理、數學家卜瓦松，義大利數學、醫學家卡爾達諾以及蘇聯數學家科摩哥洛夫。

事件

單位事件、事件空間、隨機事件

在一次隨機試驗中可能發生的不能再細分的結果被稱為基本事件，或者稱為單位事件，用 $E$ 表示。在隨機試驗中可能發生的所有單位事件的集合稱為事件空間，用 $S$ 來表示。例如在一次擲骰子的隨機試驗中，如果用獲得的點數來表示單位事件，那麼一共可能出現 6 個單位事件，則事件空間可以表示為 $S=\{1,2,3,4,5,6\}$ 。

上面的事件空間是由可數有限單位事件組成，事實上還存在著由可數無限以及不可數單位事件組成的事件空間，比如在一次獲得正面朝上就停止的隨機擲硬幣試驗中，其事件空間由可數無限單位事件組成，表示為： $S=$ { 正，反正，反反正，反反反正，反反反反正，···}，注意到在這個例子中"反反反正"是單位事件。將兩根筷子隨意扔向桌面，其靜止後所形成的交角假設為 $\alpha$ ，這個隨機試驗的事件空間的組成可以表示為 $S=\{\alpha |0^{\circ }\leq \alpha <180^{\circ }\}$ 。

隨機事件是事件空間 $S$ 的子集，它由事件空間 $S$ 中的單位元素構成，用大寫字母 $A,B,C\cdots$ 表示。例如在擲兩個骰子的隨機試驗中，設隨機事件 $A$ = 「獲得的點數和大於10」，則 $A$ 可以由下面 3 個單位事件組成： $A=\{(5,6),(6,5),(6,6)\}$ 。

如果在隨機試驗中事件空間中的所有可能的單位事件都發生，這個事件被稱為必然事件，表示為 $S\subset S$ ；相應的如果事件空間裡不包含任何一個單位事件，則稱為不可能事件，表示為 $\varnothing \subset S$ 。

事件的計算

因為事件在一定程度上是以集合的含義定義的，因此可以把集合計算方法直接應用於事件的計算，也就是說，在計算過程中，可以把事件當作集合來對待。

$A$ 的補集不屬於 $A$ 的事件發生	聯集 $A$ ∪ $B$ 或者 $A$ 或者 $B$ 或者 $A,B$ 同時發生	交集 $A$ ∩ $B$ 事件 $A,B$ 同時發生
差集 $A$ \ $B$ 不屬於 $B$ 的 $A$ 事件發生	空集 $A$ ∩ $B$ = ∅ $A,B$ 事件不同時發生	子集 $B$ ⊆ $A$ 如 $B$ 發生，則 $A$ 也一定發生

在輪盤遊戲中假設 $A$ 代表事件「球落在紅色區域」， $B$ 代表事件"球落在黑色區域"，因為事件 $A$ 和 $B$ 沒有共同的單位事件，因此可表示為

$A\cap B=\varnothing$

注意到事件 $A$ 和 $B$ 並不是互補的關係，因為在整個事件空間 $S$ 中還有一個單位事件「零」，其即不是紅色也不是黑色，而是綠色，因此 $A,B$ 的補集應該分別表示如下：

${\bar {A}}=S\setminus A=B\cup \left\{0\right\}$
${\bar {B}}=S\setminus B=A\cup \left\{0\right\}$

機率的定義

傳統機率（古典機率、拉普拉斯機率）

傳統機率的定義是由法國數學家拉普拉斯提出的。如果一個隨機試驗所包含的單位事件是有限的，且每個單位事件發生的可能性均相等，則這個隨機試驗叫做拉普拉斯試驗。在拉普拉斯試驗中，事件 $A$ 在事件空間 $S$ 中的機率 $P(A)$ 為：

例如，在一次同時擲一個硬幣和一個骰子的隨機試驗中，假設事件 $A$ 為獲得國徽面且點數大於 4 ，那麼事件 $A$ 的機率應該有如下計算方法： $S=$ { ( 國徽，1 點 )，( 數字，1 點 )，( 國徽，2 點 )，( 數字，2 點 )，( 國徽，3 點 )，( 數字，3 點 )，( 國徽，4 點 )，( 數字，4 點 )，( 國徽，5 點 )，( 數字，5 點 )，( 國徽，6 點 )，( 數字，6 點 ) }， $A$ ＝{( 國徽，5 點 )，( 國徽，6 點 )}，按照拉普拉斯定義， $A$ 的機率為，

P(A)={\frac {2}{12}}={\frac {1}{6}}

注意到在拉普拉斯試驗中存在著若干的疑問，在現實中是否存在著其單位事件的機率具有精確相同的機率值的試驗? 因為我們不知道，硬幣以及骰子是否完美，即骰子製造的是否均勻，其重心是否位於正中心，以及輪盤是否傾向於某一個數字。儘管如此，傳統機率在實踐中被廣泛應用於確定事件的機率值，其理論根據是：如果沒有足夠的論據來證明一個事件的機率大於另一個事件的機率，那麼可以認為這兩個事件的機率值相等。

如果仔細觀察這個定義會發現拉普拉斯用機率解釋了機率，定義中用了相同的可能性 ( 原文是 également possible )一詞，其實指的就是"相同的機率"。這個定義也並沒有說出，到底什麼是機率，以及如何用數字來確定機率。在現實生活中也有一系列問題，無論如何不能用傳統機率定義來解釋，比如，人壽保險公司無法確定一個 50 歲的人在下一年將死去的機率。

統計機率

繼傳統機率論之後，英國邏輯學家約翰·維恩和奧地利數學家理察提出建立在頻率理論基礎上的統計機率。他們認為，獲得一個事件的機率值的唯一方法是通過對該事件進行 100 次，1000 次或者甚至 10000 次的前後相互獨立的 $n$ 次隨機試驗，針對每次試驗均記錄下絕對頻率值 $h_{n}$ (A)和相對頻率值 $f_{n}$ (A)，隨著試驗次數 $n$ 的增加，會出現如下事實，即相對頻率值會趨於穩定，它在一個特定的值上下浮動，也即是說存在著一個極限值 $P(A)$ ，相對頻率值趨向於這個極限值。這個極限值被稱為統計機率，表示為：

P(A)=\lim _{n\to \infty }f_{n}(A)

例如，若想知道在一次擲骰子的隨機試驗中獲得 6 點的機率值可以對其進行 3000 次前後獨立的扔擲試驗，在每一次試驗後記錄下出現 6 點的次數，然後通過計算相對頻率值可以得到趨向於某一個數的統計機率值。

扔擲數	獲得 6 點的絕對頻率	獲得 6 點的相對頻率
1	1	1.00000
2	1	0.50000
3	1	0.33333
4	1	0.25000
5	2	0.40000
10	2	0.20000
20	5	0.25000
100	12	0.12000
200	39	0.19500
300	46	0.15333
400	72	0.18000
500	76	0.15200
600	102	0.17000
700	120	0.17143
1000	170	0.17000
2000	343	0.17150
3000	506	0.16867

上面提到的這個有關相對頻率的經驗規律是大數法則在現實生活中的反映，大數法則是初等機率論的基礎。統計機率在今天的實踐中依然具有重要意義，特別是在初等機率論及數理統計等學科中。

現代機率論

與初等機率論相對的，是「現代機率論」。因測度論的研究與發展，現代機率論得以公理化。一些曾經無法用初等機率論解釋的概念因此得以用公理化的語言進行解釋，可以說現代機率論以測度論為理論基礎終於得以完善，完成了其現代化進程。現代機率論由前蘇聯數學家科摩哥洛夫於1933年建立公理化。

機率公理

如果一個函數 $P:S\to \mathbb {R} ,\ A\mapsto P(A)$ 指定給每一個事件空間 $S$ 中的事件 $A$ 一個實數 $P(A)$ ，並且其滿足下面的 3 個公理，那麼函數 $P$ 叫做機率函數，相應的 $P(A)$ 叫做事件 $A$ 的機率。

公理 1：

0\leq P(A)\leq 1\ (A\in S)

事件

A

的機率

P(A)

是一個0與1之間（包含0與1）的非負實數。

公理 2：

P(S)=1

事件空間的機率值為 1 。

公理 3：

P(A\cup B)=P(A)+P(B)

，如果

A\cap B=\varnothing

互斥事件的加法法則。這裡需注意：公理3可以推廣到可數個互斥事件的聯集。

完全機率

$n$ 個事件 $H_{1},H_{2},...H_{n}$ 兩兩互斥，且共同組成整個事件空間 $S$ ，即
$H_{i}\cap H_{j}=\varnothing$ ， $(i\neq j)$ 以及
$H_{1}\cup H_{2}\cup ...\cup H_{n}=S$
這時 $A$ 的機率可以表示為，

P(A)=\sum _{j=1}^{n}P(A|H_{j})\cdot P(H_{j})

證明：

$A=(A\cap H_{1})\cup (A\cap H_{2})\cup \ldots \cup (A\cap H_{n})$
按照公理 3 ，有
$P(A)=P(A\cap H_{1})+P(A\cap H_{2})+\ldots +P(A\cap H_{n})$
根據乘法法則， $P(A\cap H_{j})=P(A|H_{j})\cdot P(H_{j})$
因此有，
$P(A)=P(A|H_{1})\cdot P(H_{1})+\ldots +P(A|H_{n})\cdot P(H_{n})$
$P(A)=\sum _{j=1}^{n}P(A|H_{j})\cdot P(H_{j})$

例如，一個隨機試驗工具由一個骰子和一個柜子中的三個抽屜組成，抽屜 1 里有 14 個白球和 6 個黑球，抽屜 2 里有 2 個白球和 8 個黑球，抽屜 3 里有 3 個白球和 7 個黑球，試驗規則是首先擲骰子，如果獲得小於 4 點，則抽屜 1 被選擇，如果獲得 4 點或者 5 點，則抽屜 2 被選擇，其他情況選擇抽屜 3 。然後在選擇的抽屜里隨機抽出一個球，最後抽出的這個球是白球的機率是：

P(白)=P(白|抽1)·P(抽1)+P(白|抽2)·P(抽2)＋P(白|抽3)·P(抽3)

=(14/20)·(3/6)+(2/10)·(2/6)+(3/10)·(1/6)

=28/60=0.4667

從例子中可看出，完全機率特別適合於分析具有多層結構的隨機試驗的情況。

貝氏定理

貝氏定理由英國數學家托馬斯·貝葉斯 ( Thomas Bayes 1702-1761 ) 發展，用來描述兩個條件機率之間的關係，比如 P(A|B) 和 P(B|A)。按照定理 6 的乘法法則，P(A∩B)=P(A)·P(B|A)=P(B)·P(A|B)，可以立刻導出貝氏定理：

P(A\vert B)={\frac {P(B\vert A)\cdot P(A)}{P(B)}}

例如：一座別墅在過去的 20 年裡一共發生過 2 次被盜，別墅的主人有一條狗，狗平均每周晚上叫 3 次，在盜賊入侵時狗叫的機率被估計為 0.9，問題是：在狗叫的時候發生入侵的機率是多少？
我們假設 $A$ 事件為狗在晚上叫， $B$ 為盜賊入侵，則 $P(A)=3/7$ ， $P(B)$ =2/(20·365.25)=2/7305，P(A | B) = 0.9，按照公式很容易得出結果：
$P(B\vert A)=0.9\cdot {\frac {2}{7305}}\cdot {\frac {7}{3}}=0.0005749486653...$

另一個例子，現分別有 $A$ ， $B$ 兩個容器，在容器 $A$ 里分別有 7 個紅球和 3 個白球，在容器 $B$ 里有 1 個紅球和 9 個白球，現已知從這兩個容器里任意抽出了一個球，且是紅球，問這個紅球是來自容器 $A$ 的機率是多少?

假設已經抽出紅球為事件 $B$ ，從容器 $A$ 里抽出球為事件 $A$ ，則有： $P(B)$ = 8 / 20， $P(A)$ = 1 / 2， $P(B|A)$ = 7 / 10，按照公式，則有：
$P(A\vert B)={\frac {7}{10}}\cdot {\frac {1}{2}}\cdot {\frac {20}{8}}={\frac {7}{8}}$

機率分布

機率論的應用

雖然機率論最早產生於17世紀，然而其公理體系只在20世紀的20至30年代才建立起來並得到迅速發展，在過去的半個世紀裡機率論在越來越多的新興領域顯示了它的應用性和實用性，例如：物理、化學、生物、醫學、心理學、社會學、政治學、教育學，經濟學以及幾乎所有的工程學等領域。特別值得一提的是，機率論是今天數理統計的基礎，其結果被用做問卷調查的分析資料或者對經濟前景進行預測。

參見

參考文獻

^ Inferring From Data. [2016-10-18]. （原始內容存檔於2020-11-27）.

（德文）彼得缺菲爾 ( Peter Zoefel )：《統計和經濟學家》 PEASON Studium 出版社 2003 年 ISBN 3-8273-7062-0
（德文）約瑟夫西拉 ( Josef Schira )：《統計理論與企業管理》 PEASON Studium 出版社 2003 年 ISBN 3-8273-7041-8
（德文）漢斯－底特黑伯曼 ( Hans-Dieter Hippmann )：《統計學》 SCHAEFFER POESCHEL 出版社 2003 年 ISBN 3-7910-2119-2
（德文）里波舒爾茨 ( Seymour Lipschutz )：《機率計算－理論和應用》 McGRAW-HILL BOOK COMPANY GmbH 出版社 1980 年 ISBN 0-07-084361-9
（德文）貝爾等 ( Beyer，Hackel，Pieper，Tiedge )《機率計算和數學統計》 Harri Deutsch 出版社 1980 年 ISBN 3-87144-433-2

[1] Inferring From Data. [2016-10-18]. （原始內容存檔於2020-11-27）.

[1]