萊姆克-豪森算法(英語:Lemke–Howson algorithm)[1]是一種計算雙矩陣博弈的納什均衡的算法,以其提出者卡爾頓·E·萊姆克和J.T.豪森的名字命名。據說它是「尋找納什均衡的組合算法中最著名的算法」。[2]
說明
該算法需要輸入兩個參與者的博弈矩陣G,這些參與者分別有m和n個純策略。G由兩個m × n的博弈矩陣A和B組成,它們分別是參與者1和2在所有決策下的收益。在這一算法中,我們假設所有的收益都是正的。
G有兩個相應的多胞形(稱為最佳回應多胞形) 和 ,分別為m維和n維,定義如下:
- 在集合 中,其坐標用{ ,..., }表示。並且 的範圍是被 (其中 )這 個不等式以及 (其中 )這 個不等式所規定的。
- 在集合 中,其坐標用{ ,..., }表示。並且 的範圍是被 (其中 )這 個不等式以及 (其中 )這 個不等式所規定的。
表示參與人1的 個純策略的非歸一化概率分佈集合,即參與人2的期望收益最多為1。前 個約束條件要求概率是非負的,其他 個約束條件要求參與人2的n個純策略的期望收益不超過1, 同理。
的每個頂點 都與集合 中的一組標籤相關聯。對於 ,如果在頂點 處存在 ,頂點 就會得到標籤 。對於 ,當 時,頂點 就會得到標籤 。假設 是非退化的,每個頂點都關聯到 的 個刻面,並且有 個標籤。在這裏需要注意的是,原點也是 的一個頂點,它所擁有的標籤集合是 。
同理, 的每個頂點 都與集合 中的一組標籤相關聯。對於 ,如果在頂點 處存在 ,頂點 就會得到標籤 。對於 ,當 時,頂點 就會得到標籤 。假設 是非退化的,每個頂點都關聯到 的 個刻面,並且有 個標籤。在這裏需要注意的是,原點也是 的一個頂點,它所擁有的標籤集合 。
對於頂點對 ,其中 且 ,如果滿足 與 的併集包含集合 中所有的標籤,那麼我們可以定義這樣一個頂點對是完全標記的。如果 與 分別為 與 的原點,那麼頂點對 是完全標記的。如果與 包含了集合 中除 之外的所有標籤,我們就定義頂點對 幾乎完全標記,在這種情況下 中存在一個標籤。
主元運算如下所示:取某頂點對 ,用 中某個與 相鄰的頂點替換 ,或者用 中某個與 相鄰的頂點替換 。這步操作的意義是在 被替換的情況下用另一個標籤替換 的某個標籤。被替換的標籤就會立刻被丟棄。對於 的任何標籤,都可以通過移動到與 相鄰且不包含與該標籤關聯的超平面的頂點來刪除該標籤。
算法從由兩個原點組成的完全標記對 開始。
特點
該算法最多能找到 個不同的納什均衡,最初放棄標籤的任何選擇決定了最終由算法找到的均衡。
參考文獻