信號博弈
信號博弈(英語:signaling game),是一種由一個發送者(S)和另一個接收者(R)所組成的動態博弈。一開始這個發送者有一個給定的類型(t),接着發送者會觀察這個沒有其他人(好比說接收者)知道的類型,去從訊息堆 M = {m1, m2, m3,..., mj} 中選擇送出一個訊息(m),接着接收者會觀察這個訊息後從他可行的動作中 A = {a1, a2, a3,...., ak} 選一個作為反應動作(a),這裏要注意的是接收者除了訊息之外其他都無法得知(如發送者的類型t),接着根據(t, m, a)的組合來決定雙方會獲得的報酬或回報。
精煉貝葉斯均衡
每種類型的發送者發送的消息都滿足消息集合M中的概率分佈,設 表示 類型的發送者發送M中任意消息的概率。接收者觀察到消息m後作出的反應動作 也滿足行動集合A中的概率分佈。
精煉貝葉斯均衡需要滿足下面四個條件:
- 接收者知道對任意的消息m,哪些類型的發送者會發送m。也即他知道發送m的發送者屬於 類型的概率 ,這個概率對所有類型 求和應該等於1。
- 接收者選擇的行動應該按照他對上一個條件的認知 最大化他的預期效用,即選擇適當的行動,使得 最大化。記這個最大化預期效用的行動為 。
- 根據上述條件確定的接收者策略 ,對每種類型 ,發送者選擇的消息 應該最大化發送者的預期效用 。
- 對發送者可能發送的每種消息 ,如果至少存在一種類型 使得 等於 的概率嚴格大於零(即至少存在一種類型的發送者可能會發送消息m),那麼接收者收到消息 之後認為發送者屬於t類型的後驗概率 滿足貝氏定理: 。