信号博弈

信号博弈(英语:signaling game),是一种由一个发送者(S)和另一个接收者(R)所组成的动态博弈。一开始这个发送者有一个给定的类型(t),接着发送者会观察这个没有其他人(好比说接收者)知道的类型,去从讯息堆 M = {m1, m2, m3,..., mj} 中选择送出一个讯息(m),接着接收者会观察这个讯息后从他可行的动作中 A = {a1, a2, a3,...., ak} 选一个作为反应动作(a),这里要注意的是接收者除了讯息之外其他都无法得知(如发送者的类型t),接着根据(t, m, a)的组合来决定双方会获得的报酬或回报。

精炼贝叶斯均衡

每种类型的发送者发送的消息都满足消息集合M中的概率分布,设 表示 类型的发送者发送M中任意消息的概率。接收者观察到消息m后作出的反应动作 也满足行动集合A中的概率分布。

精炼贝叶斯均衡需要满足下面四个条件:

  • 接收者知道对任意的消息m,哪些类型的发送者会发送m。也即他知道发送m的发送者属于 类型的概率 ,这个概率对所有类型 求和应该等于1。
  • 接收者选择的行动应该按照他对上一个条件的认知 最大化他的预期效用,即选择适当的行动,使得 最大化。记这个最大化预期效用的行动为 
  • 根据上述条件确定的接收者策略 ,对每种类型 ,发送者选择的消息 应该最大化发送者的预期效用 
  • 对发送者可能发送的每种消息 ,如果至少存在一种类型 使得 等于 的概率严格大于零(即至少存在一种类型的发送者可能会发送消息m),那么接收者收到消息 之后认为发送者属于t类型的后验概率 满足贝叶斯定理