阅读足迹 永久书架

第476章 子博弈完美均衡 (第1/3页)

翟晓鹰提示您:看后求收藏(67小说网www.67txt.com),接着再看更方便。

子博弈完美均衡(subga perfect eilibriu, spe)

子博弈完美均衡(spe)是纳什均衡(nash eilibriu)的一种强化形式,专门用于动态博弈(dynaic gas),特别是那些包含多个决策阶段的博弈。spe要求在每一个可能的子博弈(subga)中,策略都必须是一个纳什均衡。

1 子博弈完美均衡的定义

一个策略组合构成子博弈完美均衡,当且仅当它在博弈的每一个可能的子博弈中都形成纳什均衡,即:

?玩家在每一步都必须选择最优策略,不论游戏是否已经按照这个路径进行。

?通过逆向归纳法(backward duction)来求解spe。

spe解决了纳什均衡可能包含不可信威胁的问题。例如,在某些博弈中,某些威胁在理性情况下根本不会被执行,而纳什均衡可能会包含这些威胁。而spe要求策略在所有子博弈中都合理,因此排除了这些不可信的威胁。

2 spe的求解方法:逆向归纳法

求解子博弈完美均衡的主要方法是逆向归纳法(backward duction),步骤如下:

1从最后一个决策节点(终局)开始,找出最优策略。

2回溯到前一个决策节点,在考虑后续最优策略的情况下,找到当前的最优选择。

3依次回溯,直到回到博弈的,最终得出整个博弈的最优策略组合,即spe。

3 经典案例分析

(1) 讨价还价博弈(rubste bargag ga)

场景:

?两个玩家a和b协商如何分配100元。

?a先出价,b可以接受或拒绝:

?接受:按a的分配方案执行。

?拒绝:进入下一轮,由b出价,但总金额减少(如因折现或时间成本,变为90元)。

?这个过程可以继续,直到某一方接受提议。

解法(逆向归纳法):

1在最后一轮,b必须接受任何非零金额,因为否则大家都拿不到钱。

2在倒数第二轮,a知道b在下一轮会接受,因此a会给b最少的钱,以确保自己利益最大化。

3依次回溯,最终得出spe,a在第一轮出一个合理的价钱让b接受,而b接受,因为等待对b来说更不划算。

(2) 进入威胁博弈(entry deterrence ga)

场景:

?新企业e考虑进入市场,已有企业i可以选择降价竞争(fierce)或维持高价(aodate)。

?如果e不进入,i赚15,e赚0。

?如果e进入:

?i选择降价,i 和 e 都亏损 -10。

?i选择高价,i赚10,e赚5。

解法(逆向归纳法):

1最后一步:如果e已经进入市场,i的最优策略是维持高价(因为降价会亏损)。

2回溯:e知道i不会真的降价打压,所以e会进入市场。

3结论:spe是e进入,i维持高价。

这显示了spe如何排除不可信威胁(即i宣称要降价,但实际上不会)。

(3) 信号博弈(job arket signalg)

场景:

?求职者(worker)可以选择是否上大学(成本c)。

?雇主(eployer)决定是否提供高薪(h)或低薪(l)。

?如果雇主认为求职者能力高,就提供高薪,否则提供低薪。

解法(逆向归纳法):

1雇主的决策(最后一步):

?如果看到求职者上大学,则认为其能力较高,给高薪。

?如果未上大学,则给低薪。

2求职者的决策(回溯):

?如果求职者能力高,上大学的成本c较低,愿意去。

?如果能力低,上大学的成本c较高,不愿意去。

3spe:

?高能力者选择上大学,雇主提供高薪。

?低能力者不选择上大学,雇主提供低薪。

这个模型解释了为什么学历可以作为一种信号,即使它本身不一定直接提高生产力。

《职场小聪明》 第476章 子博弈完美均衡(第1/3页),本章未完,点击下一页继续阅读。