阅读足迹 永久书架

第475章 逆向归纳法 (第1/3页)

翟晓鹰提示您:看后求收藏(67小说网www.67txt.com),接着再看更方便。

逆向归纳法(backward duction)

逆向归纳法是一种常用于动态博弈的求解方法,核心思想是从博弈的最后阶段开始推导,逐步回溯,找到最优策略。

这种方法通常用于有限步博弈(fite gas),尤其是在完全信息动态博弈中,即所有参与者都知道游戏规则和其他玩家的可能选择。

逆向归纳法的基本步骤

1 从最后一步开始分析:假设已经到达博弈的最后一个决策节点,找出在此节点上每个玩家的最优策略。

2 回溯至前一步:假设前一个决策者知道后续的最优选择,并据此做出最优决策。

3 重复以上过程,直至回溯到:最终得出的策略就是整个博弈的最优均衡解。

案例分析

1 终局博弈(ultiatu ga)

假设有两个玩家:

? a玩家分配100元,决定给b玩家多少钱(整数)。

? b玩家可以选择接受(aept)或拒绝(reject):

? 如果接受,双方按a的分配拿钱。

? 如果拒绝,双方都拿不到钱。

逆向归纳分析

1 b的决策(最后一步):

? 如果b接受,他能获得分配到的钱。

? 如果b拒绝,双方都拿不到钱。

? 理性b玩家应接受任何非零金额,因为比0更好。

2 a的决策(回溯):

? a知道b会接受任何非零金额,所以a的最优策略是给b最少的钱(如1元),自己拿99元。

结论:a分1元,b接受,这是均衡策略。

2 进入威胁博弈(entry deterrence ga)

假设一个新企业(e)考虑进入市场,而已有企业(i)可以选择降价竞争(fierce)或维持高价(aodate)。

博弈树

1 e决定是否进入市场:

? 进入(enter)

? 不进入(stay out)

2 如果e进入,i决定策略:

? 降价(fierce):i 和 e 都亏损 -10。

? 高价(aodate):i赚10,e赚5。

? e不进入(stay out):i独占市场,赚15,e赚0。

逆向归纳分析

1 i的决策(最后一步):

? 如果e已进入,i在降价(-10)和高价(10)之间选择,高价更优,所以i会选择高价。

2 e的决策(回溯):

? 知道i不会降价,e进入后可以赚5(比0好),所以e会进入市场。

结论:e进入,i维持高价,这是均衡策略。

3 百吉饼博弈(centipede ga)

假设有两个玩家轮流决定“拿走(take)”还是“继续(pass)”奖金池:

? 初始奖金池2元,每轮增加。

? 如果某人“拿走”,他获得大部分奖金,另一个人获得少部分。

? 游戏最多持续4轮。

逆向归纳分析

1 最后一轮:

? 若轮到玩家b,他会“拿走”,因为这是他的最后机会。

2 倒数第二轮:

? 玩家a知道b会在下一轮拿走,因此他会在这一轮就拿走。

3 第三轮:

? 玩家b知道a会在下一轮拿走,因此他会在这一轮就拿走。

4 回溯至第一轮:

? a知道b在下一轮会拿走,所以a在第一轮就拿走。

结论:尽管合作能让奖金池增大,但完全理性玩家会在第一轮就终止游戏。

总结

? 逆向归纳法适用于有限步动态博弈,从最后一步开始推导。

? 它能帮助玩家预见对手的最优策略,做出最优决策。

? 适用于终局博弈、市场进入、谈判、竞标等策略决策。

逆向归纳法的应用

逆向归纳法广泛应用于经济、商业、政治、军事、人工智能等领域,特别适用于动态决策问题,即决策者的选择会影响未来的结果。以下是几个典型的应用场景:

《职场小烈第三季》 第475章 逆向归纳法(第1/3页),本章未完,点击下一页继续阅读。