上一篇说到纳什理论应用在双方都没有占优策略时,存在的一个博弈均衡选择。双方在这个均衡点上,任何一方都无法通过单独改变自己的策略而获得更大的收益。
纳什在1950年发表的28页的Non-Cooperative Games博士论文中,证明了多人有限收益游戏一定存在至少一个均衡点。
今天的学习从看一个猜拳的游戏开始
收益图如下:
收益图
分析:
从收益图上我们能看出,因为双方都不知道对方的选择,四个象限的可能性是平均分布的,找不到均衡点。那怎么办呢?
再假设游戏规定如果双方都不放,也是A赢。而A本身又是一个强敌,有能力知道B有10%的可能性放硬币,90%的可能不放硬币。所以A会采取的策略就是永远放硬币。结果就是A有90%可能性赢。那B又怎么办呢?
这时候就要需要引入“可能性” 这个系数来帮助寻找均衡点:设B放的可能性为X,不放的可能性为1-X。
混合策略
这种方法叫做 “混合策略”。与此对应的之前的策略叫做 “纯策略”。
使用混合策略就需要进行“期望值”的计算。计算结果用下图表示。
玩家B不放硬币的概率图
结论:
对于A来说,左下角表示B不放的概率为0,即永远都放,那么A也永远放,B的收益就是-1,输掉一个硬币。
相同的,右下角是指B不放的概率为100%,即永远都不放,那么A也永远不放,B的收益也是-1,输掉一个硬币。
只有当不放的概率居中,为50%的时候,B做到了“不偏不倚”即图中最高点,B达到了策略的平衡,使得双方都不能赢, 强敌A的任何策略对B都没有影响。
未完待续…… 明天介绍德州扑克
小彩蛋:
期望值在财务中也经常用到,常被用来进行投资决策。经典案例就是卖冰淇淋还是卖咖啡。
假设你有一家小店,经营冰淇淋和咖啡。需要预估明天的销售。天气预报说明天下雨的可能性是40%。根据以往的销售情况,下雨天咖啡可以赚2000元,冰淇淋可以赚600元。如果是晴天,冰淇淋可以赚1500元,咖啡赚500。问明天的预计收益会是多少呢?











网友评论