美文网首页财务会计职场读书想法
火树科普博弈论-混合策略

火树科普博弈论-混合策略

作者: ChrisChen萌美丽 | 来源:发表于2019-05-09 17:38 被阅读10次

上一篇说到纳什理论应用在双方都没有占优策略时,存在的一个博弈均衡选择。双方在这个均衡点上,任何一方都无法通过单独改变自己的策略而获得更大的收益。

纳什在1950年发表的28页的Non-Cooperative Games博士论文中,证明了多人有限收益游戏一定存在至少一个均衡点。

今天的学习从看一个猜拳的游戏开始

收益图如下:

收益图

分析:

从收益图上我们能看出,因为双方都不知道对方的选择,四个象限的可能性是平均分布的,找不到均衡点。那怎么办呢?

再假设游戏规定如果双方都不放,也是A赢。而A本身又是一个强敌,有能力知道B有10%的可能性放硬币,90%的可能不放硬币。所以A会采取的策略就是永远放硬币。结果就是A有90%可能性赢。那B又怎么办呢?

这时候就要需要引入“可能性” 这个系数来帮助寻找均衡点:设B放的可能性为X,不放的可能性为1-X。

混合策略

这种方法叫做 “混合策略”。与此对应的之前的策略叫做 “纯策略”

使用混合策略就需要进行“期望值”的计算。计算结果用下图表示。

玩家B不放硬币的概率图

结论:

对于A来说,左下角表示B不放的概率为0,即永远都放,那么A也永远放,B的收益就是-1,输掉一个硬币。

相同的,右下角是指B不放的概率为100%,即永远都不放,那么A也永远不放,B的收益也是-1,输掉一个硬币。

只有当不放的概率居中,为50%的时候,B做到了“不偏不倚”即图中最高点,B达到了策略的平衡,使得双方都不能赢, 强敌A的任何策略对B都没有影响。

未完待续…… 明天介绍德州扑克


小彩蛋:

期望值在财务中也经常用到,常被用来进行投资决策。经典案例就是卖冰淇淋还是卖咖啡。

假设你有一家小店,经营冰淇淋和咖啡。需要预估明天的销售。天气预报说明天下雨的可能性是40%。根据以往的销售情况,下雨天咖啡可以赚2000元,冰淇淋可以赚600元。如果是晴天,冰淇淋可以赚1500元,咖啡赚500。问明天的预计收益会是多少呢?

相关文章

  • 火树科普博弈论-混合策略

    上一篇说到纳什理论应用在双方都没有占优策略时,存在的一个博弈均衡选择。双方在这个均衡点上,任何一方都无法通过单独改...

  • 火树科普博弈论

    昨天关注了密室大逃脱的大神之一清华博士火树的微博。 发现了他在B站上的一个科普视频 - 火树带你学博弈论。 下面是...

  • 九、警察与小偷博弈

    混合策略 随机读书策略有效避开知识短缺 图解博弈论 - 笔记 一、博弈论入门二、纳什均衡三、囚徒博弈四、走出“囚徒...

  • 《<美丽数学>纳什均衡和博弈论-11》@2019.09.06.

    每天继续走一小步: 博弈论展示了为什么达到一个均衡点需要混合策略——以及对混合策略的需要如何驱动复杂性的创造,即进...

  • 火树科普博弈论-扑克中的数学

    复习下上次学习的内容。 在混合策略的纳什均衡下,对手无法通过自己的行为增加收益,即无论对手选择策略A还是策略B都无...

  • 火树科普博弈论-最佳应对和占优策略

    今天继续学习博弈论 上次说到 博弈均衡 是指没有人能够改变自己的策略达到更大收益的时候,就是双方实现了博弈均衡的状...

  • 《<美丽数学>纳什均衡和博弈论-10》@2019.09.05.

    《后序》继续: 诺伊曼和Nash的博弈论数学中,最本质特征是需要以“混合策略”获取最大收益,很少情况下“单个纯粹”...

  • 火树科普博弈论-纳什均衡 Nash equilibrium(上)

    回顾一下昨天的主要内容介绍了博弈时的两种策略:占优策略和最佳应对。 占优策略是针对对方所有策略均有效的最优策略;最...

  • 竞价广告中的博弈论

    这段时间在看张维迎的《博弈论与社会》——一本博弈论的科普书,一边在介绍博弈论原理,一边借助博弈论来解释政治、经济和...

  • 27.博弈论(混合策略)

    混合策略:偶尔发点疯 懦夫游戏不仅在国家之间上演,在生活中更是无处不在。但凡狭路相逢勇者胜的时候,就有懦夫游戏的影...

网友评论

    本文标题:火树科普博弈论-混合策略

    本文链接:https://www.haomeiwen.com/subject/dzlgoqtx.html