关于博弈论中的一硬币正反问题的分析

▼魔方 西西 提交于 2020-02-03 15:16:19

  前两天在看一个纳什均衡的词语时在网上搜索发现一个问题如下

你正在图书馆坐着,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?这基本是废话,当然该。问题是,这个游戏公平吗?

  我们分析的主要不是为了答不答应玩的问题,这个当然是要玩了,难得有美女主动搭讪。

  在分析这个问题之前先说一下纳什,一个数学天才,获得诺贝儿经济学奖,纳什均衡这一词语普遍存在于博弈论,经济学等著作中。他的一生都是一个传奇,今年的关注是由于网上的提示,今年5月23日纳什夫妇死于车祸,但他的理论和他为社会做出的巨大贡献永远流传于世。

  先现看一下网上的(我认为模棱两可)分析,上面的收益如下

(美女\男子) 正 反
正 (-3,+3) (+2,-2)
反 (+2,-2) (-1,+1)

  先来一下不靠普的想法,也就是用我们平时学的概率来分析,出现正正,正反,反正,反反都为1/4的概率,所以男子收益E(男)=3*1/4+1*1/4+(-2)*1/2=0,这样子来看很公平的游戏啊。两方不输不赢。
  再来分析一下,这里就是为什么说这个问题与纳什均衡有关了,美女会这样子想,如果男子出正反是随机的,那么她肯定会出反面,因为这样平均下来她每次都会赢1/2的收益啊。看看上面的图,出正面会输1/2的收益。所以这个不是简单的概率,是又方都要采用策略的游戏。
  网上的答案最多的是这样的,美女的策略如下,设出正面的概率为y,那么反面则为1-y,为了使收益最大化,则使男子出正面与出反面的美女的收益相等,得出现在式子:(就是这句奇葩的话,评什么说这样就最大化,后面我想清楚了以后,这样子有好处,但不是最大化,后面慢慢道来)

y*-3+(1-y)*2=y*2+(1-y)*-1;

y=3/8;

 

所以结果即是美女自己按着出正,反比例为3/8则不会输,每次收益为:-3*3/8+5/8*2=1/8
到这里网上的解法就算完成了。

  下面的我花了一段时间来分析得出来结果,当然不在于结果。在于过程,3/8这个方案确实是相当不错的方案,但是还有更深入的,中间的方案的调整,我记得网上的文章最后提到会不会被美女的方案针对呢?其实这个题中存在一些针对性的方案,而且利益最大化的针对方案。

  当我看到这个答案我一头雾水,凭什么说相等就一定是最优的,利益就一定最大化?为什么男子一直出正面与一直出反面时美女的收益相等就最好,如果男子是随机出的呢?有趣的正是这里,双方都不会随机出,这个是一个双方都要在不断调整方案的游戏。现在我们不考虑美女3/8的策略,我们设屌丝男的策略为出正的概率为x,反为1-x,美女出正为y,反为1-y,那么我们可以站在美女的角度得到美女的收益期望

E(女)=xy*-3 + (1-x)y(2) + x(1-y)(2) + (1-x)(1-y)(-1)
=-8xy+3y+3x-1

到这里时我想到的是线性规划,要求E(女)最大化,在x[0,1] y [0,1] 范围内,以前做线性规划就是把图形画出来,以前都基本都是直线。所以先画出-8xy+3y+3x-1=0的图形,找到大于0的区域,只要在这个区域内美女都是有收益的。最近了解了一点R语言,所以用R试着画了一下,图1

<图1>

 

通过图形,加上选几个点试的方法可以确定,在中间区域美女都是可以有正收益的,但是在这些区域中也是有条件的,有的在屌丝男出正多的时候,有的是在屌丝男出反多的时候,关键是存在一部分区域是不管屌丝男出正的概率为多少美女都有收益的部分,如图2

<图2>
图中两条竖线范围就是不管屌丝男用什么策略,不管是全出正,全出反,一半正,一半反,或者是1/3正,3/8正等美女都会有收益。所以美女的策略就是自己在这个范围内,这个范围很好求,通过y=0与y=1求出1/3与2/5,所以美女的策略就是让自己出正面的概率在1/3与2/5之间,这样美女永远都不会输,那同刚才3/8有什么区别?有区别,现在我们只是看到了在这个范围内,不管屌丝男出正的概率在[0,1]之间都美女收益都是大于0的。现在我们就应该来找最值了,有没有一个最大的值,我们分别取y为1/3,2/5可以得出美女收益期望分别如图3,图4


<图3>


<图4>

两个图所表现的是在屌丝男[0,1] 范围内 美女的收益,可以看出来都大于0,只是有大有小,所以这里美女的策略就是当屌丝男出正面概率向1靠近时,美女出正面的概率向1/3靠近,当屌丝男出正面概率向0靠近时,美女出正的概率向2/5靠近。这样收益是最大的。当然这种方式确实太复杂,美女要不停的计算,所以这里3/8就出来了,下面说一下3/8的来源

  其实上面只要美女在1/3与2/5之间都不会存在大的问题,关键是收益虽然说的大于等于0,但是还是有可能等于0.比如美女用1/3策略,那么屌丝男用0,则美女收益为0,如果美女用2/5策略,屌丝男用1,美女也不会有收益。有没有一种方式屌丝男没有办法针对呢?有,就是让我们图3,图4的线条水平,这样不管屌丝男怎么改变策略,美女的收益期望是恒定且大于0的,即上面算出来的3/8.如果屌丝男随机出其实可以选择1/3策略,这样收益才是最大的,可以达到1/6。
  到这里也基本上是我所有的分析与计算了,自己了更了解这个题里面的针对,策略,分平等一些语言了。不仅仅是知道答案是3/8,为什么要这样,可不可以不这样。当然也只能说那个是一种比较好的策略。是我我有可能选择1/3,是在大多数情况下收益最大的。
总结:
  1.纳什均衡,其实这个是比较难理解的,本文只是这个相关的一个应用。
  2.纳什相关的一个电影《美丽心灵》,抽时间看一下,得过很多奖的。昨天都搜出来了,没时间看,今天可以把这个看了。
  3.数学,经济学等其实很有意思,有些时候他们是用一句话来表达,但是那个可能比一段程序更为美妙。比如:垄断的产品的产量都是不足的;比如:卡特尔是不稳定的。短短的一句话可能比几十行代码还要美妙。

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!