候选人有四个博弈论,则纳什均衡博弈论 pdf

博弈论石头剪子布的纳什均衡解是什么_博弈论吧_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0可签7级以上的吧50个
本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:37,106贴子:
博弈论石头剪子布的纳什均衡解是什么
啊啊啊 谢谢恩
玩了10多年, 我才发现原...
一楼给度娘,再给我点时...
楼下会出现骂自己的傻逼
已经三天三夜了!为什么...
   1.维多利加是最...
新人第一次开坑写文,求...
【靠谱Leggo出品】小伙...
网盘下载:http://pan....
还有谁跟我一样在火车上...
帮顶个帖,攒人品,说不定我就会升职加薪、当上总经理、出任、迎娶白富美、走上人生巅峰,嘿嘿,想想还有点小激动。
我是露珠炒鸡萌的小伙伴,我来帮露珠顶一个帖,露珠早点得到解答哟
庆双“蛋”、赢战功、得好礼!
我叫!万万没想到楼主的帖子尽然被我给看见了,我勒个去,真不知道楼主这智商是怎么知道发帖的, 幸好我心思缜密,火钳留言,用不了多久我就会升级加精,当上小吧,出任吧主,迎娶小,走上的巅峰,嘿嘿,想想还有点小激动呢
有相关策略的纳什均衡
楼主既然红旗镇楼,就顶一下,虽然我也不知道。
对于这种刚发的帖子,我总是毫不犹豫的顶了。如果火了就是个前排,可以混个脸熟,说不定谁好心就给粉了…稳赚不赔;如果沉了就感觉是我弄沉的,很有成就感,还能捞经验。
帮顶个帖,攒人品,说不定我就会升职加薪、当上总经理、出任、迎娶白富美、走上人生巅峰,嘿嘿,想想还有点小激动。
这个是没有纳什均衡解的吧
这个属于混合博弈论
我不会告诉你这才是绝对标准的十五字
内&&容:使用签名档&&
保存至快速回贴博弈论用来解释和解决现实问题和现象的效果如何?都有哪些实例?
或者仅仅是理论上的学科?
按投票排序
既然题主问的是博弈论解决现实问题的效果如何,那么显然想要的答案不是囚徒困境、鹰鸽游戏这种理论化的东西,也不是美国大学课堂里两三美元赌注的的博弈实验。所以,答主在这里给大家介绍一个绝对现实的案例——美国联邦通讯委员会(FCC)频谱牌照拍卖。为什么选择这样一个案例来说明博弈论在现实中的应用呢?首先,拍卖中所涉金额巨大。在2008年的一次拍卖中(Auction 73),FCC一共获得了将近190亿美元的收入,101位成功竞价者中的每一位平均要支付1.87亿美元。每一次鼠标的点击都可能意味着上百万美元的代价(还伴随着肾上腺素飙升),其间的心理过程绝不是两三美元的博弈游戏所能模拟的。有人把参加频谱拍卖比喻成“同时在十张桌子上玩上亿美元赌注的德州扑克”。在如此巨大的利益面前,竞价者们自然会挖空心思、想方设法来寻找拍卖规则中一切可以被利用的漏洞。其次,拍卖的出价过程极其漫长。还以2008年的这次拍卖为例,从日开始到日结束,历时54天。这样漫长的一个拍卖过程让每一位竞价者都有充足的时间思考并调整自己的出价策略,尽量避免出价过程中的非理性因素。在拍卖过程中,FCC无疑希望将同样数量的牌照卖出尽可能高的价钱,而竞拍者们希望用尽可能低的价格买到自己想要的牌照。如果你是FCC,现在手里有几百张牌照等着要卖出去,你会选择什么样的拍卖规则呢?很多人会想:这还不简单吗?就像索斯比拍卖行出售名画那样,先把第一张牌照拿出来让竞价者们轮番叫价,出价最高者获得牌照。然后用同样的方法进行下一张牌照的拍卖,直到所有的牌照都卖出去。这种拍卖方式听上去很合理。但是,在通讯行业采取这种方式,却有可能会造成总拍卖收入的降低。假设FCC手里现在有两张牌照要出售,分别是牌照A和牌照B。有两家虚构的通讯公司参与拍卖,分别是美国移动和美国电信。美国移动是通讯业界的大佬,手中已经持有多张牌照。在此次拍卖中他们只需要一张牌照就够了,至于是A还是B都无所谓。美国移动对这两张牌照的估值都是4.5亿美元。也就是说,如果价格超出4.5亿美元,美国移动会放弃继续报价。另一位竞价者美国电信刚刚进入通讯市场,手中的牌照资源极为匮乏。为了能和业界老大美国移动抗衡,他们需要将牌照A和B全部买下,只拿到一张牌照是没有意义的。因此,他们对牌照A+B的组合估值10亿美元,对只拿到一张牌照的情形估值为零。如果把这两家公司对于牌照的估值做成表格的形式,将会是这样的:对于FCC来说,最好的结果当然是把两个牌照打包以后以10亿美元的价格卖给美国电信。但是,实际操作起来是否能达到这样的结果,与拍卖规则的设计有很大关系。对于FCC来说,最好的结果当然是把两个牌照打包以后以10亿美元的价格卖给美国电信。但是,实际操作起来是否能达到这样的结果,与拍卖规则的设计有很大关系。如果FCC先单独进行牌照A的拍卖,美国电信极有可能会在价格达到4.5亿之前就放弃竞价。因为对于美国电信来说,稍后才会进行的牌照B拍卖会有多少人参加,价格会被拍到多少完全是未知数。这种不确定性导致了美国电信在对牌照A的出价上相对保守。因为美国电信如果花了4.5亿美元买下了牌照A,而牌照B被某个土豪公司炒到了6亿美元的话,他要么被迫花10.5亿美元买下估值只有10亿美元的牌照组合,要么放弃购买牌照B,白白花4.5亿美元买一张对他来说没什么用的牌照A。美国电信不是白痴,不会傻乎乎地花10.5亿美元购买估值只有10亿美元的两块牌照,也不会白白扔掉真金白银的4.5亿美元。现实中发生的情况将是美国电信为了控制风险,在牌照A的价格达到4亿美元甚至更低时就停止报价。所以,最终的结果可能是美国移动以4亿美元甚至更低的价格买到了牌照A,而牌照B根本无人问津。对于想要榨干竞拍者每一分钱的FCC来说,这样的结果简直就是一场噩梦(当然,他们会辩解说他们这样做是为了更有效的分配频谱资源)。所以,为了鼓励竞价者们更加激进地报价,FCC采取了下面的基本拍卖规则(这里列出的只是最基本的思路,完整的拍卖规则长达上百页):1)所有的牌照同时放出,供所有的竞价者同时进行报价。2)每一轮报价结束后,所有牌照接收到的报价都被公开,供竞价者们决定在下一轮中如何报价。3)如果某一轮报价结束后,任何一块牌照都没有收到新的报价,那么拍卖结束。每一块牌照都由出价最高的竞拍者获得。采取了上面这种规则之后,美国电信可以实时观察每一块牌照的竞价者数量以及最新的价格,从而可以进行更加激进的报价(FCC也会收到更多的钱)。不过,这样又产生了一个新的问题:对于想要获得两块牌照的美国电信来说,应不应该允许他进行组合报价(package bidding)?组合报价的含义就是允许美国电信对A+B这个牌照组合给出一个总价,并不分别给出每一个牌照的单价。请注意这里其他的竞价者还是可以针对每一个牌照给出单独的报价。在拍卖结束时,FCC会把每块牌照的单独最高报价相加,如果得出的总价低于美国电信的组合报价,这些牌照就作为一个整体卖给美国电信。在拍卖过程中,FCC是否允许组合报价,会对拍卖结果造成巨大的差别。情形一:不允许组合报价。假设美国移动由于业务扩张,把牌照A和牌照B的估值都调整为了6亿美元:从表格中的数字来看,美国电信还是可以赢得拍卖的。虽然美国移动调高了自己的估值,但是针对A+B的组合,美国电信的估值10亿美元仍然要高于美国移动的6亿美元。拍卖规则的设计不是应该让估值最高的竞价者获胜吗?从表格中的数字来看,美国电信还是可以赢得拍卖的。虽然美国移动调高了自己的估值,但是针对A+B的组合,美国电信的估值10亿美元仍然要高于美国移动的6亿美元。拍卖规则的设计不是应该让估值最高的竞价者获胜吗?在不允许组合报价的情形下,为了赢得这两张牌照,电信只好对牌照A和B进行单独报价。假设在进行了N轮报价后,牌照A和B的最新报价都是4.9亿美元。这时电信注意到其他的报价者都已推出,只剩下移动还在继续报价。电信算了算,还在自己预算范围内,在下一轮对这两个牌照都报出了5亿美元的价格。在这里电信对移动的实力做出了错误的判断,因为移动在下一轮报价中把牌照A的价格又抬高到了5.1亿美元。当牌照A的价格抬高到5.1亿美元时,电信就傻眼了。因为已经开出的牌照B的5亿美元已经无法撤回了,剩余的资金又不够继续竞价牌照A。最终的结果可能是美国电信以5亿美元拍到了牌照B,而移动以5.1亿美元拍到了牌照A。这里最大的赢家是净收10.1亿美元的FCC,而美国电信则损失了5亿美元。美国电信所面临的这种风险,有个专门的名词叫做exposure problem。如果FCC允许组合报价的话,这种风险将不复存在。现在,让我们一起来看一下允许组合报价的情形。情形二:允许组合报价。在允许组合报价的情况下,美国电信只要对两张牌照给出一个组合价,而不单独指定针对每一张牌照的报价。如果在拍卖中获胜,可以在预算范围内将两张牌照收入囊中。如果在拍卖中被更高的价格击败,也不需要为此付出一分钱。这样,就有效的规避了上面的这个exposure problem。但是,FCC非常不支持这种组合报价的方式。他们搬出了一套又一套理由来反对组合报价,例如这样会增加拍卖的复杂程度、这样对小企业不公平等等。事实上,他们反对组合报价的真正原因可能是下面这种情形:假设现在又有一家企业,暴发户美国联通也参加到了拍卖当中。美国联通在通讯市场也耕耘多年,手中的牌照资源也很丰富,因此他们只需要拍照A和拍照B中的一张就够了。他们对拍照A和牌照B的估值都是7亿美元。这样,我们就有了三家企业,他们对牌照A和B的估值是这样的:假设美国移动对牌照A给出了4亿美元的报价,而美国联通对牌照B给出了5亿美元的报价。假设美国移动对牌照A给出了4亿美元的报价,而美国联通对牌照B给出了5亿美元的报价。针对这种情况,电信针对A+B的组合给出了9.1亿美元的报价。由于这个组合报价略高于移动和联通的对于这两块牌照的报价之和,所以如果他们不继续报价的话电信将赢得拍卖。从数学角度上讲,这两家企业完全有能力报出一个超过美国电信组合报价的数字。根据他们的估值,他们最高可以报出一个13亿美元的总价,远远超过美国电信的估值10亿美元。但这只是数学角度而已。别忘了,每一个博弈者都是自私的。移动可能在等着联通提高报价,而联通又觉得难道我钱多就活该当冤大头吗?最后这两家谁也不肯提高自己的报价,美国电信笑吟吟地以9.1亿美元的价格将两块牌照收入囊中。在这种情形下,FCC又要哭了,因为原本最多可以卖到13亿美元的两块牌照结果只卖了9.1亿美元。(这种情形也有个专门的名字叫做threshold problem)FCC在1994年启用频谱牌照拍卖机制时,不允许投标者进行组合报价。为了减少投标者面临的exposure problem所带来的风险(实质上是为了鼓励他们更激进的报价),FCC允许投标者撤回报价,条件是要支付所撤回的报价与最终中标价之间的差额。例如一家公司对牌照A报出了5亿美元的最高价,比他低的次高价格是4亿美元。如果这家公司又后悔了不想要这张牌照了,那么他可以选择撤回这个报价,如果最终中标价是4亿美元的话,他只需支付1亿美元的差价。这样,这家公司的损失就由5亿美元降低为1亿美元,而FCC照样可以收到5亿美元。在之后的九年里,FCC对于组合报价的态度一直是“这个我们研究一下,再研究一下”过了九年之后,在2003年的一次拍卖中(auction 51),FCC才第一次在实际的拍卖中启用了组合报价制度。这次拍卖的参与者多达……两名,拍得总价款是……17万9千美元。嗯,不提也罢。到了2008年,FCC在auction 73中终于又启用了组合报价。不过,投标者不能随意进行组合,而只能对FCC事先规定好的组合进行报价。在这次拍卖中,FCC将所有的频谱资源分成了五个block,其中的C block一共由12张牌照组成。针对C block中的12张牌照,投标者可以进行单独报价,也可以按照FCC规定好的组合进行组合报价(牌照1至8一个组合,牌照10和12一个组合,牌照9和11一个组合)。最后的结果是Verizon以相对较低的价格47亿美元买走了C block中大部分的牌照。FCC的频谱拍卖从1994年到现在,已经进行了大约100次,一些小的规则也是改来改去的。关于2008年auction 73以后的情况,答主没找到总结性的资料,也不可能到FCC的官网上一个个的去看,所以暂时就先介绍到这里。如果有对这个话题更加了解的人,欢迎补充。不过,上面的内容应该足以回答题主的问题:不,博弈论不仅仅是一门理论上的学科。在现实世界中,一小群人通过博弈论可以决定上百亿美元的归属。以上。
***1月24日补充*** 博士在其答案中对博弈论原理的解释既简明,又到位,我的答案中缺乏这一套系统化的体系,建议大家学习。********************我们日常生活中的很多情形其实都在不知不觉中运用着博弈论。博弈论的关键是什么——信息。当信息不完全或者不对称的时候,博弈论可能就能派上用场。谈判就是一个很好的例子。我看过一本书《You Can Negotiate Anything》。我虚构一个场景,这个场景里的片段有的照搬该书,有的启发于该书,但都增加了我自己的理解和杜撰,供参考。我们假设一个购车的谈判,这其中会用到一些博弈论的东西。在一个虚构的购车的场景中,博弈的双方是你和车商(你也可以将此化用到购买其他耐久性大宗商品上)。你们的信息是不对称的,你不知道车商的底线,车商也不知道你真正最多能接受的价钱。你们的目的也是不同的,车商希望最终成交价格越高越好,而你则希望越低越好。你需要做的是,采取一些策略,使得车商觉得,他们在博弈中的占优策略(dominant strategy)是不断地放低价格,或者尽最大可能地把车卖给你(也意味着放低价格)。请注意:我在这里举这个例子的目的不是在于教你如何去砍价买车,而纯粹是想用这个例子来发掘一些隐藏在内的博弈论的元素。有不妥之处,欢迎各位批评指教。场景:你左看看右看看,东看看西看看,表现出很高的购车兴趣,于是让车商愿意细致入微地向你介绍展厅里每一辆车子的情况,然后再带着你去马路上试驾。于是,你用了大半天的时间把展厅里的所有感兴趣的车都了解了一遍,然后确定了一个目标,郑重其事地对销售说,你考虑买这辆车。于是你们坐下来谈价钱。你要注意的是,无论当天的谈判结果怎么样,你都对销售说:不好意思,我今天决定不了,我得回去征求一下(老婆/老公/爸妈/我有经验的邻居/七大姑八大姨的同事)的意见,让他们把把关。然后第二天(或者几天以后),比如,你叫来了你的老婆。找到同一个销售,取决于你的友善程度,你可以让销售向你的老婆重复一遍他之前对你做的所有介绍,然后再次坐下来谈价钱。谈好以后,你老婆说,我今天还是决定不了,因为我还想去(网上/其他店)看看,比较比较。注意,事到如今,你已经运用了三个策略:第一,让你的谈判对手增加了很多的谈判成本(他已经在你身上耗费了整整两天的青春);第二,你采用了信号传递的策略(signalling),让博弈对手觉得你是个有价值花时间谈判的人,因为你有很强的购买意愿;第三,你采用了拖延战术,为自己的决策赢得了考虑的时间。再过了几天,车商一定会打电话来催促你做决定,一旦他联系你,你就可以说,我已经看了好几个地方的价钱,我现在就想谁家便宜我就买哪家,暗示他们需要继续降价你才会考虑。但是,你永远不会透露在其他地方看到的价钱究竟是多少。你这样做,其实是在采取一个策略,那就是制造新的信息不对称,并且让对手处于信息不完全的一方。然后我们来换位思考,作为车商而言,他面临的信息集是:A. 你有可能真的去看了其他车商,你也可能没有。B. 他们现在给你的价钱可能已经比其他人低,也可能没有。车商对于B的信息把握会更大,因为我们合理地假设车商之间应该能够知道底线大概在哪里,但他们无法知道你到底跑了多少车商,你手里究竟有多少信息。于是,车商需要做的选择是:A. 继续降价 B. 拒绝降价。车商在考虑策略的时候,作为那位销售代表,他一定会想,为了达成你的这笔交易,他已经花去了整整2天的时间,如果你买下来,他就能拿到佣金,而如果你不买,他可能什么也得不到。因此,他很有可能就会想,不管你到底是不是去其他地方看了车,只要他开低价,你购买的可能性就会大一些,他能赚一点也就赚一点,所以在很大可能性下,虽然信息不对称,但他依旧会选择继续降价作为他的占优策略(dominant strategy)。但是,也有一种可能,就是他死活都不肯降价了。如果是这样的话,他有可能也是在和你玩信号传递的策略(signalling),让你觉得他现在的报价已经没有回旋余地了。他甚至会说,我再降价我就“亏本”,不卖给你了——如果他说了这样的话,你可以把它当作不可置信的威胁,或者trash talk而直接无视。因为这同样也是博弈当中对他而言的一种策略。如果你想破,你能做的就是增加你的信息量,真正地去跑跑其他车商,看看其他车商能够给你怎么样的signalling。如果把故事继续编下去的话还没完,因为我还没说对于“狡诈”的车商,他会采取什么策略。对于车商来说,他需要做的就是运用一些策略,使得你觉得你的占优策略是——尽快把车买下来(心甘情愿地多出一些价钱)。一个典型的手段就是:告诉你(signalling)另一个消费者也想要你看中的这辆车,他们的存货只有一台,所以,“你得抓紧”。而“另一位消费者”到底存不存在,就是留给你的不完全信息了。
谁添加的情感/两性关系的标签??为什么还在博弈论之前??这样也太赤果果了吧。。先简短的回答问题,博弈论用来解释和解决现实问题和现象的效果如何?都有哪些实例?博弈论里面不同的模型解释现实问题和现象的效果不一,大多数都因为众多条件限制(主要是现实太复杂)解释解决现实问题的效果不会太理想。不过也有解释的好的,比如:Ignacio Palacios-Heurta(2003)用Mixed Strategy解释1417次FIFA比赛罚球中Kicker和Goalie选择往左往右的问题就解释的相当精准(“Professional Play Minimax”),后来这篇文章发在了Review of Economic Studies上。(楼主活了那么多年,这是我见过的最无聊的教授(们),对着电脑数1417次,而且以楼主参加建模国赛数汽车的经历,肯定会数错重数。)为方便对Game theory还不怎么了解的知友,先介绍两个概念:什么是Mixed Strategy?拿 老师(老师好。。)举的Game theory里面最经典的囚徒困境的栗子来说,囚徒们单纯的选我是坦白从宽还是抗拒从严这叫Pure Strategy, 囚徒们说我今天喝多了可能80%的机率坦白从宽,20%的机率抗拒从严这就叫Mixed Strategy。什么是Mixed Strategy Nash Equilibrium?就是如果A囚徒发现,如果给定B囚徒选坦白从宽抗拒从严的概率,A囚徒选择坦白从宽还是抗拒从严其实是没有差异的,反之亦然,这时候A、B囚徒的Strategy就叫MSNE。铺垫完毕。无聊教授们做了什么?他们先统计了这1417次罚球中如果Kicker(射门的)选择射左边,Goalie(守门的)也选择扑向左边,那么Kicker有0.58的概率赢,假设拿到0.58的效用,Goalie有0.42的概率赢,假设拿到0.42的效用。(即下图中第一个是kicker的效用)然后无聊教授们就根据这个数据和Mixed Strategy Nash Equilibrium的模型算出了,在这1417次罚球中,到底Kicker/Goalie往左的概率是多少,往右的概率是多少。怎么算的?核心就是MSNE的insight:往左和往右的概率必须让他们选左选右的效用无差异。即:给定一个选手的Mixed Strategy, 另一个选手的Mixed Strategy必须使他选择不同Strategy的效用无差异。计算过程如下:那这个我们算出来的结果和真实结果比相差多少呢?还好我们有无聊教授(和他们的RA们)我们不用自己数1417次罚球:(上面一行是算出的结果,下面一行是真实统计值)有兴趣的同学还可以搜下这篇讲网球的:M.Walker and J.Wooders ,American Economic Review(2001)"Minimax Play and Wimbeldon" volume91,pp 。-------------简短和唠嗑的分割线---------------1。Game theory的模型对于我们生活其实还是有用的,可能我们并不能在公司谈判,追妹纸等博弈的时候画个树形图神马的决定要采取什么策略,但是很多模型提供的insight,往往能带给人不少启发。2。模型总是有很多假设很多抽象,现实太复杂,对于单个的situation没有太大意义,但是如果数据多了(比如1417次罚球),就能分辨出那些是对预测无用的noise哪些是essence,这时候用game theory模型才有意义。这学期学习game theory的时候一直在思考,如何把学到的各种theory应用到生活之中。后来发现这个根本就不现实好嘛。现实生活中太多杂音太多干扰项了。不过我还是发现我学过的game theory模型包含的insight其实是能带给我们远超模型本身的启发的。1.Prisoner's dilemmaA Beautiful Mind里面Nash在酒吧大喊亚当斯密是错的,每个人都追求私利有时候并不能带来效用最大化,指的就是这个模型, 老师的答案 分别用perfect imformation和imperfect imformation两种模式阐述了这个模型,写的非常好,大家可以先去看看冯老师的答案。但是这个模型的insight其实就是合作可能带来的效用更大,但是在没有条件沟通或者没有信息的情况下,大家的选择往往会损害彼此的利益。2.Repeated Prisoner's Dilemma还是从大家熟悉的模型说起,不过这次是,RPD模型其实就是玩很多遍囚徒困境模型,每个人的Pay off用n次玩法的discount来表示。在Repeated PD里面,纳什均衡根据你选择的策略(Trigger 啊 tit for tat啊神马的)有所变化,但是insight仍然很简单。在有预期会多次博弈的情况下,大家的选择会更倾向于合作达到彼此利益最大化。比如说你现在是采购方,想选个供货商,你暗示他你以后有经常买的需求,或者是你逛淘宝的时候,暗示卖家货好的话会介绍同学同事来买,卖家欺骗你的可能性就会降低。3.
Nash EquilibriumNash Equilibrium不是个模型,但是Nash Equilibrium给我带来的启发也蛮大的。什么是NE?就是给定博弈双方的行为,每一个博弈方如果改变它的策略,并不能增加自己的效用。这种情况就是纳什均衡。NE并不一定是效用最大的情况,比如囚徒困境里面两名囚徒如果都抗拒从严他们的效用其实比都坦白要大,但是NE是现实中最可能达到的均衡结果。所以博弈论里面相当的一部分内容就是寻找各种NE。上面举的罚球的栗子就是一种叫做Mixed Strategy NE的东西。 那NE带给我什么启发呢?如果你和别人合作,你们合作的现状是NE的话,即你的合作方改变自己的策略并不能带来效用的提高,这种合作才是可持续且稳定的。以上的模型都是比较简单的模型,可能insight也straightforward一点。有兴趣的同学可以自己学习一下下面这个稍复杂点的模型。4.Signal Game 老师提到的signal其实就是这个模型拿我们作业题举例子吧,这个模型其实是关于选择要不要读MBA的。有兴趣的同学可以看一下。其中:1-找工作的2-雇主H-1的能力是HighL-1的能力是LowD-1选择读MBAU-1选择不读MBAM-2选择让1当ManagerB-2选择让1当 Blue-collar worker我们假设1能力是High的概率是1/4,即得:第一个NE很好解释,如果雇主在你读不读MBA得情况下都让你当工人,那无论是你能力高低,你都最好不要读MBA。第二个NE很有意思了,如果雇主让没MBA得当工人,有MBA得当Manager,那雇员就会在自己能力高得时候去读MBA,付出代价向雇主发出一个signal,我愿意付出代价读MBA,雇员也会在自己能力低的时候选择不读MBA,节省信号成本。完整题目可见(Q2): 答案:至于signal 模型的insight,我也没想到一个很好的办法表述,大家自己想想吧。-------------------------------------博弈论的模型还有很多,centipede, voting, bertrand/cournot's duopoly等等。。以前我学习经济学,金融学模型的时候,包括game theory模型的时候,总会想,那么多假设条件,现实又那么复杂,这些模型怎么用?后来我才发现,现实不是单单复杂的,现实是复杂而又简单的。2012年寒假我们做p2p借贷研究的时候,我专门去买了,也读了其它的相关论文,发现单个借款人的还款能力可能判断起来比较困难,但是如果有10000个借款人,我们来判断里面有百分之多少default,default之后的recovery rate,就会相对靠谱一点,因为我们可以计算经济形势对群体的影响,可以分析群体收入的分布,职业的分布,计算不同的因素对default的影响。一句话概括就是,样本多了之后,我们可以看出哪些是噪音noisy,哪些是真正对我们想要的结果有影响的因素essence。这时候模型才有意义。
我写过一篇课程论文《博弈论视角下试论钓鱼执法“错钓困境”的解决之道》并不是说这是实例,只是一个思路。节选一点:在“钓鱼执法”中,存在着三个群体:交通部门、举报群体、司机群体,其中司机群体分黑车司机和私家车司机两类。既然钓鱼执法过程中存在三类群体,那么大可以让“举报群体”和“司机群体”进行博弈,交通部门成为两者博弈的游戏规则制定者。基于“举报群体”和“司机群体”的利益对抗关系,笔者认为“斗鸡博弈”(chicken game)更适合作为两者博弈的游戏规则。斗鸡博弈设想两个人在独木桥上火拼,每个人都有两种战略:继续前进,或退下阵来。若两人都继续前进,则两败俱伤;若一方前进另一方退下来,则前进者胜利,退后者颜面尽失;若两人都后退,两人都失了颜面(如表2)。让我们可以通过表2的模式来判断举报者和车主在09年时的博弈关系:“举报者”可谓A,“车主”可谓B,如果“举报者”举报“车主”并否认误抓,则会有奖励;如果“车主”反抗并证明了清白,“举报者”无损失,由交通部门承担损失。如果双方出现了争执,在“暴力执法”的情况下,“司机”没有反抗的余地屈打成招,“举报者”可以获得奖励。根据这样的情况可以得出09年两者博弈的矩阵图(见表3):由表3可以看出,即便司机和举报者的利益出现冲突,但是由于交通部门执法人员在利益方面的介入,使得举报者无须承担“误抓”责任,而司机反抗无效,结果便是,举报者主要随便诱捕一名车主在绝大多数情况有奖励,而且不同背负任何责任,因此也无须管他是不是黑车司机,这样一来“错钓”率一定会攀升。因此如果要把这个僵局打破,有三个条件:一是交通部门充当法官角色,不介入博弈过程;二是给予车主反抗的权利,用以制衡举报者的行为;三是举报者必须为“误抓”承担责任,以避免举报者为所欲为。事实上,辨认黑车十分简单,只是取证困难成为了黑车司机们的保护伞,因此举报者是有能力知道自己是否误抓,然而承认与否则是有最终的利益得失说了算。这要求交通部门在指定赏罚规则时需要计算好博弈者的利益得失,帮助他们规范自己的行为。按照美国社会学家戈夫曼的拟剧理论,每一个社会群体都存在自己的角色利益,那么交通部门的角色意志是查处黑车,减少错钓率,举报者的角色意志是拿到赏金,黑车司机的角色意志是非法营运赚钱,尽可能不被抓到,私家车主的角色意志是证明自己的清白。假设人们都有证实自己信誉的需要,并且可以量化为2个单位点。根据这四种角色,本文建议交通部门制定好举报者的奖罚机制,给予司机证明自己的权利,并设计以下的博弈矩阵(见表4、表5):博弈矩阵的规则为:非法运营罚款为2个单位的金额(即-2),举报者无争议举报一名司机获得2个单位的金额,承认误抓罚款为1个单位的金额(即-1),一个人无法证实自己的信誉则失去2个单位点(即-2)。如果举报者否认误抓,同时被举报司机表示反抗,真相无法明晰的话司机扣除3点金额(即-3),举报者扣除2点金额(即-2),那么双方的利益都会得到不同程度的损失,这个局面将使得举报者和被举报者不得不经历一场心理博弈。表4显示,举报者所举报的是黑车司机:黑车司机因非法营运罚款所以利益变成-2个单位,举报者会得到2个单位的奖励;如果黑车司机贿赂举报者,那么举报者承认误抓可以获得1个单位的贿赂金额,黑车司机为-1;如果双方出现争执,交通部门则双方都罚款,黑车司机-3,举报者因得到司机投诉罚款所以利益变成-2;如果黑车司机反抗而举报车示弱说自己误抓,则黑车司机无损失,举报者不仅因误抓罚款失去1个单位的金额,还由于没有证明自己的信誉失去2个单位点。这样一来,如果黑车司机选择反抗的话,往往会遭致举报者的“火拼”(因为不愿意丢失自己的信誉),使得自己遭受更大的损失,因此会倾向于不反抗并且贿赂举报者使得自己的损失最小(即-1个单位点),但是由于举报者否认误抓得到的奖励会多于贿赂金额,因此会放弃贿赂。这样我们所期待的情况出现的几率会提高很多。表5显示,举报者故意误抓私家车主:私家车主因罚款所以金额为-2,如果不反抗的话,还会因为没有证明自己的信誉失去2个单位点,举报者会得到2个单位的奖励;那么私家车主往往会“火拼”,表示反抗,使得举报者无故丢失2个单位金额。为了减少损失,在预测私家车主会火拼的情况下,举报者倾向于选择承认误抓,接受只有1个单位金额的损失。最终举报者会发现,如果不诱捕私家车主就不会有私家车主“火拼”的风险,就不会出现利益损失,于是也就不愿意诱捕私家车主。这样我们所期待的情况出现的几率也会提高很多。表4表5似乎确实通过利益杠杆的调节将举报者、黑车司机和私家车主的行为引导到应有的方向,使得最符合真实的情况得以出现。然而笔者必须承认这个模型仍是一个理想模型,只考虑了人证实自己信誉的需要(孙中界事件给予我的启发),而且量化的值高达2个单位点,而实际上并不是每个人都想孙中界那样有高达2个单位点的信誉需要。但是,这个博弈矩阵模型的规则能够为解决“错钓”困境提供这么一个思路:通过量化人们行为趋向,调整赏罚金额,让人们根据自己的理性计算自发地往事实真相走。这也只是我的突发奇想,也希望大家拍砖。。华南师范大学
老师讲得很好,那我就说一些博弈论实例吧。因为是实例,所以就假设读者有一些基本的博弈论概念了,而且我主要目的是想介绍一下博弈论与其他科目的关系,以及有哪些好玩的博弈,因此证明过程未免有些简短和不够谨慎,见谅。———————————————————————————————————————————1.政治(中位选民定理)参与人:有两个候选人,为了选举,必须从下面10个立场中确定自己的政治立场(从极左到极右)。规则:1.每个立场有10%的选票;2.选民会选离自己最近的候选人;3.出现平局时,选票平分1
10收益:候选者希望最大化自己能得的票数。怎么办?重复剔除劣势策略比如,是不是无论对方选什么,你选2总比你选1好呢?证明:(下面括号里面,前面的数字表示你的立场,后面数字表示对手的立场。而等号后面的数字则是你能获得的票数)(1,1)=50%&(2,1)=90% (1,2)=10%&(2,2)=50% (1,3)=15%&(2,3)=20% ......(1,10)=50%&(2,10)=55% 如此,你能确定无论对方选什么,你选2总比你选1好,于是你能把1剔除了,再比较2和3,3和4,4和5,以此类推。结论:最终只会剩下5,6→这可以解释为何每逢美国大选,参选的美国总统候选人的政见会如此相似。———————————————————————————————————————————2.公共资源(牧场理论)参与人:你和其他放羊的人规则:1.你可以选择放羊或不放羊2.牧场的承载能力因为额外的羊而有所损耗收益:1.你放得羊越多,你收益越多2.牧场的损耗是算在所有人身上的。(即就算牧场一些地方坏了,你不能放羊,别人也不能放羊。)会有什么结果呢?每一位牧羊人势必会衡量如此的效用,进而增加自己的羊。但是当所有的牧羊人皆做出如此的结论,并且无限制的放牧时,牧场负载力的耗损将是必然的后果。这是公共资源悲剧的来源,用经济学的解释就是外部性。———————————————————————————————————————————3.社会(种族隔离)参与人:高个和矮个,每个有10W人规则:1.假设有2个镇,E镇和W镇,每个能容纳10W人。2.你们要同时选择在哪里住,不能沟通。3.如果选1个镇的不止10W,则全部随机分配。比如12W人选E,那么12W人全部随机分配,10W人随机到E,2W人随机到W。收益:证明:首先,你要选一个“无论别人选什么,你都不会后悔的”决定,它就是你的最优策略,假设你是矮人选E,E有2.5W矮人,那么你的幸福感是0.5个单位,而W有7.5W矮人,你的幸福感是0.75,那么你的选择就不是最优的,你应该选W。结论:而每一个人的最优策略组合在一起,就变成了纳什均衡,那个就是博弈的解。这样此题的纳什均衡是高个会和高个住,矮个会和与矮个住。从图中,我们知道人们倾向于混居居住(每个镇的高个矮个数量对半),但却很难实现,因为人数稍少一些,人们就会倾向于隔离。你看,有时并不是人们天生喜欢种族隔离,而是数以万计的人们个人选择导致的。
补充了个例子,见最后。/***************************************/ 同学举的例子很有意思。 不过我觉得这个例子与其说是在描述博弈论的应用,不如说是在描述博弈论可以用来解释什么。很多砍价高手的砍价策略都可以用博弈论来解释,但他们不需要学习博弈论就能成为砍价高手。因而他的答案只回答了问题的前半部分,即博弈论用来解释现实的效果如何。所以我来补充点内容吧。我本身不是做这个方向的,有什么疏漏或错误的地方就请大家指正了。一般情况下当我们说博弈论时,指的都是非合作博弈,它研究的其实不是在给定条件下参与人应该做什么决策,而是更进一步地,讨论当每个参与人都在给定的博弈框架下选择各自最优策略所可能带来的结果。一个定义完整的博弈包含参与人、规则、结果和支付四个部分。参与人就是博弈的参与者,规则定义了参与人在博弈每个阶段的信息集和可选行动集,结果定义了参与人行动每个集合分别会造成的结果,支付则定义了每个参与人在每个结果上分别获得的效用。用囚徒困境举例的话,这个博弈的参与人是两个囚徒,A和B。规则:这个博弈每个参与人都只有两个可选行动,背叛和不背叛,决策时都不知道对方行动。结果:两个参与人都有两个行动可以选择,因而结果也就分别有4种。都不背叛一种、都背叛一种、一个背叛一个不背叛两种。支付:当两个人都背叛时,两者都会入狱,但也都会获得警方奖励,两者获得效用都为0;当一个背叛另一个不背叛时,背叛者被释放,同时还有奖励,不背叛者入狱,因而效用分别为2和-1;当两者都不背叛时,都被释放,但都没奖励,效用都为1。这个博弈可以用下面的表格表示:纵横两轴是两个参与人,行/列是参与人的行动集,每组行动所对应的单位格都是博弈的一个结果,单位格内的数组是相应结果下各个参与人所获得的支付。或者也可以用下面的图表示:空心和实心的点代表不同参与人,实线表示参与人可选行动,被椭圆虚线保卫表示空心参与人在决策时无法区分这两个点,也就是不知道对方行动。底部的每个分叉都是博弈的一个结果,每个结果都对应一组支付。这个博弈的结果很简单:不管对方选择如何,对任意参与人而言选择背叛所获得的支付都比不背叛更高,因而两个参与人的占优策略都是选择背叛。相应地,背叛/背叛也就是这个博弈的纳什均衡。OK,这里又给出了博弈论里十分重要的两个概念:策略和纳什均衡。策略:策略是一个完整的行动方案,它规定了参与人在每种情况下选择的行动。继续上面的例子的话,背叛是一个行动,而在任何情况下都选择背叛则是一个策略。纳什均衡:每个参与人都选择一个策略,就构成一个策略组合。纳什均衡是一个策略组合,当出现这个组合时,任何参与人都无法通过调整自身策略来获取更高支付。看到这里大概已经有些人开始头晕了……不过大家也都应该清楚了,博弈论最关注的东西其实是均衡。在均衡下所有参与人都不会改变策略,因而我们就可以通过博弈论来解释甚至预言给定条件下各个参与人的行为及其结果。也可以通过设计规则来把博弈导向特定均衡来获取相应的结果。然后再举点博弈论具体应用的例子。在经济学方面,拍卖、产业组织、机制设计等等都能找到它应用的例子。比如著名的维克里拍卖(二级密封价格拍卖)就是一个例子。在经济学范围以外,政治和社会学上的应用不必说,生物学方面也有演化博弈论。甚至在计算机方面也有应用,据说姚期智提出的Yao's principle就是一个例子,但我完全不懂这个……/***************************************************************/补充例子初始博弈如图所示两个参与人A、B各有两个行动C、D可供选择。两个参与人A、B各有两个行动C、D可供选择。这个博弈有两个纳什均衡,C/C和D/D。但对参与人而言,两个均衡下获得的支付显著不同,显然,A喜欢C/C均衡,而B喜欢D/D均衡。这个时候,对参与人而言,如何将博弈导向自己喜欢的均衡就很好玩了。以A为例,他可以声称要采取这样的策略:无论如何都选择C。给定A这样的策略选择,对B来说选择C就是最优策略。此时博弈就会被导向A喜欢的C/C均衡。但问题在于,A这样的声称是个“不可置信威胁”:一旦B选择了D,对A来说坚持选择C就不是最优的。因而B不会相信这样的威胁。而要让这个威胁可置信,A就需要让C真正地成为自己的占优策略。一个可行的做法,就是通过可信的安排,降低自己的选择行为D时所获得的支付。比如跟某外部人签订合同,一旦选择D就要给他100。此时,博弈就变成了下面这个样子:此时A的威胁变得可置信。博弈就只剩下C/C一个纳什均衡了。此时A的威胁变得可置信。博弈就只剩下C/C一个纳什均衡了。表面上看,A这样的安排不但无法带来任何收益,还降低了自己在某些情况下所获得的支付。但在博弈论当中,这却可以把博弈导向对自己有利的均衡。
大家的答案都很好,很清晰的解释了什么是博弈论,这里我想简单说下博弈论在经济中的应用,一个特别的方面,就是博弈论在contract theory里面的应用。合同理论讲的就是雇员和雇主如何最优的制定薪资合同,假设A君开了个公司,要招人替他干活,于是就要跑到招聘市场上去。招聘市场上有两个人,能力值爆满的B君和一无是处的C君,很显然,A君希望招到的是B君而不是C君,因为B君会给A君的公司带来回报而C君不会,但是呢,能力这种东西是观察不到的,只有B君知道他自己很牛,也只有C君知道他自己很烂。假设信息是对称的,意味着A君有超能力可以直接看出别人的能力,那很明显,如果要招B君,那就开相应的高工资,要招C君就相应的开低工资。大家都根据自己的能力拿到了相应的工资,人人都有工作,世界多美好。然而正常情况下,信息是不对称的,那对于A君来讲他就非常头痛了,他首先直接试探性的开出了市场上的平均工资,对于B君来说,我这么牛,你给我这么点钱,我不干;而对于C君来讲,哇塞,我这样的人也能拿平均工资,绝对干啊。于是对于A君而言,这个并非最优策略,因为他开的工资不能separate market,好的人招不到,坏的人进来了,这种冤大头的事A君不干。然后A君想了想,要不这样,你们都说自己有能力,拿点东西证明给我看,比如学历,我要名校MBA的毕业生。那对于B君而言,因为我牛啊,读个MBA分分秒秒的事啊,而且对我本身付出的代价不会太大,因为像我这么牛,学校绝对给我奖学金。而对于C君而言,天啊,我乘法口诀表都背不全,读MBA还不如杀了我,况且我这么烂,绝对是后腿,学校不可能给我奖学金的,所以对于C君而言,拿到MBA的代价远远大于B君的代价。加之,A君开出的工资仅仅盖掉了优秀人才读MBA需要的代价,所以对于B君而言,加入A君公司的utility远远大于C君的utility,在这种情况下,通过一个学历就区分了B君和C君。而对于B君和C君而言,拿出学历是一种表现出自己能力的方式,这样的情况我们称之为signaling game。C君越想越气愤,A君你不是歧视低学历的人嘛!我去告你!然后别人找A君喝茶,说你这个看学历的方式不公平,换一个,A君想了半天,好,换就换。要不我布置一个任务,这个任务呢能力高的人完成分分秒秒,能力低的拼死拼活,你们看着办。B君想,这没问题啊,我牛啊,秒完成啊。C君想,妈妈呀,这得一周不吃不喝不睡才行啊。然后A君开出的工资是对于B君而言可以接受,但是对于C君不能接受的,因为C君的付出和成本远远大于B君啊,于是对于这个职位,B君愿意去做,而C君不愿意去做,在这种情况下,通过一个任务可以区分B君和C君。对于A君而言,布置任务是检验能力的一种方式,这样的情况我们称之为screening game。在contract理论中,基于一定的假设,放入一定的条件,如果我们可以计算出separating equilibrium,那何乐而不为呢。
如果说您不知道博弈论的实际用途,只能说明您不懂爱情。如果您有一个古林精怪的女友,您就会知道博弈论并不是什么特别高深的理论,本质也很简单。但在讨论它之前,我们需要先简单了解一下人们在日常生活中是如何做出决策的。人类首先意识到,如果仅仅凭借自己的感性认识来做出选择的话,往往会使得自己蒙受损失,无论是情感上,还是权益上,还是经济上(我们在此为方便起见,统一使用“效益”一词)。这一类的例子多不胜数,无需举例。于是,人类开始探索适合的工具,以完成用理性的思考来帮助做出正确选择,于是数学介入了。第一个阶段:最初的时候,选择很少很简单,人们在两个事物之间做选择的时候,只要一一比较二者的所有属性优劣即可。情景一:比如您有一个女友,您打算在日送她一台电脑。您不确定是购买MacBook Pro还是Air,那么您简化地列出“显卡、CPU、尺寸、内存、便携性、外观”这5项指标,假设Pro在“显卡、CPU、尺寸、内存”方面均胜出,而Air仅仅在“便携性、外观”方面胜出,于是对比各大属性指标后,得到结论:购买MacBook Pro。第二个阶段:但是这种选择是不准确的,因为不是所有的属性都是同样重要的,所以人类引入了“权重”的概念。情景二:您的保密工作没做好,女友知道您在给她挑选礼物,看了一眼Pro跟Air,然后说:Air好可爱,带着也方便。于是瞬间“显卡、CPU、尺寸、内存”都不重要了,而“便携性跟外观”直接上升爆棚。所以引入“权重”以后,您的选择于是变成了MacBook Air。第三个阶段:但不是所有的事物都可以准确判断出好坏,于是人类引入了“方差”的概念,即先设定一个理想情况,再根据实际选择与理想情况的偏差,选择偏差最小的那个。情景三:您虽然确定要购买MacBook Air,但是发现它还存在多种配置与价位,于是你列出自己的预期价格8000,再列出主要需要满足的用途是看电影、存电影,于是,通过方差的对比,你决定选择了11英寸的256G。第四个阶段:但是,生活并不总是确定的,还有很多因为信息确实导致的不确定性事件,这时候我们引入了概率与事件树。情景四:您买好了礼物,打算在2月14号当天坐车过去,晚上跟她一起看一场话剧。一查当天的话剧票,发现晚上有2场,7点场的才500元;而9点场的需要1000元。如果买在7点的话,您依据经验有40%的可能赶上周五的堵车从而错过,那样的话您就需要重新再买一张1000元的,于是您开始考虑如何选择。为了避免自己主观上对绝对事件的偏好(即选择确定不会误机的1000元机票),您打算用数学的方法来解决,于是您列出了如下的决策过程:虽然有点违反您的主观对风险规避的偏好,但您决定相信数学,虽然有点违反您的主观对风险规避的偏好,但您决定相信数学,于是购买了500元的票。第五个阶段:生活不总是像选择票务这样,选项是静止的,尤其是面对您的女友。更多时候,您需要考虑到对方的选择对您的影响,于是有了“两害相权取其轻”的博弈论。第五个情景:您顺利地见到了您的女友,并赶上了7点的话剧,在等待入场的空间里,你的女友提出了史上最恐怖的游戏:真心话大冒险。依据您以往的经验:1、您当然希望听到关于女友的真心话,但是担心她会问您一些尴尬的问题:类似我跟你妈一起掉到水里先救谁的问题。所以如果您选择大冒险,而她选择真心话,那么您会High到10分的满足感,但她会觉得您对她不真诚,所以兴致降为0,反之亦然。2、如果您选择了真心话,而她也选择了真心话,可能双方都顾虑对方会问一些尴尬问题,所以满足感会对应抵消一些,都为5分。3、如果两个人都选择大冒险,于是会推出对方都有事情瞒着对方,所以满意度也很低,但总比一个人说了真心话另一个没说要好,所以标记为1如果真是如此,那么恭喜您成为了爱情的囚徒,面临了历史上著名的囚徒困境。您最后做出选择,不管女友是选择真心话还是大冒险,您都是选择大冒险的收益会高一点,对您女友也是,所以最后根据博弈论的结果就是你们都选择了大冒险。(当然,如果您知道了女友是选择“真心话还是大冒险”的概率,那么会有进一步的概率模型,因为没有什么技术含量,在此免去不谈。)第六个阶段:如果世界停留在第五个阶段的简单模式下就好了,可惜的是,对方的选择可以通过控制事情发生概率,所以就需要我们在博弈论中加入最佳行动概率的因素。第六个情景:你们结束了大冒险,您的女友又想着说,我们来玩手心手背吧,她提议:“让我们各自亮出手掌的一面,或正或反。如果我们都是正面,那么我给你按摩三次,如果我们都是反面,我给你1次,剩下的情况你给我2次就可以了。”假设您出手心的概率是X,那么您出手背的概率就是1-X。【为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,不然对手总是可以改变正反面出现的概率让我们的总收入减少,由此列出方程就是3x+(-2)*(1-x)=(-2)*x+1*(1-x)这个方程通俗的说就是在对手一直出正面你得到的利益,和你对手一直出反面得到利益是一样的且最大。解方程得x=3/8,也就是说平均每八次出示3次正面,5次反面是我们的最优策略。而将x=3/8代入到收益表达式3*x+(-2)*(1-x)中就可得到每次的期望收入,计算结果是-1/8元。同样,设美女出正面的概率是y,反面的概率是1-y,列方程-3y+2(1-y)=2y+(-1)*(1-y),解得y也等于3/8,而美女每次的期望收益则是2(1-y)-3y=1/8元。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是(3+3+3-2-2-2-2-2)/8=-1/8元如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。】为了节省分析的过程,在此引用百度百科“美女的硬币”一节的内容。所以您理智而优雅地说:“我们这么心有灵犀,出现相同的概率太大啦,有利的情况当然应该让给你了。这样,如果我们都是正面,那么我给你按摩三次,如果我们都是反面,我给你1次,剩下的情况你给我2次就可以了。”第七个阶段:我不知道有多少爱情死在了第六个阶段,这第七个阶段,也算是数学爱情史上的“七年之痒”了。不幸的是,现实中的博弈会比这个更加痛苦,因为很多事情不是像"手心手背"这样一锤定音,而是一个漫长的一场接着一场“动态博弈”的过程。这让你想起了当初如何战胜她的众多追求者的往事:那时候为了模拟这场追求爱情的动态博弈,还在元胞自动机构建了爱情模型进行模拟,最终寻找到了最优的演化方案,一时间豁然开朗,七窍全开。于是......(此处略去十万字)。所以,如果说您不知道博弈论的实际用途,只能说明您不懂爱情。希望有所帮助。Lonely Planet. ()日
首先,“博弈”这个词现在被很多人滥用,导致很多不符合博弈论基础的事件被没学过博弈论的人描述为XX与XX的博弈。博弈的参与人的目标一定是效用最大化或利润最大化,否则我们无法确定其效用函数、最佳对策或纳什均衡,比如对于一个非功利型的政府或者城市一级开发商来说,它只扮演着税收收缴、建设基础设施、公用资源分配等角色,并不追求税收最大化或财政收入最大化,任何与它的“博弈”都不能用博弈论模型来解释,当然现实情况下中国的地方政府还是可以看做功利型政府的。
回归正题,博弈论对于解释和解决现实情况的效果还是很好的,但策略预测的功能我个人认为比解释效果要弱很多。为了避免空谈,我就用土地拍卖的例子来说,因为这也是我的专业。2004年后,我国政府进行土地出让都要进行“招拍挂”,即招标、挂牌和拍卖,使得土地使用权的出让更加透明,以削弱政府的寻租腐败行为。就后两者而言,国企、民企都会站在同一个平台上举牌,谁出价最高谁得到土地,博弈论中称其为标准的English Auction。但招标有所不同,大致的过程是:1密封递交标书;2统一时间公正开标;3由政府的评标委员会审阅各公司的标书,参考标价最终确定竞得人。
从这里面我们能发现,中标人的得失并不仅取决于标价,还取决于他对土地带有很大主观性的估计,每个参与人的估价通常来自自己的私人信息(房地产公司有专门测算地价的部门)。这些问题在博弈论中需要求解一个叫“贝叶斯纳什均衡”的东西。具体过程省略,其结论是:
1 投标人较少,且不能准确评估土地价值(不识货)的时候,买方出价可能非常低,如果投标人之间互相串通,卖方就更吃亏(土地被贱卖);
2 投标人参与投标而不中标没有任何代价,投标人就不会积极争取中标,会转而采取低价多次投标的方法,希望通过投机获得更大利益。如果投标人都这么做,那价格还是会偏低,对卖方不利。
那出现这种情况怎么办?这就需要政府设计一种制度来进行预防,这在博弈论理被称为机制设计(Incentive Design)。如果你亲眼看过标书,你就会发现政府是这样设计的:1 投标人参与投标需要提前交纳一定的保证金(几千万到几亿,视出让地块而定),如果投标人没有中标,保证金会在几日之后退回;2 每宗地都有出让底价,标价如果低于底价直接被评为废标,底价在开标之日在所有投标人面前拆封揭示;3 竞得人不一定是标价最高人,标价的影响因素只占总得分40%左右,政府还要评审投标人的财务报告、拟建项目说明书、业绩说明等等。在这些条件下,上述的问题就可以被很好的避免,几亿元的保证金和底价使得那些小企业不敢投机,主观估计带来的价格波动会在评标过程中被适当削弱。
说完这个专业性比较强的博弈论应用,下面说个更贴近大家生活的例子,就是职业生涯规划。和电视上大部分所谓“职业规划师”或者“成功学大师”的工作不同,博弈论把一个人的职业生涯看做“不完全信息的动态道德风险”模型。简单来说,当你刚毕业进入一家企业时,企业虽然不知道你的全部能力,但企业会根据你的努力水平来决定你的薪水。同时另一个问题是,你有多努力是否能真正被企业完全观察到,比如国企员工的工资是固定的,无论你努力不努力都无法改变薪资水平,结果是什么呢,就是所有人都不努力,导致效率低下。在这种情况下,你去看什么成功学的书是没有任何作用的。
我们依然省略掉一些博弈模型的均衡求解,其结论是,你的策略是随着时间变化的:在刚毕业进入企业时,你需要非常非常努力,并使得你的业绩超出企业对你的预期,类似于Surprise!的感觉,这会使得企业对你能力的评价超过你真实能力的概率大大增加,并依此提高你的工资;但随着你工作时间越来越长,企业对你能力的判断越来越准,你就不再需要那么拼命,即使拼命工作也是事倍功半。我们常在电视上看到,那些临近退休的国企高管因为某些问题被纪委调查,那是因为他们深知要退休,没有任何激励再去为公司奉献,所以走之前要大捞一笔,有人也称之为60岁危机,或59岁危机。
另一方面,如果你知道自己能力很强,那你需要进入一家绩效评比非常客观透明的业务部门,避免去一些日常事务部门,而如果你知道自己只是混了个文凭,没什么真才实学,那策略就刚好相反,因为在企业招聘时,这两类人的文凭是一样的,企业无法观察到真实水平。随着时间推进,企业也明白区分这两类人的重要性,所以我们会发现近几年各类面试奇招层层筛选越来越多。
说了这么多,我个人认为博弈论对于现实情况的解释还是很有效果的,虽然一些结论我们会认为说的是废话,但当你意识到这其中包含的各种信息不对称、动态影响、预期作用等等因素后结论依然如此简洁时,你才能体会到博弈论真正有用的地方。
我建议你去看看《自私的基因》,特别是最后几章,尤为精彩。你就会明白博弈论是在所有生物进化,演化中扮演着关键角色。两个物种之间,同物种的每个个体之间,两性之间,无时无刻不在进行着复杂而微妙的博弈。整个自然界,包括人类社会的每一个角落,都可以看到博弈论的影子。
答案源自一个最近很火的提问的回答:这个节目玩的就是博弈论,说到博弈论大家第一反应就是囚徒困境()先简单介绍一下囚徒困境:两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱三年;若互相,则因证据确实,二者都判刑两年。画出收益矩阵如下:负数看不惯,变换一下就成为:负数看不惯,变换一下就成为:如果B保持沉默:A沉默收益为2,揭发对方收益为3,显然揭发收益更高;如果B保持沉默:A沉默收益为2,揭发对方收益为3,显然揭发收益更高;如果B揭发A:A沉默收益为0,揭发对方收益为1,显然揭发收益更高。综上,不管B选择何种策略,A揭发B收益总是更高;同理,B揭发A收益总是更高,因此囚徒困境只有一个纳什均衡点,就是相互供出对方,也就是上图右下方的那个点。看
的评论里有朋友说这个节目是个囚徒困境,是的,非常相似,但是有一点点区别,正是这一点点区别让这个节目更加精彩。同样先画出收益矩阵:假设假设一半奖金的收益为1,根据节目规则:两个人都steal,双方收益为0;两个人都split,双方收益为1;一人steal一人split,steal方收益为2(全部奖金),split方收益为0。这个博弈与囚徒困境的区别在于:囚徒困境中有严格劣势策略,而博弈论的入门结论就是:绝对不要选严格劣势策略。剔除严格劣势策略后,两人都只能选择供出对方,从而只有一个纳什均衡点。而节目中的博弈没有严格劣势策略,只有弱劣势策略。下面简单分析:如果Nick选择steal:Ibrahim不管steal还是split收益都是0,所以两种策略都是最佳对策;如果Nick选择split:Ibrahim选择steal收益为2,选择split收益为1,所以steal为最佳对策;综上,Ibrahim选择steal的收益总是大于等于split,但split收益也可能等于steal,因此选择split只是弱劣势策略,而不是严格劣势策略,这个收益矩阵中有三个纳什平衡点。根据迭代剔除steal vs. steal是最可能出现的结果,但其他两个也是纳什平衡点,而split vs. split是最不稳定,因此出现的概率也最低。Nick聪明的地方在于,他将该博弈转换成了另一个博弈。新博弈如下:Nick声称自己会选择steal,并且赢了后会分享,那么在Ibrahim看来,收益矩阵就变成了上图:Nick事后不分享,Ibrahim不管怎么选收益都为0;Nick事后分享,Ibrahim选择steal收益为0,选择split双方收益为1。因此,在新博弈中,Ibrahim的弱优势策略就是选择split,收益一定大于等于steal。从节目中看,他虽然很愤怒,但是个理性人,所以不得不选择split。从Nick看,他并不知道Ibrahim是不是理性人,对方甚至会因为愤怒而选择steal,双方鱼死网破。如果他相信他的威胁生效了,那么他的最优策略就是选择撒谎,独享奖金。但实际上他并没有把握,所以他所面对的博弈更加复杂。最终,Nick选择了split,这是一个非常好的选择。说的不是节目博弈的结果,而是跳出奖金博弈上升到人生博弈的结果。他赢得了智慧和尊重,和微不足道的一半奖金。博弈论里有非常重要的一条:汝欲得之,必先知之。最后,思考题时间:如果收益矩阵如下,请问Nick的威胁有效吗,有多大效果?
给你一个人人网上面的例子:“两位台湾同事一大早就飞回台湾投票去了,两个人一蓝一绿,两张票完全抵消,不对选举产生任何net effect。。我对他们说,算了吧你们还是呆在香港看结果最经济省事。他们说这是博弈论的prisoner's dilemma,我们飞回去的结果是nash equilibrium。。直接崩溃”
首先举几个双人博弈里比较经典的例子说明吧。1.情侣博弈。背景是一对情侣对节目有不同偏好,俩人正在考虑看芭蕾舞还是足球赛。对于每一个参与人来说,都有(足球赛,芭蕾舞)两个选择。通过收益矩阵+划线法可以得出男生和女生选择同样的节目收益最大。对于每一个参与人来说,都有(足球赛,芭蕾舞)两个选择。通过收益矩阵+划线法可以得出男生和女生选择同样的节目收益最大。在生活中的启示很简单,两个人相处(不管是哪种情感关系)难免发生分歧和不一致,学会妥协和让步。相处的目的是通过某些方式变亲密,得到情感支持。那么手段和方式并不是非什么不可。争吵有的时候是因为方式出了问题,不要舍本逐末。2.斗鸡博弈。设定:两只鸡的策略集合为(斗,不斗)。收益矩阵如下:从斗争结果看不是对手战胜自己,就是自己战胜对手。我们可以对美苏争霸时期双方的表现做一个类比。美国和苏联抢占地盘的行为并非同时发生,一方采取攻势时,另一方多处于防御状态。家庭生活中,夫妻发生矛盾时,双方如果采取一致行动:冷战或热吵的后果总是比有一方让步时严重。双方有矛盾时,有一方冷静避让才会使双方的收益最大化。退一步海阔天空来着,这也是博弈论在生活里的小应用吧。接下来是关于囚徒困境的例子。1.伊拉克和伊朗在面临石油产出时有高产量和低产量两个策略。双方的纳什均衡为(高产量,高产量)收益总和为800.如果双方都选择(低产量,低产量),收益总和为1000.市场价格是由供给和需求共同决定的,当市场需求一定时,供给减少会使均衡价格上升,这也是美国会给不种地的农民补贴,从而限制供给的原因。然而双发在面临决策时,因为担心自己选择呢低产量,对方选择高产量时收益减少,因此选择高产量,导致集体收益减少,个人理性不符合集体理性。农村里常常出现这样的情况:今年卖苹果赚了钱,于是明年大家都去种苹果。一堆苹果降价都卖不出去。这个时候要是有人不跟风种了橙子,那么橙子就赚钱了。于是以后大家又会选择种橙子,循环往复。最理性的选择肯定是不要同时种一种水果,但是大家不知道准确的市场需求,有担心种别的不赚钱,所以就盲目跟风,群体利益受损严重。2.香烟广告博弈。骆驼和万宝路这两个香烟公司现在面临是否要打广告的决策。我们假设收益情况如下表所示:如果双方都不做广告,本来可以获得总共80的收益,但做广告后只剩下60.由于不能保证信任对方的策略,因此双方选择做广告。再次验证个体理性不满足集体理性。 中国家电市场上的两大巨头国美和苏宁近几年斗争不断,试图通过各种各样的促销活动吸引消费者。对于商家来说,较高的价格意味着较高的利润,但国美和苏宁近年来都在拼命强调低价,不断调低商品价格。除去技术进步造成商品价格降低等复杂因素,其实也是因为信息不对称,缺乏信任机制造成的。3.三鹿奶粉的囚徒困境乳品企业向来是得奶源者得天下。在新西兰、澳大利亚等乳业发达的国家,基本上都是工厂化养殖奶牛,而在中国,最典型的是公司加农户,也就是说中国的奶源大都是农户散养奶牛,不免带来疾病控制以及原奶质量控制的诸多隐患。现实的结果是乳品企业针对散户养殖提供的奶源展开了激烈的争夺,不知道奶源有问题是不可能的。存在隐患的奶源依然成为乳企激烈争夺的原因就在于一场囚徒式的激烈博弈。如果你坚持原则不收问题牛奶,那么那些有问题的原奶依然不愁销路,竞争对手还会因此而进一步压低价格,而你却面临奶源缺失无法生产的局面。加上政府在食品质量监管上的漏洞,最终的结果是你收我也收,大家一起生产问题牛奶的困境。最后说说智猪博弈。背景如下:猪圈里有一头大猪,一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会得到10单位的猪食进槽。但是谁先按就会首先付出2单位的成本。若大猪先到槽边,大小猪吃到食物的收益比为9:1,同时到槽边,收益比为7:3,小猪先到槽边,收益为6:4。收益矩阵:(大猪按钮,小猪等待)是纳什均衡。经济含义:强势方积极行事,弱势方搭便车。在股市中,大户是“大猪”,散户是“小猪”。大户要自己搜集信息,进行投资分析,而散户只是选择“跟大户”。在股份公司中,大股东是“大猪”,小股东是“小猪”。尽管股东承担着监督经理的职能,但大股东和小股东从监督中得到的收益并不一样。监督经理需要付出搜集信息和花费时间的成本。在监督成本相同的情况下,大股东从监督中得到的好处显然多于小股东。因此,均衡状态下大股东担当起搜集信息、监督经理的责任,而小股东则搭大股东的便车。正是基于这种理由,大股东有选举投票权,通过投票权行使对经理的监督。在广告市场上,花钱制作广告的多数是大企业,小企业做广告是得不偿失的。小企业通常模仿大企业的产品,等待大企业通过广告打开市场后出售廉价产品。在现实经济活动中,大、小企业的行为就很不一样。大企业财大气粗,设立研发机构,不断开发新产品;花大本钱做广告来扩大市场。小企业实力不济,则没有这种积极性。从博弈的角度讲,小企业的最优选择“仿制”(山寨),等大企业开发出市场后坐收渔翁之利,这是典型的“搭便车”行为。博弈论绝对不是纯理论的学科,关键是要学以致用。学习的时候我一度喜欢构造收益矩阵分析生活中的问题,帮助自己理清思路。最好笑的是乘电梯的时候我分析了为什么3楼以下的人乘电梯总是被大家鄙视。很有趣的学科,多思考就有新发现。可以参见选择几本书多看看。书里会有很多结合实际的例子帮助思考,内化之后,应用也会容易的多。
朝鲜战争、越南战争 都 可以看作 美苏 阵营 通过博弈 认定 对方 只想打常规战争,不愿放核弹,于是 社会主义阵营 放开手脚 还真把美国 拖到 撤退了。 这个 效果 还是 挺正面的,误判的话 地球估计 就多处 核爆了,作者和读者 可能都 不复存在。
具体来说很复杂,比教科书的抽象说明复杂得多。以斗地主策略说明(不仅涉及博弈论,还涉及概率、逻辑推理和心理学):1. 什么情况下应该要地主?一副牌总共有四个2,两个王,我们叫大牌。可能出现的情况有:1)无大牌。这个时候明显不能要。2)有1张大牌。如果是2,不要。如果是大王,牌型整齐两手出完可以要。总体建议不要。3)有2张大牌。两个2,不要。一2一小王,建议不要。一2一大王,牌型整齐可要。4)有3张大牌。一个2两个王,两个2一个小王,两个2一个大王,三个2。总体可要。5)有4张大牌。两个2两个王,三个2一小王,三个2一大王。总体可要。6)有5张大牌。三个2两个王,四个2一小王,四个2一大王。要。7)有6张大牌。四个2两个王。要。一副好牌是什么意思?平常,我们看到大牌就高兴,包括王、2、A、K多这样的牌。牌力大,这是牌好的第一层意思。牌好的第二层意思,需要考虑牌的整体结构,即牌的整齐度。这在实际情况中是被很多人忽视的。有的人经常拿双王两个2没有打赢,往往因为其余的牌太散,也就是牌的整齐度不好。综上,拿到牌要不要地主有两个维度的考虑:一是牌力大不大,二是牌的整齐度好不好。不要赌底牌,底牌出现想要牌的概率很小,小于10%。2.
地主出牌方法:1)拿上牌后,分析自己的牌,除开三带一后,剩下的单牌在10点及以下,则发单。如果自己大对子比较多,能收回对子,便发对。如有几个三带一就先发三带一。2)地主要尽量不要把自己的弱点暴露在对手的面前,也就是如果没有大的对子,首发就尽量不要打对子。人家打对10左右你就不要了,那弱点一下就给暴露了。 3)地主要学会忍让,如果不管是哪家的牌你都要打死,那么你的牌再大也是要输的,如自己发单,别人打大单,但自己有大对子那么就没有必要拆开2去打,因为对方肯定有对子投起来的。 4)地主要算准下家的单牌过到几、对子过到几。(通过发单时算、还可通过三带所带的牌来算)。
地主走一张单,地主下家直接就走一个2,要直接打掉。
地主上家出牌方法: 1)地主发单,顶大单,上手则改打中对;地主发对子,同伴出小对子则卡住地主的小对子,卡住对8以下的,可出对7、8,让同伴接过去;若同伴出到对10左右则千万不能接同伴的牌,在同伴打不起时在接打地主,上手后出大单。2)同伴上手后,发小单过来,则要顶大单,如果大牌是对子就应该拆开对子来顶地主,上手后继续发中对,但如果前面已经知道同伴没有大对子了,则可以在顶牌时稍微顶小点,顶到10左右,让同伴去接地主的单牌。 3)看着牌很可能打不赢的时候,可以采用特殊的方法。如有一个A、2、加上几张烂牌,顶牌A,地主不要,这个时候就打一个2,这样如果地主不是双王,他必然会用王打你,这样就让地主少过了一张牌,给同伴创造了更好的机会,如果地主是双王,他牌不好他也可能把双王给拆掉,(本来他可以炸出来的)这样,就被你给骗到了,这种情况能逼地主不炸就为赢了。4)地主上家要算好地主是单牌差劲还是对子差劲,专门打地主的弱点。如果地主单牌过完了,便发单,分死他。5)地主上家一定要记住自己的任务:顶牌,卡主地主的单牌和小对,让他出不了。6)如果牌很好,可不顶牌。但至少要有80%以上把握才能这样放。
4. 地主下家出牌方法:1)地主发单,过小单;地主发对,过小对;地主出大单,选择性的拆2。
2)接打同伴的中大单和对子,上手后有单牌一定要出单,单牌很大也可出对子,无单了出对子。3)报单双时,如果地主过的单牌很少(地主上家顶住了牌没有让地主过小单),就报大单,否则报双。
5. 算牌1)算炸弹 例:自己无2,出A见小王,则极可能有2222。
2)算大牌例1:自己地主大+22先手出A下家出小,则必有一家22成对。 例2:自己地主大+2先手出单下家出2,则极可能上家有22。
3)记牌任何人都必须记住的:王,2,自己的缺牌,10,7。6. 合作1)单不放10,双要过6。上家顶地主,尽量单牌不要小于10。对子出到66最好,一来不让地主放小对,二来可以知道关于7的重要信息。
2)不压队友。队友牌好让队友出,不可逞一时意气。3)地主剩一张时。 若能不放单就走掉,固然最好,若不能走则要求密切配合了。最基本的路数是,若上家走则走,若不能走则以最大的牌依次顶地主,然后放对让下家接;下家接上后,若能走则走,若不能走,则放单;上家再重复刚才的路数。4)地主剩两张时。 任何情况下,除非已算出地主所剩为两张单牌,否则不要出对。一直出单,直到地主出一张为止,若地主始终不出,那就一直出单,把对子全部拆成单张出,地主出一张后,再照上面的打法进行。三方信息开始时是比较对称的,每个人都只知道自己的牌。但是游戏进行过程中,高手可以通过自己的缺牌、已出牌、上下家打法,据此推理分析得知一般人不知道的重要信息,由此制定优势策略,增加获胜几率。最后,三个人坐的位次很重要,千万不要让个猪一样的队友坐地主上家。
博弈论可以用来解释排队这个现象的出现。因为在单位时间内我们的需求往往超过了所能提供的资源,于是,我们需要找到一种方式来解决这个矛盾。举个例子,现在银行只能提供一个窗口供顾客来办理所有业务,但同一时间却有大量顾客来办理业务(假设银行办理业务的速度比较慢),那么我们要怎样确定谁有权利先去办理业务呢?(请先忘记你大脑中所谓的道德观念或规则)有人说,肯定是先来后到啊。问题是,为什么一定要先来后到呢?凭什么要先来后到?现在假如没有道德观念和规则的的束缚,有个先来的人正在办理业务,后来的一个人赶来,他也急着办理,这个时候他有两种选择:第一,他就在原地等候先来的那个人办完;第二:他去和第一个人争抢,比如用暴力,两人用暴力解决,看谁有能力一直占领这个窗口。如果采用第一种方法的话,这个时候的结果是:他必须付出一定的时间等候,但第一个人却可以比较顺利并且快速地办完。第二种办法:他去和在他前面的那个人打一架,这个时候的结果是,最终一定会有一个人赢一个人输,输的那个人只能乖乖的在一旁等着,但是,他们两人必须要付出一段时间用来打架来决定谁来办理业务,而且可能他们两人还必须受点皮肉伤。假设他们两个每次都会碰到,并且都有这两种方法来让他们选择,他们每一次都要重复进行这种博弈,然后都会有相对应的结果。在进行多次博弈的过程中,他们渐渐发现,不行啊这样,靠打架来解决效率太低了,结果对双方都不太好。于是,有一天,他们之中有一个人提议,要不我们不要打架了好不好,我们每一次谁先到谁就先办理业务好不好,另一个人想了想说,好吧,那就这样吧。于是,当这种方法重复多次之后就演变成为一种为双方所接受的常态化的解决问题的机制,这种情景扩大到多数人也是这样。其实,其实政治的出现也可以这样来解释因为双方都没有能力在单次博弈中打败对方,必须经过这样的多次重复博弈,这样就隐藏这合作的可能性。当然,我这个例子与博弈论所需要的理论假设环境并不是完全吻合。有人也许会说,排队这样一个如此简单的事需要这么复杂的解释吗? 没错,科学就是这样,不断地把简单问题复杂化,把复杂问题简单化。我这样只是提供一种看待排队现象的视角而已。
我之前看过耶鲁大学博弈论公开课一个关于攻防战争的博弈例子,我把条件修改了一下,重新模拟出一个混合策略纳什均衡的博弈。现在假设将军即进攻方拥有3个兵团的兵力。将军要进攻一个城市,有两条路线可以到达这个城市。一条是平坦的大路,一条是崎岖的山路。防守方会在这两条路线中一条设伏。注意只能选择一条。博弈方就是进攻方和防守方。进攻和防守路线都是这平坦道路A和崎岖道路B两条。进攻方走崎岖道路B会自动由于地形损失1个兵团,而走平坦道路A则不会。防守方在崎岖道路伏击,可以使进攻方损失1个兵团;在平坦道路伏击,可以使损失2个兵团。因为在平坦的道路,地形更加开阔,可以组织更大规模的伏击战。进攻者得益为他的部队到达城市后剩余的兵团数量,而防守方的得益正是将军在到达城市前损失的兵团数量。经过这样的修改,博弈矩阵为:若双方都选择A,则进攻方在平坦道路上损失2个兵团,剩余1个。若均选择B,则进攻方损失2个兵团,剩余1个。若进攻方选A,防守方选B,则进攻方无消耗,剩余3个。若进攻方选B,防守方选A,则进攻方消耗1个,剩余2个。易看出这个博弈不存在纯策略纳什均衡,也即任何一个纯策略组合都有一个单独博弈方可以通过单独改变策略而得到更好的得益。但是这个博弈仍然可以找出混合策略的纳什均衡。具体分析思路如下。设防守方选择A的概率为Pa,选B的概率为Pb。博弈方选A的概率为Pc,选B的概率为Pd。那么,双方都要让对方无法知道或是猜到自己的选择,则:Pa *1 +Pb*3=Pa*2+Pb*1
Pc*2+Pd*1=Pc*0+Pd*2由于Pa+Pb=1,Pc+Pd=1,可求得Pa=0.67,Pb=0.33,Pc=0.33,Pd=0.67。当防守方以(0.67,0.33)的概率随机选择A和B,进攻方以(0.33,0.67)的概率随机选择A和B,由于谁都无法通过单独改变自己的随机选择的概率分布来改善自己的期望得益,因此这个混合策略组合是稳定的。这是本博弈唯一的混合策略纳什均衡。此时防守方博弈的期望得益U1=0.67*0.33*2+0.67*0.67*1+0.33*0.33*0+0.33*0.67*2=1.33同理易得进攻方博弈的期望得益U2为1.67从上述的博弈可以看出,博弈论在战争中的运用与战争双方的情况有着极其重要的关系。这是一个完全信息的静态博弈。进攻方和防守方博弈的基础是双方同时决策,且所有博弈方对于双方得益都了解。这个博弈的难点或许就在于如何猜测预料对手的选择,如何根据对手决策来调整自己的选择,如何判断对手对自己选择的调整而再次调整选择……由此也可见,在真实的战争情况中,尽可能地发现刺探获取对手的选择情报是多么得重要。的博弈。
小弟不才,曾学得一些博弈论皮毛,以为博弈论甚是有用。其效用有三:解释, 预测,决策个人感觉关于是否扶老人的问题就是一个博弈问题。参与者:摔倒老人A,
路人B(并非撞老人者) 其扩展形式Ps:图中收益仅为程度衡量大小,且前一个数字代表路人收益,后一个数字代表摔倒老人收益。这个博弈是不完全信息博弈。若路人扶起老人,老人不讹路人,则老人获得救治,路人获得心灵慰藉,皆大欢喜。若老人讹之且成功获赔,则路人不仅心寒更是损失钱财,收益不仅为负而且负了很多,老人则不仅获救还获钱财,只是费了功夫去讹之,故而收益很大。若没有讹成功,则路人心寒且浪费资源与之辩解,收益为负但却不是太大;老人则获救之余仅是费了资源与路人辩解再加个道歉,两相比较,毕竟获救,损失不大,故而两者基本平衡。由于是不完全信息博弈,路人在扶老人之前不知老人讹他的概率是多少,而不知老人讹成功的概率是多少。在现实中,讹人的老人太多,且其成功概率很高,故而路人扶起老人的期望收益基本为负,故而其均衡结果为不扶。若要让路人扶起老人且老人不讹,,解决这个困境或有三条出路:一, 老人们提高觉悟,不要随意讹人,尽量降低讹的概率,若路人明知老人不讹的话,则博弈会是一个皆大欢喜的局面。二, 提高各种路面监控以及破案手段,提高侦破效率,让纠纷的成本降低,即路人投入较少资源以降低纠纷成本从而提高获益。同时还可提高讹人而不成功的概率。如此则均衡博弈会以较大概率向不讹的结果靠近。三,提高对讹人不成功的老人的处罚,施以重罚,则其讹人不成功的收益将会很低,从而均衡会向不讹的结果靠近。
太多了任何有限资源利用某种方式的分配 都可以用到博弈论我打三国杀记不太清楚了某次无意看到可能是美国学者根据博弈论的几个推论后。立刻对博弈论肃然起敬,因为几个推论彻底梳理清楚我迷迷糊糊的三国杀策略。并且我觉得对为人处世都有帮助。比如 一报还一报即报恩与报仇 都是为对手释放信息以此来提高对手合作的可能性。因为报恩可以提高对手的收益,而报仇来提高对手的成本,理性人是趋利避害的。所以通过正负反馈来影响对手的决策向利于自己的方向发展。再比如 有限次的合作容易背叛与破裂,而长久的合作比较稳固。因为理性人的合作是为了获益,所以有限次的合作容易计算出利益,那么每一方最优解必定是自己在有限次的步骤中尽可能少的支付成本,那么必定是破裂与背叛。如果双方真的决定长期合作,那么每一次的成本付出是预期着对手的利益反馈,每个对手都是依次处事,你的每次付出会带给对手收益,那么对手也是如此策略,结果是大家比较容易共赢。这个前提是对手都是如此策略。公司合作 夫妻相处 棋牌娱乐都复合这些推论。但是第二推论稍微改变一下就很有意。思。比如你与对手交换信息依此来互相确认彼此进行长期合作,但实际你只是进行有限合作,前提是你能够让对手相信你是个长期伙伴。你就很可能获大益。这实际算是一种欺骗。我不懂博弈,但我觉得只是看到一两个推论,就能带来这些信息。博弈论很了不得。理论放到现实的土壤,用你的思考来浇灌,你才知道它到底有没用。
看了耶鲁大学的《博弈论》这门课,其实回答了我以前生活中的一些疑问。讲一个我觉得挺意外的。先说结论:当你作为一个父母、老师,希望孩子达到自己的要求,比如做作业,背诵课文等等。请不要通过惩罚手段以图达到目的。这是无效的!请通过增加检查频率来达成!(以上结论纯属将下述博弈水平展开至生活,不对有效性负责!)以下为证明:(引用博弈论课程中关于纳税的例子)参与博弈人: 纳税人和查税人采用的策略:纳税人选择报税或者隐瞒不报。
查税人选择查税或者不查税。收益分别为:纳税人 :
报税:则不论查税人是否查税,收益为0。
隐瞒:隐瞒成功收益为4(瞒天过海了,哈哈),被查税者检查出来要罚款,此时收益为-10(no zhuo no die)。查税人:
不查税:但是对方没有隐瞒,收益为4(不检查但你乖乖上报,爽)。若对方隐瞒,收益为0(被偷税漏税了,没钱收)。
查税:但是对方没有隐瞒,收益为2(检查了和不检查一个样,收益比不检查低点)。若对方瞒报了,收益为4(想偷税,乖乖给我把钱上缴了)。将此博弈列入矩阵表,简单如下表:通过一系列运算,暂且不表。(详细计算请看博弈论视频)通过一系列运算,暂且不表。(详细计算请看博弈论视频)得出结论:纳税人选择2/3概率报税,1/3概率隐瞒。
查税人选择2/7概率查税,5/7概率偷懒。如果我们上调了罚款的金额,将-10改为-20。此博弈会出现什么情况呢?通过一系列运算,暂且不表。(自己看视频去~)得出结论:纳税人选择2/3概率报税,1/3概率隐瞒。
查税人选择1/6概率查税,5/6概率偷懒。 将两个结论进行比较,看到问题关键没有?居然纳税人选择的策略没有改变!!!你的小孩、学生该偷懒还是偷懒,该不背诵还是不背诵!!!以前那些被罚抄1000遍的直接哭晕在厕所。终极结论:增加惩罚力度,不会让纳税人提高报税的概率,是达不到减少偷税漏税的目的。只有增加查税人的检查频率,才能正真减少偷税漏税。}

我要回帖

更多关于 纳什均衡博弈论 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信