一、混合策略纳什均衡举例
设甲选a概率为p乙选a概率为q 甲p(3q)1p2q——对p求偏导3q2q0 乙q2p1q4p——对q求偏导2p4p0 混合策略纳什均衡(2,4) 在一个里,是一定存在至少一个混合策略纳什均衡的。简单地说就是常见的那种可以画出MN的矩阵的。证明如下定义一个个,用i来表示每个人有有限个策略,的策略集用表示,里有个元素表示出第j个策略的概率,,定义效用函数,是一个维,代表了所有可能出的混合策略,是笛卡尔积。这里有一个非常重要的假定是函数,可以理解成边际效用递减的效用函数。对于来说,我们把其他所有的策略写成,所以的效用就是。 定义,也就是给定别人的策略,的最优策略所以是一个。注意给定别人的策略,的可以是一个集合不止一个。可证是的。把所有人的写成,这是一个给定所有人的策略,每个个体都觉得更好的策略组合,我们可以写成,这是一个自己到自己的。同时可证是一个。是n维欧几里得空间的子集,满足非空、紧、凸的性质是一个自己到自己的,满足非空、凸、。 根据,有一个不动点,即存在满足,也就是说在所有人的决策是的情况下,任意都觉得,如果其他人策略不变,比较简单的都可以用求出的方法解,这应该包括在你会的两种方法内。但比较复杂的或者决策集是连续的,一般没有固定解法,很多情况下你找到某个的纳什均衡就可以发了比如。
|
以上数据内容来源于:百度混合策略纳什均衡举例、搜狗混合策略纳什均衡举例、360混合策略纳什均衡举例 |
二、十大博弈论经典案例
博弈论经典案例“囚徒困境”及其实证分析 北京工商大学刘健 最近三四十年,经济学经历了一场“博弈论革命”,就是引入博弈论的概念和方法改造经济学的思维,推进经济学的研究。诺贝尔经济学奖授予包括美国普林斯顿大学的纳什博士在内的3位博弈论专家,可以看作是一个标志,这自然也激发了人们了解博弈论的热情。博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具。 博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡,也就是说,当一个主体的选择受到其他主体选择的影响,而且反过来影响到其他主体选择时的决策问题和均衡问题。
|
以上数据内容来源于:百度十大博弈论经典案例、搜狗十大博弈论经典案例、360十大博弈论经典案例 |
三、纳什均衡通俗解释
纳什均衡,属于经济学范畴,也属于博弈论范畴,当然,纳什教授是著名的数学学家。特别是博弈论,是讲人和人群组的博弈问题,人性是至关重要的参数,而且是一个自变量。人性第一特点就是趋利避害。假如我们已经找到了一个策略组合,其中,各方的行动就是针对对方行动而确定的最佳对策。一旦知道对方在做什么,就没人愿意改变自己的做法。博弈论学者把这么一个结果称为“均衡”。 这个概念是由普林斯顿大学数学家约翰纳什也就是电影《美丽心灵》的主人公提出的,因此被称为“纳什均衡”。纳什均衡是博弈分析中的重要概念。年,还是一名研究生的纳什写了一篇论文,题为《n人博弈的均衡问题》,该文只有短短一页纸,可就这短短一页纸成了博弈论的经典文献。在这篇论文中,纳什给出了博弈均衡的定义,即纳什均衡。 那么,什么是纳什均衡呢?简单说就是,一策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。在囚徒困境中存在惟一的纳什均衡点,即两个囚犯均选择“招认”,这是惟一稳定的结果。有些博弈的纳什均衡点不止一个。如下述“夫妻博弈”或称性别之战中有两个纳什均衡点。 丈夫和妻子商量晚上的活动。丈夫喜欢看拳击,而妻子喜欢欣赏歌剧。但两人都希望在一起度过夜晚。在这个“夫妻博弈”中有两个纳什均衡点:歌剧,歌剧,拳击,拳击。在有两个或两个以上纳什均衡点的博弈中,其最后结果难以预测。在“夫妻博弈”中,我们无法知道,最后结果是一同欣赏歌剧还是一起去看拳击。纳什均衡是博弈论中的重要概念,同时也是经济学的重要概念。 诺贝尔经济学奖获得者萨缪尔森有一句幽默的话:你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词:供给与需求。博弈论专家坎多瑞引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是“纳什均衡”。由此可见纳什均衡在现代经济学中的重要性。纳什均衡不仅对经济学意义重大,对其他社会科学意义也同样重大。 启示:通俗地说,纳什均衡含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。纳什均衡有什么用纳什的想法成为我们指导同时行动博弈的最后一个法则的基础。这个法则如下:走完寻找优势策略和剔除劣势策略的捷径之后,下一步就是寻找这个博弈的均衡。我们还要解释一下这个法则。 为什么一个博弈的参与者非得达到这么一个结局呢?我们可以说出好几个理由。没有一个理由本身就有足够的说服力,不过,只要把几个理由结合起来,就能形成一个有力的答案。首先,存在避免循环推理的必要,因为循环推理帮不上忙。均衡在没完没了的“我知道他知道我知道……”的循环里是稳定不变的,这使参与者对其他人的行动的估计能保持连贯性。各方正确预计别人的行动,并且确定自己的最佳对策。 均衡策略的第二个好处出现在零和博弈中。在这种博弈里,参与者的利益严格相悖。你的对手不能通过引诱你采取一个均衡策略而得到任何好处。你已经充分考虑到他们对你正在做的事情会有什么样的最佳对策。第三个理由是,均衡方法注重实效。要想知道梨子的滋味,就要吃一吃。我们将会利用均衡方法讨论许多博弈。希望读者来检验它对博弈结果的预测以及这种思维方式产生的行为指导方针。 相信这么做会使我们的分析更有意思,比抽象地讨论均衡方法的优点更有意义。最后,可能存在一个对均衡概念的误解,希望各位可以避免。当我们说博弈的结果是均衡,并不一定是对参与者最有利的结果,更不意味着是对整个社会作为一个整体而言最有利的结果。有利或者不利的评价永远属于另外一个问题,答案视各个案例的具体情况而各有不同。在经济学中,均衡意即相关量处于稳定值。 在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能将商品卖出去,此时我们就说,该商品的供求达到了均衡。此时的价格可称之为均衡价格,产量称之为均衡产量。均衡分析是经济学中的重要分析。那么什么是博弈论的均衡呢?所谓博弈均衡,它是一稳定的博弈结果。均衡是博弈的一结果,但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的,因而是可以预测的。纳什均衡是一最常见的均衡。 它的含义是:在对方策略确定的情况下,每个参与者的策略都是最好的,此时没有人愿意先改变自己的策略。
|
以上数据内容来源于:百度纳什均衡通俗解释、搜狗纳什均衡通俗解释、360纳什均衡通俗解释 |
更多关于纳什均衡 |
---|
更多相关:百度纳什均衡、搜狗纳什均衡、360纳什均衡 |