综合I类/II类理性人的博弈策略|欢迎您

木工雕刻机 | 2021-03-25

|二人零和博弈作为一种相对完整的形式,在博弈论的早期就已经获得了理解和争论。本文介绍了一类理性和二类理性的概念,指出现实博弈论中的参与者可能从一类理性的角度采取策略,也可能从二类理性人的角度得出策略。因此,构建了一个融合一级和二级理性特征的薪酬矩阵。

BG西游捕鱼首页

通过讨论非零和博弈的一些罕见例子,指出该模型可以解决自由选择问题策略的不确定性。但是这篇文章并没有回应严谨的数学证明。关键词]I型理性,II型理性,混合策略,策略自由选择,不确定性在Xi的博弈论中,一般假设PLAYERS具有理性人的特征;即永远寻求自身利益最大化;自由选择能最大化个人利益的策略。

在收入的时候,用于个人收入。这是一个“绝对量”,但现实中并没有其他情况,即参与者除了考虑自己的扣款之外,也非常关心对方的扣款,比较彼此的差异,采取“比较”和最大化扣款的策略。我们不妨把那些通过持续比较而演绎最大化的演员称为二类理性人,从博弈论的角度研究他们的不道德模式。具有II类理性特征的现象在很多方面并不存在。

比如我们在人际交往中显然不会遇到一些“损害他人私利”的人,也不会看到“损害他人私利”的人。从我们的角度来看,很明显,他们是非理性的,但是如果他们开始一对一的思考,他们不会发现,但是他们的做事原则相对来说,他们总是要占自己的便宜,或者比对方输得少。

至于其他人,会不会,不是他们考虑的因素,也是一种“理性”还有心理上的考虑,指出少扣或者少赔是不公平的,从自己的角度来说,自由选择策略。在激烈的市场竞争中,竞争双方有时会采取短期内不核算成本就流血的策略,想先输后死,期待输了再被淘汰,但不会坚决到底。要达到这个目的,就必须把失去的力量巩固到第二度,让它崩溃,对自己造成威胁。在市场上竞争,希望自己能笑到最后,也是“理性”的。

有研究指出,这种二级理性在国际关系中的例子更多。虽然这些都是极端的例子,但是在现实生活中,大家或者组织考虑自己的推演,希望自己的推演比别人的大一些,这样更好。关键是两种扣除的权重随情况不同而变化。

如果我们反驳自由选择策略中的II理性因素,可能无法解释某些现象。虽然没有从道德角度进行倡导,但总是从价值判断上进行谴责;但是作为一个不存在的现象,研究一下还是合适的。但本文从二类理性个体的博弈论策略出发,过渡到一个融合了一类和二类理性不道德的博弈论模型。

对于在这种情况下被设计的参与者来说,策略的自由选择只是经济上的,而不是道德上的依赖。毕业论文http://www.lw54.com当博弈论的参与者是II理性人;这时候收入矩阵就给到了一定程度。假设两个参与者A和B都是二类理性人,比较一下一类理性的利益矩阵(图1);S1 S2 S1(M1,N1) (M2,N2) S2 (M3,N3) (M4,N4)图1。

第一类理性参与者的利益矩阵第二类理性参与者的利益矩阵如下:B S1;S2毕业论文http://www.lw54.com A S1(M1-N1,N1-M1) (M2-N2,N2-M2) S2 (M3-N3,N3-M3) (M4-N4,N4-M4)图2。二类理性参与者的收入矩阵非常显著。在第二类理性参与者发展的博弈论中,在每个战略群体下, 早期博弈论主要研究的两人零和博弈就是这种情况。

从1910年到1930年,零和博弈作为一种竞争形式,被指出是博弈论的主要形式。而且,零和博弈的研究成果已经成为博弈论中许多新理论的基本概念。作为练习,我们把难得的博弈论模型改回零和博弈的情况,看看会有什么合适的结果。

一般指出零和博弈是常和博弈,最一般意义上的博弈是非常和的。例1:囚徒困境A和B因为涉嫌共同犯罪,分别在两个房间被审讯。

BG西游捕鱼欢迎您

审讯者提前向两人解释了政策:如果都否认犯罪事实,各判10年徒刑;如果双方都坚持双方无罪释放;一方无罪,另一方否认,无罪一方获赔500元,否认一方判15年。非零和博弈情况下的支付矩阵如下:毕业论文http://www.lw54.com;否认与否认A否认(-10,-10) (5,-15)否认(-15,5) (0,0)图3;纳什均衡策略;是(否认,否认),如果甲、乙双方都是二类理性人,其适当的支付矩阵变为:b否认否认A否认(0,0) (20,-20)否认(-20,20) (0,0);图4显示纳什均衡策略仍然是(否认,否认)。毕业论文http://www.lw54.com案例2。春节前夕,一个小镇上的两家店铺A和B同时看到了一个赚钱的机会:他们去城里卖了一批鞭炮,回去买了。

进价加运输费总计5000元。如果没有竞争对手,这批货可以在小镇买6000元;但如果另一家店同时在一个小镇卖鞭炮,价格暴跌,根本不可能买到4000元的这些鞭炮。

由于甲乙双方都是一类理性人,所以有一个支付矩阵:b;进口商不是进口商A进口商(-1000,-1000) (1000,0)不是进口商(0,1000);(0,0);图5(无进口商,进口商)和(进口商,无进口商)是纳什均衡策略。但问题是,甲、乙双方同时行动,没有告诉对方自己采取了什么行动。毕业论文http://www.lw54.com如果甲乙双方都是二类理性人,那么情况不会变成:进口商B不进口进口商A (0,0);(1000,-1000)无进口商(-1000,1000) (0,0);图6此时的纳什均衡策略是(进口商,进口商)。

例三。利己利他A和B都是I类理性人,他们的支付矩阵是B;利己利他毕业论文http://www.lw54.com A利己(1,1) (4,0)利他(0,4) (3,3)图7纳什均衡为(利己,利己);作为一个二级理性人,甲乙双方的支付矩阵转化为:b;利己与利他(0,0) (4,4)利他(-4,4) (0,0);图8纳什均衡依然(利己,利己)。

智能猪的博弈论一只大猪和一只小猪被放在同一个猪圈里。猪圈的一端装有专用按钮,另一端装有水槽。

但猪按下按钮,不会有10个单位的食物转移到食槽,但按下按钮的猪会花费2个单位;如果大猪再去食槽,小猪吃不下1单位剩饭;但是如果小猪再去,它就不能吃4个单位的食物了。如果两头猪同时到达,小猪可能不能吃3单位的食物。如果毕业论文http://www.lw54.com遵循一类理性,就有一个支付矩阵:小猪;按键等待大猪按键(5,1) (4,4)等待(9,1) (0,0);图9纳什均衡策略是(按键,等待)。

在II类理性下,将支付矩阵改写为:小猪;按键等待大猪按键(4,-4) (0,0)等待(10,-10) (0,0);图10 http://www.lw54.com纳什均衡是(按键,等待)和(等待,等待)。有趣的是,这个时候小猪会自由选择等待(主导策略),而大猪无论做什么都得不到!最后的结果是两头猪都会冻死。

在这种情况下,这两只猪的结局可能和《布里丹的饿驴》有共同之处,后者因为在某种程度上面对两堆干草无法自由选择而被冻死。在智能猪的博弈论中,小猪指出他的结果不能是输,也不能是输也不能是扣。

这时候他不会自由选择后者,而是推卸责任。现实中不太可能两头猪都经常冻死,因为大猪最后是不会明白的。

与其冻死,不如按下按钮。这时,他不会得到4单位的食物;小猪在某种程度上不会得到4个单位的食物,因为大猪会做出如此自由的选择。例5。性爱大战两个恋人,男的想看摔跤,女的想看芭蕾。

如果有必要,他们不会牺牲自己的爱好,互相照顾。有以下支付矩阵:女;摔跤芭蕾男子摔跤(2,1) (0,0)芭蕾(0,0) (1,2)图11 http://www.lw54.com纳什均衡是(摔跤,摔跤)和(芭蕾,芭蕾)。对支付矩阵进行转换:女子摔跤芭蕾男子摔跤(1,-1) (0,0)芭蕾(0,0) (-1,1)图12然后,(摔跤,芭蕾)就是纳什均衡策略。案例6。

斗鸡博弈论两个人推荐火棍从木桥两端向中间行进。每个人都有两个策略:行军或者回来。

如果两个人都一直往前走,两个人都会输;如果一方行进,另一方后退,行进者获胜,抛弃后者丢脸;如果两个人都放弃了,就没面子了。支付矩阵如下:A;http://www.lw54.com B进入(-3,-3) (2,0),放弃(0,2) (0,0);图13纳什均衡策略是(进,弃)和(弃,进);按照二类合理性转化支付矩阵后,可以得到:A,弃B,弃(0,0) (2,2) (-2,2) (0,0);图14纳什均衡策略是(in,in)。在上面的辩论中,我们可以看到,在案例2中,对于第一类理性参与者来说,(非输入者,输入者)和(输入者,非输入者)是纳什均衡策略,在一个静态博弈中很难理解对方在行动开始时的策略,所以自由选择中不存在不确定性。

在智能猪的博弈论中,对于II类理性参与者来说,不可能根据支付矩阵想出养大猪的策略。怎样才能防止这样的不确定状态在自由选择中频繁出现?适当考虑混合战略。

毕业论文http://www.lw54.com一般来说,博弈论的每一个参与者在某些时候都不会按照一类理性人的不道德模式行事,有时也不会按照二类理性人的模式行事。可以认为是要求概率P和Q,此时假设A跟随I类理性的概率为P,那么B跟随I类理性的概率为1-p,B跟随I类理性的概率为Q,作为II类理性人的概率为1-Q,此时也可以构造一个混合策略;获取支付矩阵:B S1 S2 a s1m1-(1-p) n1,n1-(1-q) m1m2-(1-p) N2,N2-(1-q) m2s2m3-(1-p) n3,n3-(1-q) m3m4-(1-p) n4,n4图15毕业论文http://www.lw54.com可以看作是上述混合策略的特例当P=1,Q=1为一类理性;而ii类理性对应p=0,q=0。

现实中可能经常会出现另一种情况,就是在两个参与者中,一个是I类理性,一个是II类理性。为方便起见,我们假设A是I类理性人,B是II类理性人,因此支付矩阵有以下一般形式:b;S1;S2S1(m1,n1-m1) (m2,N2-m2) S2 (m3,n3-m3) (M4,n4-M4)图16只是当p=1和q=0时混合策略的类似情况。

对于上述罕见的博弈论案例,如果在这种情况下进行翻译,将无法得到一些有趣的结果。 毕业论文http://www.lw54.com案例1。囚徒困境;b否认否认A否认(-10,0) (5,20)否认(-15,20) (0,0)图17纳什均衡策略依然(否认,否认);例2。进口商和非进口商;b;进口商;进口商A (-1000,0) (1000,-1000),进口商0,1000 (0,0);图18 http://www.lw54.com纳什均衡策略是(没有进口商,进口商)。

例三。利己与利他B;利己与利他(1,0) (4,4)利他(0,4) (3,0);图19纳什均衡策略仍然是(利己,利己)。

案例4。智能猪的博弈论;小猪;按键等待大猪按键(5,-4) (4,0)等待(9,-10) (0,0);图20 http://www.lw54.com纳什均衡策略是(按下按钮,等待)。例5。

BG西游捕鱼首页

性别斗争女性;摔跤芭蕾男子摔跤(2,-1) (0,0)芭蕾(0,0) (1,1)图21纳什均衡策略是(芭蕾,芭蕾)。案例6。斗鸡博弈论;a进弃b进(-3,0) (2,2)弃(0,2) (0,0);图22。

http://www.lw54.com的纳什均衡策略可以找到。大多数情况下,二类理性人的结果比一类理性人好。

现在用在如图15所示的混合策略中,我觉得在案例2中,性别战争,斗鸡博弈论,智能猪博弈论;策略自由选择:在案例2中,为方便起见,将原来的支付矩阵转化为:;进口商b不进口进口商a (-1,-1) (1,0)不进口(0,1) (0,0)图23。一级理性的概率是p,q:进口商b不进口进口商a (-p,-q) (1,q-1)不进口(p-1,0)图24毕业论文http://www.lw54.com可以看出(进口商,非进口商)是一种可能的均衡策略,但如果要成为唯一的纳什均衡,也应该拒绝q-1-q,即q1/2。

同理,(非进口商,进口商)只能成为p1/2的唯一纳什均衡。可以解释为:当A更像一个I类理性人时,如果B认识到这一点,就应该采取进口商的策略来应对;当B比我理性的时候,如果A意识到这一点,就应该采取进口商策略。这样我们就得到一个自由选择的指南,防止自由选择不确定性的关键在于能否很好地实现参与者的理性偏向。

首页

案例4与此类似。斗鸡博弈理论中,只有适当拒绝p0.4,才能确认存在一个唯一的应该采用的纳什均衡策略。再看看智能猪的博弈论,得到的支付矩阵就是小猪按钮;等待大猪按下(4 p,5q-4) (4p,4q)等待(10-p,-10 9q) (0,0)图25毕业论文http://www.lw54.com可以说明大猪是主导策略,所以更容易得出(按下,等待)是唯一纳什均衡的结论。

某种程度上可以完美解决自由选择的不确定性。通过上面的例子可以看出,这里的二人静态博弈的混合策略需要解决纳什均衡策略自由选择的不确定性,但争论是指一般意义上的,理论上没有严格证明。

这是我们在日常生活中可以遇到的三个基本群体。p和q也可以取0到1之间的任何数字。

在解释中,我们指出,任何人都可以从自己的效用函数中区分收入的大小,而效用函数本身与他对事物的看法或看法以及客观条件密切相关。在一个简单的现实环境中,对于每一种静态博弈理论,参与者更容易采用综合效用观。

如果在倒计时博弈论中,参与者每次都有机会调整P和Q的大小,那么对这种综合理性的不道德性进行更好的探索是合适的。_。

本文来源:首页-www.mulanbashang.com