大家好,今天来为大家分享囚徒困境博弈的一些知识点,和重复囚徒困境博弈的问题解析,大家要是都明白,那么可以忽略,如果不太清楚的话可以看看本篇文章,相信很大概率可以解决您的问题,接下来我们就一起来看看吧!
囚徒困境
警方逮捕甲、乙两名嫌疑犯,但缺乏足够的证据指控两人有罪。于是警方分开两名嫌疑犯,分别和他们见面,并且提供了以下的选择:
若一人认罪并且作证检举对方(背叛),而对方保持沉默,那么此人将会释放,沉默者会被判十年监禁;若二人都保持沉默(互相“合作”),则二人同样判监半年;若二人都互相检举(互相“背叛”),则二人同样判监2年。用表格概述如下:
甲沉默(合作)
甲认罪(背叛)
乙沉默(合作)
二人同时服刑半年
甲释放,乙监禁10年
乙认罪(背叛)
乙释放,甲监禁10年
二人同时服刑2年
囚徒要怎样选择,才能尽量让自己的刑期最短。很明显,最好的方案是两人都选择沉默。但是,两个人不在一块不能商量,商量了也不能确定对方是否会反口背叛。试想一下两人会如何选择:
如果对方沉默,背叛会让我获释,所以我会选择背叛。如果对方背叛、指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。两人的理性思考都会得出同样的结论:背叛对方。
囚徒困境是博弈论的非零和博弈(更偏负和博弈)中最具代表性的例子(基本每本讲博弈的书都会说=。=),反映个人最佳选择(背叛)并非团体最佳选择(沉默)。——这个例子一方面是说在为私利考虑的时候不能太精明,另一方面也对理性行为的适用性提出了怀疑。
破解囚徒困境
契约签订一份对双方都有约束力、对背叛者施以严厉惩罚的契约,建立相互信任的关系,从而实现合作。(但效果有限)建立长期关系,进行重复博弈(重复的囚徒困境会使人趋于合作)在囚徒困境中,如果博弈是一次性的,不用为将来考虑,那背叛就是理所当然的选择。但如果将将来考虑进去,博弈者就很可能会改变自己的策略。实际上,重复博弈更能体现日常人际关系交往。在重复博弈中,合作的长期性能够纠正人们短期行为的冲动。(还有一种情况是,如果博弈有次数,前期双方会合作,但在博弈快要结束的时候,不合作的现象就会出现,其实就是失去了来自未来的激励和惩罚——跛鸭效应)报复假如保持沉默的罪犯,在出狱后会对背叛者实施报复,那么每个囚徒由于担心未来的报复,而会宁愿选择沉默。关于本次囚徒困境博弈和重复囚徒困境博弈的问题分享到这里就结束了,如果解决了您的问题,我们非常高兴。