囚徒困境实验报告.docx
实验经济学结课论文总分Q徒困境实验报告学院财政税务学院专业12级资产评估姓名李岩学号学号22370506评分项目分值论文选题情况20分)文献利用情况(20分)论文写作20分)论文内容20分)创新性(20分)评分人囚徒困境实验分析一、实验目的根据囚徒困境经典悖论,通过实验来探寻单词与屡次重复结果,分析结论。然后通过研究"囚徒困境",了解囚徒困境产生的原因,想出走出囚徒困境的方法,并且理解和利用囚徒困境解决生活中与经济中的实际问题。二、实验原理囚徒困境是博弈论的非零和博弈中具代表性的例子。经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:假设一人认罪并作证检控对方(相关术语称"背叛"对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。假设二人都保持沉默(相关术语称互相"合作"),那么二人同样判监半年。假设二人都互相检举(互相"背叛"),那么二人同样判监2年。用表格概述如下:三、实验说明甲沉默甲背叛通过角色扮演的困境。实验者两人一乙沉默二人同服刑1乙服刑10年,方式再现经典的囚徒年甲即时获释组扮演囚徒。在相同的情境下看不同的实完成实验。乙背叛验者如何选择策略来甲服刑10年,二人同服刑8乙即时获释年实验并没有考虑其他客观因素,是在完全假设的没有任何干扰囚徒做出选择的因素的情境下进行的。实验规那么:实验参与人被随机地分配到有两个人组成的不同小组中。如果小组中的两个成员都选择坦白,那他们将会分别获得6年的刑期;如果小组中的两个成员都选择否认,那他们将会分别获得3年的刑期;如果小组中有一个成员选择坦白、另一个选择否认,那么选择坦白的成员获得1年的刑期,选择否认的成员获得10年的刑期。这个问题可以总结为:你坦白你拒绝他坦白各判6年你10年他1年他拒绝你1年他10年各判3年四、实验准备实验小组一共五人,通过抽签的方式分出两人,一人为囚徒一,一人为囚徒二。实验分为两种,一个是单次,一个为屡次。另外三人分别记录单次实验与屡次试验的结果,分析数据。五、实验步骤1,在单次实验的情况下,囚徒一与囚徒二分别只有一次时机选择拒绝或坦白。2、在屡次重夏实验的情况下,分为三轮,囚徒一与囚徒二分别有十次时机来选择坦白或拒绝。3、收集实验数据,画出折线图,并分析实验结果。具体来说,实验分为两个阶段。第一阶段,囚徒一和囚徒二要熟悉实验程序的实验过程和收益情况,并选择坦白或否认。程序界面如下列图所示。第二阶段,囚徒一和囚徒二可以看到自己的选择和对方的选择,并且知道自己在本轮次获得的刑期。程序界面如下列图所示六、实验结果分析1、单次实验单次实验的结果理论上有四种,即囚徒一与囚徒二都拒绝,各判三年:囚徒一与囚徒二都坦白,各判六年:囚徒一坦白,判一年,囚徒二拒绝,判十年:囚徒一拒绝,判十年,囚徒二坦白,判一年。然而,实验的结果是,囚徒一与囚徒二均选择坦白,双方各判六年。因为二人面对的情况一样,所以二人的理性思考都会得出相同的结论选择坦白。坦白是两种策略之中的支配性策略。因此,双方坦白是这场博弈中唯一可能到达的纳什均衡。2、屡次实验对于屡次实验发生的结果。我们一共进行了三轮实验,每轮实验均进行十次,从而来总结最后的结果,根据每轮结果的折线图和三轮总结果的折线图来看,每轮得到的实验结果均与均衡结果有偏差,但是三轮总结果的折线图却偏向于均衡结果,即两人均坦白,各判6年。结果是纳什均衡逐渐趋于帕累托最优。实验表格如下列图所示:总轮数轮数身份选择对手身份对手选择刑数对手刑数-1囚徒一否认囚徒二坦白101-2囚徒一否认囚徒二否认33-3囚徒一否认囚徒二否认33'4囚徒一坦白囚徒二坦白66'5囚徒一否认囚徒二否认33'6囚徒一坦白囚徒二坦白66-7囚徒一坦白囚徒二否认1108囚徒一坦白囚徒二否认110i9囚徒一坦白囚徒二坦白66-10囚徒一坦白囚徒二否认110二1囚徒-坦白囚徒二否认110二2囚徒一否认囚徒:否认33二3囚徒一坦白囚徒二否认66二4囚徒一否认囚徒二坦白101二5囚徒一否认囚徒:坦白101二6囚徒一否认囚徒二坦白33二7囚徒,IR白囚徒二否认110二8囚徒一坦白囚徒二否认110二9囚徒一杏认囚徒二否认1()1二10囚徒一坦白囚徒二坦白33三1囚徒一否认囚徒二否认33三2囚徒-否认囚徒二否认33三3囚徒一坦白囚徒二坦白66三4囚徒一否认囚徒二坦白101三5囚徒一坦白囚徒二坦白66三6囚徒一坦白囚徒二否认110三7囚徒一否认囚徒二坦白101三8囚徒一否认囚徒二坦白101三9囚徒一坦白囚徒二否认110三1()囚徒-否认囚徒二坦白1()1第一轮实验结果折线图如下所示第二轮试验结果折线图如下所示:第三轮实验结果如下列图所示:三轮实验结果汇总折线图:七、实验结论1、单次实验结论这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果囚徒一和囚徒二都拒绝,两人都只会被判刑3年,总体利益更高,结果也比两人都坦白,判6年的情况较佳。但二人均为理性的个人,为实现个人利益的最大化,均衡状况会是两个囚徒都选择坦白,结果二人判决均比合作为高,总体利益较合作为低。这证明了:在非零和博弈中,帕累托最优和纳什均衡是相冲突的。2、屡次实验结论实验被反复地进行。因而每个囚徒都有时机去"惩罚"另一个囚徒前一问合的不合作行为。这时,合作可能会作为均衡的结果出现。坦白的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优.八、实际事例上述实验结果可能过于抽象,但现实中,无类似囚徒困境的例子还是很多的。不管是社会科学中的经济学、政治学和社会学,以及自然科学的动物行动学、进化生物学等学科,都有问题可以用囚徒困境来分析。这种博弈方法的重要性可见一斑。下面我就为大家举些囚徒困境的例子:1、经济例子中国电信与中国联通,两边都希望赚取市场利润,但是如何在话费价格定位上有着不同的选择,如果我的价格低对方价格高的话我就会占有市场,但是缺点是我会减少利润,但是如果我的价格高对方的价格低的话,我就会失去市场,在双方没有达成Cartel的情况下会出现“囚徒困境"模式,就是双方都以低价位来抢占市场但是双方的利润都没有最大化。2、政治实例50年后军事解密,朝鲜战争的起因,因为中国和美国都有考虑,我国是怕韩国如果统一朝鲜后美军会侵略中国,而美军是怕如果朝鲜统一韩国后,中国军队会侵略日本,在占领日本后威胁美国外乡。所以双方都是以出兵和不出兵考虑,如果出兵,会有经济损失,如果不出兵会威胁自己的领土,所以双方在“囚徒困境"模式下都选择了出兵,最后两败俱伤。3、军事例子台湾要买美国的F16.中国希望欧洲对华军售,两个地区的政府都在为武器画着大价钱从而损失了国家的经济开展力,这也是囚徒困境的模式,都会担忧如果一旦开战会对自己不利,如果我没有先进武器,你有先进武器,那么开战的话我就会吃亏。如果我有先进武器你没有的话,我就会得利。所以我一定要有先进武器。殊不知如果两岸达成和平条约,双方都不购置先进武器,把资金都放在经济开展人民收入上,那才是真的双高。4、环法自行车赛每年都举办的环法自由车赛中有以下情况:选手们在到终点前的路程常以大队伍(英文:PeIOton)方式前进,他们采取这策略是为了令自己不至于太落后,又出力适中。而最前方的选手在迎风时是最费力的,所以选择在前方是最差的策略。通常会发生这样的情况,大家起先都不愿意向前(共同背叛),这使得全体速度很慢,而后通常会有二或多位选手骑到前面,然后一段时间内互相交换最前方位置,以分担风的阻力(共同合作),使得全体的速度有所提升,而这时如果前方的其中一人试图一直保持前方位置(背叛),其他选手以及大队伍就会赶上(共同背叛)。而通常的情况是,在最前面次数最多的选手(合作)通常会到最后被落后的选手赶上(背叛),因为后面的选手骑在前面选手的冲流之中,比拟不费力。5、广告竞争两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受那么会夺取对方的局部收入。但假设二者同时期发出质量类似的广告,收入增加很少但本钱增加。但假设不提高广告质量,生意又会被对方夺走。此二公司可以有二选择:互相达成协议,减少广告的开支。(合作)增加广告开支,设法提升广告的质量,压倒对方。(背叛)假设二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告本钱的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。囚徒困境在生活中是普遍存在的,因此,我们需要在理解与互相信任的根底上到达最优合作,实现双方利益的共赢。