博弈论视角下的过程偏好与程序正义 整合性的解释框架 附国外博弈逻辑研究述评.docx
摘要在现实生活特别是司法领域中,过程偏好与程序正义的重要性在多方面显现出来,采用博弈论对程序公正偏好的形成进行研究,可以形成一个整合性的解释框架。从博弈的角度看,即使人们是完全理性自利的,不存在独立的程序正义观念,经过一段时间的演化,对程序正义的诉求也会成为社会偏好的重要组成部分。程序正义不仅仅是一种形式,而且具有实质性的功能和作用,但是,这些功能需要一系列的制度保障才能实现。只有具备这些实质性的功能和作用,人们才会形成对正当程序的偏好。这一结论,可以对当前我国的司法改革,以及学界关于“程序法治”问题的讨论,起到若干启发作用。在现实工活中,过程偏好与程序正义的重要性在多方面显现出来,不同于传统经济学“理性经济人”的假设,真实世界中的人们不仅希求结果的公平,更追求程序上的公正。政治学家、诺贝尔经济学奖得主奥斯特罗姆指出,在政治领域中,存在着“感受到的规则公平性”与“强制服从的成本”之间的替代关系。即使在通常认为高度符合后果主义的消费品市场上,人们也仍然关心价格调整的过程是否公平合理,这种公平关注甚至对利润最大化模型的使用造成了实际的限制。在教育、企业管理等领域中,程序公正的激励作用也不容忽视。当然,程序正义发挥作用最突出的领域是司法过程,社会心理学家们发现,公正的法律程序具有一种“结果正当化”的能力。如果法官中立无偏,充分听取双方的意见,如果人们相信司法程序是公正的,那么,即使未能得到满意的判决,多数人仍然会表示服从,并且支持这个司法体制。在理论层面上,程序正义的内涵也十分丰富,政治哲学家罗尔斯在正义论中提出了“纯粹程序正义"(PUrePrOCedUraljUStiCe)的概念,亦即,在判断事态的时候,不存在一个独立的判断结果是否正义的标准,只要人们遵守了公正的程序,结果就是公平的。在法学界,对于程序正义的作用和“理由”,历来又有“程序工具主义”和“程序本位主义”两种阐释,程序工具主义认为,程序是用来实现某种外在目标(例如社会总效用最大化、成本最小化)的工具和手段;程序本位主义认为公平的程序具有独立于“后果”和“总体效率”的意义,公正的程序具有不依赖于结果效能的“内在优秀品质”。公正的程序本身是独立的目标,而不是手段。不难看出,理论家对于程序正义的规范性总结,尽管深刻而富于启发意味,但从另一方面说,它们是简洁而理想化的,其目标在于进行价值判断,无法将实证研究中的诸多发现,整合在一个富有解释力的整体框架里面。实际上,面对“过程偏好”和“程序公正效应”的诸多事实,必须回答的一系列问题是:人们为什么会关心“过程利益”?这种对于公正程序的偏好是怎么产生的?它对于法律制度的演化具有何种作用?程序正义的诉求,能否比自我权益维护和自利追求更能刻画人们面对法律问题的选择行为?在人们对于法律程序公正的坚持背后,是否仍然有着对于实体正义的诉求?法律程序是满足参与人特定目标的手段,还是本身就具有内在价值?凡此种种问题,均需要有一个完整的解释。发现问题和描述现象,只是社会科学研究的第一步,在现象背后,需要理论的解释和“二次构建”。在这里,我们不可忽略社会心理学家的贡献,他们曾提出过诸如“控制理论”“声请理论”“群体价值理论”等解释性理论,这些理论解释了产生程序偏好的特定的心理机制,但在一以贯之的体系性方面却又不尽人意。尽管我们很难提出一个终极性的解释理论,但是,基于现有的知识,对人们的过程偏好给出一个相对完整的解释框架,仍然有着重要的理论和现实意义。在本文中,我们将首次尝试采用博弈论的方法,在理性选择的基础上,给出一个程序正义偏好来源及其演化路径的相对完整的刻画。根据博弈论的基本理论预设,我们假定人们是自利的,在博弈的开始阶段,并不存在独立的程序正义观念,然后分成各种情境来探讨人们为什么会偏好更为公平的程序设置。本文第二部分给出了一个非技术性的描述,基本上涵括了全文的思想。第三部分探讨正当程序的实质性功能,亦即,当程序能够完成某些实质性的功能时,人们开始出现对程序公正的偏好,并赋予其正当性。第四部分在一个演化的框架下探讨程序公正偏好是怎么巩固保持下来并在群体中扩展开来的。第五部分是一个结论,分析了本研究的理论意义,并对未来的研究加以展望。二、公平博弈与程序公正的诉求程序正义,不仅是法治的目标之一,也是现实生活中人们对司法体系的最深切的希冀所在。博弈论,作为分析“理性自利者”在特定的规则环境下互动的理论,看上去似乎与程序公正无甚关联。但实际并非如此,英文中的“博弈”“游戏”“竞赛”是同一个词(game),事实上,中文里的“博弈”也是“游戏”或“竞赛”的文言说法。而在游戏或竞赛中,遵守规则是游戏能否顺利进行下去的前提条件。游戏或者竞赛的胜负,不但受到竞技者的体能、技艺、策略的影响,在很大程度上也与双方的机遇相关联,特别是在双方势均力敌的情况下,结果无法预先知晓,但经过一番较量之后,总会有赢家和输家。因此,绝大多数游戏都有罗尔斯所说的“纯粹程序正义”的性质,即,特定的结果本身并无正义与否可言,真正与公平正义相关联的,是游戏的过程是否严格遵守了相关规则。有没有“公平游戏"(fairplay,音译为“费厄泼赖”)的精神,是否尊重游戏或比赛的过程,事关游戏能否持续稳定地进行下去,并且形成一种相沿不替的内在秩序。在很大程度上,公平游戏的精神不是从天而降的倘来之物,而是在不断的游戏中自然演化出来的结晶。然而,不是所有的重复游戏都会带来对程序的尊重,要培育公平游戏的精神,必须满足两个前提:第一,游戏规则本身是公平合理的,它虽然不指向特定的结果,却能带来统计上公正的结果分布;第二,参与游戏的各方遵守和尊重游戏规则,形成一种恪守信约的优良习惯,把游戏规则本身看得比游戏的结果还重要,这样做的结果至少不会长期损害自己的利益。如能满足如上的条件,则“费厄泼赖”的精神就会逐渐诞生乃至发扬光大。法律领域的博弈与比较正规的游戏(例如篮球赛、围棋赛)之间,有着若干极为相似之处,例如都必须在特定的规则之下运行、结果都存在不确定性、都需要公正的第三方做裁判等等。但其间也存在许多不同,其最大的不同在于:争讼双方并没有“为了玩而玩”的闲情逸致,和一般的游戏相比,争讼双方是高度结果导向的,他们参与诉讼的目的就是为了赢得诉讼,绝非为了“享受诉讼过程”。但是,恰恰是在法律这种双方极端重视结果的领域中,更需要这种公平游戏的精神,而且,那些比较成熟的法治国家,在这一点上表现得尤为突出。这究竟是何故呢?从文化视角来看,“费厄泼赖”精神的形成有其复杂的历史文化渊源,但从博弈论的视角来看,我们不必预设人们具有先验的“为程序而程序”的动机,而仅需要假设法律博弈的参与人是理性自利的。如上文所说的,如果法律程序本身能带来优良结果的预期,并且遵守法律程序至少不会损害参与人的预期利益,亦即,遵守程序规则本身是参与人的一个占优策略或者均衡策略,那么,在法律领域就会逐渐出现对程序正义的恪守与诉求。尽管各种程序规则约束的是所有的诉讼参与人,但由于负有裁判之责的第三方在司法过程中起到举足轻重的作用,故而,传统意义上的“正当程序”(duePrOCeSS)规则在很大程度上是约束第三方裁判者(或同样负有审断之责的执法者)的。实际上,并不是所有纠纷都会进入第三方裁决的法律程序,也不是所有的第三方裁决都具有优势,只有那些相对有效的第三方裁决才是有吸引力的。第三方裁决的效率依赖于:(1)第三方裁决的执行成本;(2)第三方本人的能力,即他是否能依据一个稳定的、合理的准则进行裁决,不致徇私枉法;(3)第三方裁决者收取的费用。对于公正的司法裁判的偏好必然与第三方裁决者的裁决质量高度相关。在此,笔者以为,大多数的正当程序原则,其实际功能均是为了提高第三方裁决者的裁决质量。如果第三方裁决的质量优良,兼听博采,聪察明断,则会使当事人免遭错判冤案之苦,足以使人信任;而法官和执法者本身正心诚意,恪守限制,也会带来广泛的示范效应,自然会逐渐培育起对于法律的信仰和对司法体制的信赖,由此,一个普遍遵守程序规则的法律环境就会演化生长起来。在下文的论述中,我们将用简明的博弈论模型来展开论述这样的论点。三、功能视角下的程序正义程序正义的原则,尽管看上去非常宏大而抽象,但落实下来,却是简明易懂,符合人们的直觉的。正如约翰奥尔特所说,“尽管法治由多种要素构成,但是程序的精髓可以浓缩为:要求有一位通情达理的、不偏不倚的而且是有效率的做决定的人,或者简单地说,就是要求有一位好法官。”这个要求的核心,是源于“自然正义”的两项原则:第一,法官保持中立无偏;第二,法官公平而充分地听取双方的意见。这两条原则源于古罗马,历经中世纪和近现代的法律实践,已经成为英美法系正当程序的基石,在大陆法系国家也得到广泛的应用。下面,我们以博弈论为工具讨论这两条原则的功能性根源,并进一步地讨论如下理念:公正的法律程序是司法系统向社会传递的关于司法公信力的有效信号。亦即,首先我们将论证优良的程序规则确实可以使结果“真的很好”;其次,我们将会论证,当我们无法判断结果是否很好时,优良的程序规则将使结果“显得很好”,于是,人们尊重这种规则就是“水到渠成”之事了。(一)正当程序的实质性功能进入司法程序的当事人,必然是为了得到更为有效的裁判以解决纠纷。但错误判决总是在一定概率上存在,案件的结果也总会有不确定性,这意味着参与诉讼的当事人经常处在严重的疑虑之中。对于刑事案件的被告,以及民事争讼中的两造而言,他们都会承担心理成本。按照经济学中的不确定性理论,不确定性可以划分为两类,一类是“技术不确定性”,即由于人们的技术水平不够、客观的信息缺乏而导致的不确定性;还有一类是“行为不确定性”,即由于博弈中参与人的机会主义行为而带来的不确定性。在法律领域,同样存在这两类不确定性一一法律程序中的“不确定性”有两个重要原因,第一种不确定性是司法层面上的“技术不确定性:由于无所不在的信息匮乏、核实技术的欠缺,人们常常无法查明所需要的事实。而且,按照美国法学家J.N.弗兰克的看法,法律是内在含混的,变化多端的,人类不是上帝,没有预先创造出尽善尽美的纠纷解决规则,而且,当代的生产、交换、风俗、社会理想等因素变化剧烈,所以,法律制度必然是流动的、有弹性的、确定性有限的。第二种不确定性是广泛的“行为不确定性”,司法系统中的人员会徇私舞弊,侦查机关和公诉机关的人员,会为了晋升需要而制造冤案。当事人无法得知司法人员是否会偏袒对方而损害己方,这也构成了严重的不确定性。马克斯韦伯认为,法律本身是种执行社会规范的“强制机器”,“法律形式主义使得法律制度能够像一部具有技术理性的机器那样运转,因而保证制度内部的个人与群体拥有相对最大的自由度,并使他们得到越来越多的机会去预测自身行为的法律后果。程序变成了一种特殊类型的和平讼争,只服从不可侵犯的固定'游戏规则尽管不确定性难以避免,但是,理性的、正当的法律程序会极大地提高法律的可预期性,从而在一定程度上消除法律中的不确定性。由此,我们可以从个体理性选择的角度解释,为什么在“疑难案件”中,当事人会更加看重程序要求。因为这类案件本身的“法律不确定性”和“事实不确定性”都很大,故而,司法系统在这些案件中具有充分的自由裁量权。假如这种自由裁量权不能受到程序上的严格规制,那么它将会给当事人带来极大的不利。法经济学中通常用“诉讼的预期价值”来衡量诉讼当事人在一场诉讼中的期望净收益。法官出现的行为不确定性有两类,第一类是预先和当事人之间有亲密关系或敌对关系。第二类是收受当事人的各种形式的贿赂。其中,法官贪污腐化、收受当事人贿赂,整个博弈就会成为一种双方争相贿赂法官的囚徒困境博弈,带来社会福利的极大下降,从而使第三方裁决的优势彻底丧失。我们暂且对此最恶劣的情形不加考虑,仅考虑不存在回避制度,当事人和法官预先存在亲密关系或敌对关系的情形,由于当事人事前(至少得知法官是谁之前)并不知道法官到底和哪一方具有亲密关系,这就构成了一种原本应当避免的不确定性。我们以一个简单模型对这一思想进行描述:假设两人(X和y)为争夺财产而产生了纠纷。为简单起见,这一财产的总额标准化为1。两人均对此财产提出请求,并且要求分割该财产的一部分甚至全部。其中,X提出自己有权得到该财产的x比例,而y则提出自己有权得到该财产的Oy比例。其中,8,y0,1且+y>l0由于双方的期待比例之和大于1,故而构成争端。双方各自的目标是让自己所分割到的财产比例尽可能大。第三方则会依据法律规定,考虑各种因素做出分配决策,我们记第三方分配给X,y的比例是向量(Tx,Ty)o设X所能提出的支持己方的合法理由为向量二(al,a2,,am),y所能提出的支持己方的合法理由为向量二(bl,b2,,bn)o在考虑分配时,第三方会同时考虑X和y提出的理由,亦即第三方的决策函数是向量(al,,am;bl,,bn)的函数T(al,,am;bl,bn)=()(因输入原因,后文表述为Tx,Ty)o假设第三方裁判者通过对双方情况的了解、对具体法条的适用,可以得到的最正确分配结果为(*x,*y),其中,如果法官无偏私,则其错判的概率为p,正确的概率为(1p),其中,他错误地多判给X或y当事人S单位的概率均为p2(此处为简便起见,设0*i士s0,1,i=x,y)。故而,对于当事人X而言,他的预期收益为:但是,在法官出现行为不确定性的时候,他出错的概率将大于p,我们假设由于行为不确定的缘故,他出错的概率增加了r,因此,他错误地多判给X或y当事人S单位的概率为(p+r)2°故而,对于当事人i而言的预期收益是:假设当事人是风险规避型的行动者,则(*i)>r2u(*i+s)+u(*i-s),而由上面两式的表达可知:El(UI硝)=Ej(1/(硝)-ru(-5Q(6:+5)+#9:-故而在第三方裁判者有偏的情形下,当事人的预期收益会减少,其减少的数额相当于风险贴水。因此,我们可以理解为什么法治国家非常强调法官和执法者的无偏性,并规定了各种回避制度。同时,也可以理解为什么对于无偏性的要求不是没有限度的,事实上,人人都基于特殊经历而持有特定立场,绝对的不偏不倚不可能存在于现实中,因此,回避规则只能规避掉那些显而易见的偏私情形。如果规避无偏性的成本高于风险贴水(相当于无偏性的预期收益),那么就应当容忍并允许裁判者对中立性的少许偏离。正当程序原则的另一个含义,是要允许各方充分地发表意见,从而达到“兼听则明:在法律程序的运行过程中,双方都会倾向于充分表达对自己有利的理由,我们不妨假设参与人X和y的理由分别为a和b(更复杂的情况也与之类似),对参与人X而言,Tx(a,0)>Tx(O,0),Tx(a,b)>Tx(0,b);对参与人y而言,Ty(O,b)>Ty(O,0),Ty(a,b)>Ty(a,0)。我们应当注意到,即使这种表达最后完全不影响结果,“充分表达”对于双方而言也是各自的占优策略。故而,双方选择“表达”是严格占优纳什均衡。更进一步地,可以看出,即使双方的表达对最终的审判结果没有任何影响,亦即0Ti(a,b)=Ti(0,0),双方的最优策略仍然是尽量表达自己的意见。由此可以看出,充分发表意见是对抗式诉讼的内在要求,尽管双方的表达本身或许相互抵消,但每一方还是会偏好发出自己的声音。此外,当事人表达申述自己的理由,也会减轻对于未来结果的不确定感,毕竟在当事人的角度,通过表达可以澄清一部分事实,减少自己被冤枉或误判的可能性,这种对不确定性的消解,也是参与人偏好于充分表达的原因之一。从第三方决策的角度看,给予双方对等的表达机会,平等且充分地听取双方意见,也有利于做出最优决策。这是因为在第三方决策函数T(al,,am;bl,,bn)中,每个变量都对最终的判断结果起到合理的支撑作用,如果轻易删除其中任何一个变量,都会对最终的结果准确性造成损害,从而带来误判可能性的增加,因此,充分听取意见是一个程序上的必要原则。然而,任何优良制度本身也有不可忽略的运行成本,各方意见的表达也服从边际效应递减的规律,故而对于说明理由、信息披露、听取申诉等制度,以及行政程序中的听证制度,各国法律亦并非漫无限制,需要根据“成本一收益”权衡,进行必要的、合乎现实情形的具体规定。(二)正当程序的信号传递功能正当程序的另一个重要功能,在于对司法权力进行制衡,限制权力的恣意滥用。季卫东教授指出,“程序的对立物是恣意,因而分化和独立是程序的灵魂”,法律程序有一种“作茧自缚”的效应,“法院的判决最典型地体现了由程序所产生出来的既定力和自缚性:按照伯纳德施瓦茨对美国法律史的回顾,“权利法案”的制定目的,也正是为了防范立法机关滥用权力,防止行政官员滥用职权,防止多数人对少数人的压迫,以司法程序的方式限定和限制权力的运用,达成权力的自我约束,从而更为有效地捍卫和保障人民的基本权利。这对于法治传统的构建和形成,功莫大焉。从经济学的角度来看,“作茧自缚”的法律程序实际上可以看作是司法系统向外界传送的一个信号,即,通过这种方式表明自己的决策更有可能是无偏私的、准确公正的。因此,法律程序的基本原则,如独立审判、回避制度、过程的公开透明等,均有预先防止徇私舞弊的含义。故而,那些比较清廉高效的司法系统,会发送出恪守正当程序的清晰信号。而那些充斥着司法腐败的制度,则程序规则会被束之高阁。对于司法程序的当事人而言,他们会通过观察来推断司法系统是否清廉,从而导致不同的均衡结果。笔者以一个简单的信号传递博弈来模型化这一思想:假设一个社会中有两种第三方裁判者(清廉的和腐败的),其概率分别为P和1-P,双方都可以选择“遵循正当程序”(DP)和“不遵循正当程序”(NDP)。当选择“遵循正当程序”时,司法系统的声誉会增加,故其预期效用为b;但选择“不遵循正当程序”时,声誉下降,预期效用为a(b>a)o对于清廉的司法系统而言,无论它是否遵循正当程序都不会徇私;但对于(潜在)腐败的司法系统而言,无论它是否遵循正当程序,都有徇私的动机,但是,如果遵循正当程序,他的徇私更有可能被发现和处理。设徇私舞弊的效用增益为h,受到处罚后的负效用为fo因此,如果腐败的司法系统遵循正当程序,则所得为b+h-f,但如不遵循正当程序,其舞弊不易被发现,收益为a+ho司法程序的当事人可以观察到司法系统是否遵循了正当程序,他可以选择“接受判决”(Y)还是“不接受判决”(N)。如果在程序正当且司法者清廉的情况下接受判决,他的预期收益为OTi,若在程序正当但司法者腐败的情况下接受判决,则他将承受S的效用损失,总效用为OTis(我们这里着重讨论两个当事人中受损较大一方的选择,因为他是否选择上诉是上诉程序是否开启的关键)。假如在司法者清廉的情形下,当事人拒绝判决,则保留效用为L,而若司法者腐败,当事人拒绝判决的保留效用为H°可以合理地推断:在一般情况下0Ti>AL,因为清廉而有效能的司法系统,其判决相对准确,因此,拒绝判决得到更为有利结果的可能也会较小。当事人如拒绝判决或拒不执行判决,那么司法系统只能获得底线收益(此处为方便写作0)。在这个博弈中,清廉的司法系统有一个占优策略,即它总是会选择遵循正当程序(我们此处假设正当程序自身的运行成本不高,从而使b大于a)。因此,在以下两种情形中,博弈中可能存在分离均衡策略。(1)这一博弈的参数满足OTi>L,Ti-s<H,且满足b+h-fVO,则分离均衡为:清廉的司法系统选择DP,腐败的司法系统选择NDP,当事人观察到DP即推断裁判者是清廉的,接受判决,观察到NDP即不接受判决。(2)若0Ti>nL,且满足b+hfVa+h,则清廉的司法系统和腐败的司法系统仍然各自选择DP和NDP,但当事人均接受判决(但这种情形在现实中很难出现,因为意味着当事人即使被误判误罚也心满意足,不符合常识)。分离均衡的实际含义是:如果正当程序对于司法权力的运作产生了现实的、严密的约束,使得腐化的司法人员会因为程序的缘故更少作弊,或作弊后得到更大的惩罚,则正当程序可以作为一个有效的信号起作用。此时,人们对于正当程序的偏好,一方面会带来较好的实际收益;另一方面,使分离均衡更易实现。但是,若法律程序不能有效地约束住司法人员的腐败,那么所谓的正当程序就只能沦为摆设。例如,若b+h-f>O,Ti>Lo则无论是清廉的还是腐败的司法人员都会选择遵循正当程序,而此时当事人只能根据先验概率p来确定是否接受判决。若p0Ti+(l-p)(0Tis)>pnL+(l-p)nH,当事人会选择接受,反之则选择拒绝。一旦司法人员选择不遵循正当程序,则当事人立刻认为司法人员是腐败的,故而选择不接受判决。在混同均衡中,纯粹的正当程序偏好并不能起到正面作用,因为它使得腐败者冒充清廉的司法人员更加容易,这时,当事人确实更加容易接受对他而言不利的判决,但这种“对不利判决的接受”其实是对腐败者的一种纵容。由此可知,正当程序的确可以起到信号传递功能,但这种功能要起作用,必须是有前提的:它必须能切实地实行,并对权力形成紧密的约束。那些不具有此种功能的“程序”,无论它表面上是否符合各种“程序正义原则”,实际上都只是走一个过场,无法发挥实际作用。如约翰奥尔特所说,“程序性的正当程序,绝不仅仅是对技术上的一丝不苟的要求,它还具有动摇权势的潜在能力如果仅仅将程序当作是一种过场,不注意其约束权力的功能,那就会带来“程序空转”,用“走程序”“符合程序”来为违法滥权的行为披上一层合法有效的外衣,不可能让人们心悦诚服,自然也难以形成对法律的真诚信仰。四、程序偏好的演化论解释理论和实践都表明,人们对程序偏好可以相对独立于对于结果的偏好,并且,程序偏好的确可以使当事人接受对于他而言“不利”的结果。在下文中,笔者希望探讨这种偏好是怎样在演化过程中内化成一种固定的行为模式的。我们假设在法律领域中,有如下两个类型的参与人:A类型的参与人:只要法律程序公开、透明、裁决者无偏、公平听取各方意见,无论何种判决结果都接受。B类型的参与人:不管程序如何,只有有利于自己的结果才接受,凡不利于自己的判决结果一律不接受。当司法系统清廉的时候,A类型参与人的预期收益将不低于B类型的参与人,因为对于一个争议案件而言,无论如何判决,总会有预期的结果利益得不到满足的方。亦即,如果诉讼当事人均属于B类型,则他们当中至少有一个会不接受这种判决,由此会引起滥用上诉权的问题,并且生效的判决也难以执行,从而带来资源的巨大浪费和法律系统的失效,进而,B类型参与人的自身利益也难以保障。而A类型的参与人只看程序是否满足基本的正义原则,不对结果斤斤计较,总体而言,反而可能获得更加有利的结果。特别是若A类型的人组成一个群体,这个群体的竞争力将高于B类型的参与人,从而在演化中占据优势。我们可用如下模型来刻画这一思想。图2刻画了司法系统清廉且遵循正当程序原则时的情形:若两个程序主义者(A类型人)相遇,由于此时司法系统遵循正当程序原则,它所做出的任何决定,程序主义者都会恪守不违,因此两人的预期收益的均值(平均适存度)为e=ELu(Ti)=1/2Lu(Tx)+u(Ty)o当程序主义者(A类型人)遇到后果主义者(B类型人)时,后果主义者可能会对判决结果不满,设他不满的概率为P,当有人不满时,就会采取诸如上诉、拒不执行等手段,由此带来的预期收益损失为c。双方的预期收益为(1P)e+P(e-c)=e-Pc。而若后果主义者相遇,则必然会有人不满,因此双方的预期收益为e-c。此时,由于(A,A)构成一个严格纳什均衡,因此它同时也是唯一的演化稳定均衡,亦即,程序主义者不会被后果主义的变异所取代。当然,上面模型中的“后果主义者”的行为模式相对僵化,长期当中,后果主义者也会调整自己的行为,服从第三方裁判者的判决,亦即在外表上采取和程序主义者相似的行事方式。当司法系统腐败的时候,A类型参与人的预期收益有可能低于B类型的参与人。但他们也不一定会被B类型参与人完全排挤出局。这是因为,尽管B类型参与人遇到A类型的参与人会占据优势,但B类型的参与人互相博弈却有可能发生严重的内耗。故而会形成“斗鸡博弈”的态势。此时,A类型参与人和B类型参与人以一定比例混合,可以构成一个渐进稳定均衡。图3给出了司法系统腐败时的情形,此时假设该司法系统仍然在外表上遵循正当程序原则(对应于混同均衡)。程序主义者之间相遇时,仍会接受判决,收益各自为e。但若程序主义者与后果主义者相遇,后果主义者会向法官行贿以获得更大利益。设贿赂额度为bA,获益为s,s>bA.此时,A的收益会严格小于B。但若两个后果主义者相遇,他们会分别向法官行贿,设行贿额度为bB,但由于两人均向法官行贿,各自的预期收益不会增加(相当于囚徒困境或美元拍卖博弈的情形)。若bB>s,则B类型者之间会形成一个演化稳定均衡,A类型者无法在这个制度环境中生存。但若bB>s,亦即如果B类型者之间的纠缠和内耗过大,则会形成一个混合策略均衡,A类型者和B类型者可以在这个制度环境下保持一定的比例,其中A类型者占(bB-s)(bB-bA),B类型者占(s-bA)(bBbA)°通过演化博弈的复制子动态计算可知,这一状态是渐近稳定(asymptoticstable)的。由此也可知,无论司法系统清廉还是腐败,“程序偏好”都可能会在一定范围内存在。但是,若司法系统清廉,正当程序偏好会占据优势。若司法系统腐败,正当程序偏好即使在某些特殊情况下幸存,也很难成为多数人的选择,可见,从社会演化的角度来看,对程序公正的偏好,与法律运行的制度环境高度相关,营造“风清气正”的司法环境,才能使社会形成普遍的法律信仰,在此基础上,信奉恪守程序正义,严格遵守法律程序,才会成为真正意义上的社会共识。五、结论与展望本文主体部分的模型,其理论创见,实际上可以归结到一点即使我们一开始不假设人们有先验的、独立于结果的程序偏好,仅假设人们是偏爱有利结果的,从博弈参与人的理性选择的角度出发,我们会发现,如果公正的法律程序节省了参与人讨价还价的机会成本,减少了纠纷解决的不确定性,并且发送出裁判者清廉且有能力的信号,那么,对于公平、公正、公开的正当程序的社会偏好,就会逐渐形成并稳固下来。程序正义不仅是“看得见的正义”,而且也是“用得着的正义”,并且惟其“用得着”,其“看得见”才是有意义的。具体而言,我们的结论主要有如下三点:第一,独立于具体个案结果的、对程序正义的过程偏好的确可以存在,且在合适的环境和条件下,这种相对独立的过程偏好能够在演化中生存下来。第二,程序公正具有实质性的功能和作用,并非仅仅是形式上的。但是,这种实质上的功能和作用,需要一系列的制度保障才能实现。只有具备这些实质性的功能和作用,人们才会形成对它们的偏好。第三,人们的过程偏好可能是多元的,不同种类的程序偏好和结果偏好在演化的过程中可以共存,从而形成复杂的谱系。如前所述,对于程序正义的大量实证研究,主要是由社会心理学家完成的,社会心理学提出了若干种有代表性的对于程序正义的解释性理论,它们和本文所给出的博弈论研究框架,并不是对立的关系,其结论是可以相互印证的。例如,“声请理论”认为人们倾向于发出自己的声音,表达自己的意愿和诉求。这与本文第二部分论述“正当程序的表达功能”的博弈结论有很大的相似性。”关系模型”指出,程序正义反映了第三方裁判者与程序参与人之间的关系,裁判者通过正当程序发送了与参与人关系良好的信息,从而得到参与人的认可。这与本文的信号博弈模型也有一定的相似之处(但笔者认为其传递的更多的是司法系统清廉且有能力裁决争端的信号)。“群体价值理论”认为,程序正义的理念是在社会化过程中建立起来的,组织的新成员从老成员那里学习到程序的价值和理念。这与本文第四部分的演化博弈模型同样是在考虑程序偏好在群体中的扩散机制,在很大程度上也是并行不悖的。博弈论和社会心理学在研究中各有侧重,两者可以有很好的分工。总体而言,社会心理学家论证了人们基于“心理倾向”或“天性”而喜欢较为公平的法律程序,而博弈论则论证了人们在理性计算基础上的公平偏好,探讨了这种“天性”或“心理倾向”的社会演化基础。实际上,博弈模型论证了一个“底线状态”,亦即在“人们并不是天生喜欢程序公正”的前提下,公正的法律程序依然是值得不懈追求和捍卫的;而社会心理学理论则论述了在真实世界中、处于不同决策情境中的人们认同程序正义的现实的、复杂的、多元化的心理机制,两者相得益彰,其成果足以互补。关于程序价值的独立性问题,本文可以得到一个较为折中的结论:应当认为,“程序价值的独立性”只是一种相对的独立性,它是针对个案结果的独立性,而不是针对统计性结果的独立性。如果实体正义是指大范围的、统计性的案件审判结果,并且衡量统计性结果的方式满足必要的价值观要求(例如不能把冤案和错误成本忽略不计),那么,实体正义和程序正义就是难于分离的。在这个问题上,笔者比较偏向于规则后果主义或广义后果主义的看法,对于确定性规则的偏好在社会中是不可或缺的,但这些确定性的第三方裁判规则,又不是天然地具有“正当性”,其正当性必须根据基本的效能原则来加以确定。这一理论创见,也许会对当下中国的“程序法治”的讨论,起到若干启发作用。例如,朱苏力教授认为,中国人的正义观来源于政策、习惯、乡规民约、甚至是情理,很少来源于形式性的理性正义观念。冯象也认为,“在中国,由于司法的正义渊源在法律之外,法官必须采取相反的策略,模糊程序的界限,才能保证司法的效能。故'重实体,轻程序'不但是政治文化和心理传统,也是法律得以顺利运作,分配正义,法官得以维持民众信心,争取最低限度的独立的现实手段。”在相当一部分学者看来,中国人对程序正义的轻视,仿佛是一种历史文化的宿命。然而,“风物长宜放眼量”,根据我们上文的讨论,即使学界普遍认为中国传统法律文化偏重结果而不那么重视程序,即使现实的社会环境和一般民众的法律信仰也不那么尽如人意,即使对程序正义的偏好存在某种程度的“路径依赖”,但如果博弈的规则满足一些基本的现代法治理念,那么,随着人们的博弈,经过一段时间的社会演进,对于程序正义的支持和尊重也会蔚然成风。这种建立在程序公正基础上的普遍法治信仰,将会颠覆“法官无法让所有人满意”的陈旧见解(至少法官可以满足所有人的程序公正的预期),从而铺就一条充满现代法治精神的、通往美好社会与幸福生活的康庄大道。从而,在法律程序的构建中,我们应当密切注意程序的现实功能,例如对于恣意的限制、切实约束公权力、保障程序参与各方的理性选择、保证当事人的对话和平等发言机会、将决定过程进行反思性整合等等。笔者不同意把这些功能完全归入某个单一的价值维度之内,以致陷入绝对工具主义的陷阱,但也不可一味强调绝对独立于结果正义的“程序内在价值”,以致完全丧失了效率考量。本文的研究也表明,抛开过分细节化的“程序构建”不论,正当程序的基本原则有清楚的现实功能,并且惟因其有现实功能,方能使得具备了法律信仰、程序偏好的那一部分社会成员,在演化中得以生存下来,并且人数日益增长,从而又使得法律制度的运行具备坚实不拔的文化与信仰基础,在这样一个具有“正反馈”的循环之中,中国司法的程序公正性才能得以逐步提高。国外博弈逻辑研究述评摘要:博弈逻辑是博弈论与逻辑学相交叉的一个崭新的领域,它实际上研究的是参与者或行动者在互动过程中如何理性地选择策略和如何做出行动的逻辑。文章介绍了近年来博弈逻辑在国外的发展现状,梳理了博弈逻辑的发展脉络,针对现状展开分析,指出博弈逻辑目前的不足和将来的发展趋势。关键词:逻辑;博弈;动态近十几年来,博弈逻辑的研究有了长足的发展。国外对博弈逻辑的研究基本上形成了两个学派,一是通过静态系统研究博弈逻辑;二是结合动态逻辑研究博弈逻辑。后一流派是当今博弈逻辑研究的主流。2000年以来,博弈逻辑的研究在多个方向上取得了新的进展,本文将着重对主流学派的约翰范本特姆(VanBenthem)波利(PaUly)和帕里克(Parikh)、奥特罗(OtterIOo)等人的工作进行梳理,并予以介绍与评析。一、范本特姆对博弈逻辑的研究范本特姆从2000年开始至今一直致力于博弈逻辑的研究。在这十几年里发表了一系列论文,并出版了多部专著。本节梳理他本人在这方面的主要工作。2001年他在动态认知逻辑中的博弈一文中,在结构的“行动层面”和“结果层面”上讨论了完全信息和不完全信息的博弈:玩家的局部行动和他们在决策博弈结果时的全局能力。为此,他为二者匹配了相应的逻辑语言。特别的,在“行动层面”,不完全信息博弈自然地模型化了“动态认知语言”,并且发现这个语言的特殊公理和具有动态信息的玩家博弈的特定模型之间是对应的。在“结果层面”,文章提出了博弈均衡的概念和一些简单的表示结果。2002年他在作为进程模型的扩展博弈一文中以有穷双人博弈为主线,用带有匹配的互模拟概念的模态语言作为各种博弈均衡,从而分析了交互进程模型上的扩展博弈。文中的技术结果表明了怎样让现有的模态概念适用在这个新的设置中。最后给出两个主张:第一,扩展博弈是自然进程模型,不需要外来的新形式体系就可以支撑很多熟悉的模态逻辑。第二,互模拟分析作为逻辑进程理论的标志,可以应用于多种博弈结构中,为研究各种博弈均衡提供了正确的方法。2003年他在逻辑博弈对博弈逻辑是完全的一文中,首先描述了逻辑赋值博弈中的一阶赋值博弈和模态博弈。第二将事关系定义为一-种广义的传递关系并证明这种关系具有单调性、一致性和确定性。第三给出了三个博弈运算:选择,对偶和复合并利用这些运算定义了博弈语言及博弈模型,由此描述了动态博弈逻辑PGL,然后证明了博弈代数可公理化。第四证明了一般的博弈运算代数恰好与逻辑赋值博弈一致,而后者更具有一般性。第五证明了乘积博弈G(H具有单调性和一致性。2003年他在IF博弈的认知逻辑一文中将JaakkoHintikka的工作汇集成两个视角:博弈语义和认知逻辑来分析独立友好(independentfriendly),简记作IF博弈,其目的是为了把逻辑和博弈二者联系起来。本文以博弈和逻辑的融合为出发点,介绍了一阶赋值博弈,独立友好博弈和不完全信息,从逻辑、博弈论、可能性和预期应用方面讨论了独立友好逻辑。最后他强调人们既可以通过标准的静态认知算子解释任何独立友好的著作,当然还可以通过旋转木马式地系统研究博弈,而独立友好逻辑为研究不完美信息逻辑和信息流逻辑提供了一个有吸引力的场所。2005年他在在逻辑和博弈中的开放问题一文中首先指出:逻辑和博弈可以以几种不同的方式相互融合,如逻辑博弈和博弈逻辑。他认为:论辩本身就是一种博弈,论辩双方可能会赢或输。在逻辑博弈中,除了语义或演绎基础外,有效性还具有一种类似于博弈中的获胜策略。而博弈逻辑是以分析博弈为目的而设计的逻辑系统。本文结合模态逻辑、博弈运算探讨了动态博弈逻辑,提出通过增加博弈对偶算子来彻底公理化动态博弈逻辑。不仅如此,本文还探讨了关于知识、信念和更新等问题。为了寻找一个更一般的可以确立系统均衡理论的认知特征的逻辑,随后作者探究了动态认知逻辑。最后,作者总结了他对逻辑和博弈论交界研究的最新方向和开放性问题。本文最大的特点是:贯穿全文,作者提出了40个有关在逻辑和博弈中的问题。如问题20:使用DEL去分析博弈论均衡的国外博弈逻辑研究述评各种不完全信息博弈概念。2003年他在IF博弈的认知逻辑一文中将JaakkoHintikka的工作汇集成两个视角:博弈语义和认知逻辑来分析独立友好(independentfriendly,简记作IF)博弈,其目的是为了把逻辑和博弈二者联系起来。本文以博弈和逻辑的融合为出发点,介绍了一阶赋值博弈,独立友好博弈和不完全信息,从逻辑、博弈论、可能性和预期应用方面讨论了独立友好逻辑。最后他强调:人们既可以通过标准的静态认知算子解释任何独立友好的著作,当然还可以通过旋转木马式地系统研究博弈,而独立友好逻辑为研究不完美信息逻辑和信息流逻辑提供了一个有吸引力的场所。2005年他在作为互动的认知过程一文中说明了很多认知活动都是不可避免的社交,包括在几个不同主体之