策略互动与产权的界定.docx
策略互动与产权的界定一个非完全信息动态博弈模型及其应用李军林* 中国人民大学经济学院;通信地址:中国人民大学经济学院,100872;电话:01062511102;Email:junlin.lee。本论文的写作得到了中国人民大学国家经济学基础人才培养基地的项目资助。作者十分感谢两名匿名审稿人对本文提出的极具建设性的修改意见,使本人对论文重新进行了认真地思考,并更正了文后一些数学推导与证明的不严格之处及错误。特别要提及的是姚洋博士对本文关键问题的处理意见,作者深表谢意。当然,作者对文中的观点及可能出现的错误负全部责任。1事实上,我国经济体制改革的现实也基本上验证了这一点,在更多的情况下,一项新制度的产生往往都是不同种势力集团较量(博弈)的结果。在博弈论中,“不同的势力”可以通过策略的差异性反映出来。内容提要:本文了构建一个非完全信息动态博弈模型,对一个有限经济(economy)内部行为主体的一项基本权利(如产权)的界定与实施过程给出了一种解释。与以往一些博弈论专家在分析制度(尤其产权制度)及制度变迁不同的是,本文在博弈模型中通过非完全信息的假设,引入行为主体策略的差异性。本文给出的结论是:制度是不同的行为人与政府之间的博弈均衡。在文中我们使用的是一种混合均衡的概念对称完美贝叶斯均衡。最后本文对相应的结论给予了一个现实的说明,并指出了模型可能的进一步发展方向。关键词:产权 动态博弈 对称完美贝叶斯均衡从经济学的角度认识分析一项产权,其含义是指由人们在交往过程中(如对物的使用与交换)所引起相互认可、相互遵守的行为准则。产权产生于人类行为的一种自然倾向,即为了控制、保护和占有那些有价值的稀缺物品或资源,也可以说它总是与一些有价值的资源相联系着的。而产权制度是用来限定或保护行为主体在经济交易活动中如何受损、受益的一种基本制度。按照产权学派的分析逻辑,经济双方行为主体的一切交易活动在本质上都可以被认为是一种权利束的相互交换。在已有的一些文献中,不少博弈论专家在分析制度(尤其产权制度)及制度变迁时,都把制度(主要是正式制度)当作是政府和作为一个博弈者公众之间的博弈均衡(Frohlich, Oppenheimer, and Young 1971;Sugden, 1986; Riker, 1990;Aainsworth and Sened, 1993)。一方面,这无疑为人们研究(产权)制度及制度变迁找到了很好的研究方法和研究方向;但另一方面,这种把众多公众抽象成为一个博弈者的假设,在相当大的程度上就忽略了在具体博弈中众多行为主体之间策略性行为的差异性。现有的研究分析已经表明,即使是同类的行为主体,由于他们在资源、权利以及其它禀赋等拥有关系上的不对称,就会使得他们在博弈中的策略行为存在很大的差异,而博弈最终的某个均衡结果,很可能就源自于这种行为人策略上的差异性(Osborne and Rubenstein, 1990)。在本文,我们将在一个有限的经济群体中,通过引入行为主体策略的差异性,构建一个非完全信息动态博弈模型,并给出一个关于行为主体之间的基本制度(如产权制度)得以界定、保护和实施(enforcing)的一般性理论解释。本文认为:制度并不是政府与同类行为人之间的博弈均衡,而是维护旧制度的行为人和用新制度挑战旧制度的行为人及政府之间的博弈均衡。在多数情况下,一项产权制度的建立来自于人们对相关公共产品问题的一种可能的解决方案,如污染问题、公共牧场问题,公海渔业问题,采矿权问题,农业用地制度问题,等等。因此,只要物品没有被实施一项产权,那么这些物品就是公共的。解决这类问题一种常见方法就是政府的介入:对相关物品实施保护,从而界定出明晰的产权结构来,这样公共产品就变为私人产品了。现有的一些对历史经验的研究文献已经表明,政府赋予并实施产权是可以获得其在政治上的支持和提高其税收收入(North,1981;North and Weingast 1989;Levi 1988;Sended and Riker 1992)。但是,已有的相关文献也表明,法律和政府对于有效率的产权关系的确定既不是必要条件也不是充分条件(Grossman,2001)。历史上,政府建立起无效率产权的例子也比比皆是。本文认为,由于对行为人(或群体)的实际行动、偏好以及其它方面判断存在着信息的不对称,政府就有可能赋予了本来不该赋予的无效产权制度。笔者将用文中所给出的均衡概念对此给予解释。本文安排如下。第一节中我们构建了一个经济,描述了公共产权转变为私有产权的界定过程,并认为由于存在着信息非对称,政府就有可能赋予了本来不该赋予的无效产权制度。在第二节,我们通过构建了一个非完全信息动态博弈模型,对上述经济中的产权界定过程给出了一个证明,该节是本文的主要内容。第三节是应用模型所给出的结论对我国一些现实问题所进行的讨论,同时指明了本文的进一步研究方向。一、 一个有限经济内部的产权:公共草地的放牧问题不失一般性,让我们把目光放在一个由有限个行为人(公众)所组成的群体之内,并假设存在一个政府。在这个群体内部的有限行为人拥有一项共同的有价资源草地,由于草地最初处于公地状态,因此,群体中的每个成员都会利用这项共同资源,如他们都会到这个共同的草地中去放牧。如果每个行为人都单独行动,他们是必会陷入“公地灾难(tragedy of the commons)”的囚徒困境中去。1 尽管在小的群体内,由于人数较少,资源相对人们的需求而言可能不会稀缺;而且人们之间彼此熟悉,相互见面,一些非正式约束在资源的配置上一般都很有效,但这不是我们分析的重点,因为群体中的人数总是要增加的。本文假设群体中的人数足够地多,以致于个人行为的信息及对个人的非正式约束(如使他们的名声扫地)都不足以抑制对公共资源的过度使用。结果,就会出现过度放牧和土地的退化。我们不妨把这个经济的初始条件设定为:假设群体内行为人最初对草地的拥有权利是根据对草场占有的先后(Prior Possession)来划分的。很显然,在没有政府实施和保护的情况下,这种权利就不具有排他性,势必会出现一部分人对另一部分人的权利的侵犯,如到其他人已经占有的草地中去放牧,等等诸如此类损害他人利益的行为。在这种情况下,某种执行外在规则的权威机构就很有好处:在我们的这个例子中,就是政府对公地的产权进行界定,使处于公共领域的权利得明确界定。2 有关这方面的一个经典案例是:在1848年-1880年之间,美国西部发现了储量十分丰富的金矿和银矿,成千上万的淘金者蜂拥而至,在这块土地上随时有可能爆发毁灭性的冲突,但产权的合同订立过程也随即发生。为避免潜在的公共地损失,这些采矿者以相当和平的方式确立了对金矿的一个又一个的权利,而这些对金矿的权利配置随即被州和联邦法律采纳。本文与此不同的是,行为人与政府之间的非完全信息。因此,在这个群体中就会出现两类行为人:一类是希望政府以法律的形式保护和实施目前的产权,以确保其他人不能到自己的草地来放牧。另一类人对产权的界定持中型或否定态度,如果政府不实施或保护现有产权的话,他们可以到其他人的草地去放牧;如果政府对现有产权进行实施保护的话,他们也是受益者,因为其他人也不会在他们的草地来放牧。 因此,群体内的一些行为人现在的选择就是向政府申请提供对他们的产权实施保护,以确保他们的利益不受损失。在我们的这个经济中,由于假设行为人对草场的最初拥有是以占有草场的先后为原则的,这就为政府对产权的界定带来了一定的信息问题,如不太容易确定出某块草地是否真正地被某个行为人所预先占有,进而对一些行为人的申请策略真正意图也不是完全清楚。所以对自己所界定的产权是否真正有效率,也不得而知。因此,产权双方信息的不完全,是政府不能赋予有效率产权的一个重要原因。但产权一旦被界定,则公有产权就转变为私有产权。尽管已有的相关文献也表明,法律和政府对于有效率的产权关系的确定既不是必要条件也不是充分条件(Grossman,2001),但Umbeck认为,产权出现的必要条件之一就是存在一个对法律的创造与实施拥有垄断权力的代理机构(Umbeck,1978,1981)。同样,Barzel也认为,个人产权的产生,垄断、合法并惩罚侵占行为的国家暴力是必需的(Barzel,1998)。不言而喻,作为国家政权垄断者的政府在产权制度的演进过程中起着不可或缺的关键作用。由于政府是为行为人提供各种安全保障作用的,前提是她从行为人那里获取收益或政治上的支持。下面我们就以一个非完全信息的博弈模型来解释该经济中产权制度的界定。二、 非完全信息动态博弈模型1、对模型中政府行为偏好的一个说明。社会契约的本质特征已在现代经济学家中间取得了广泛一致,社会契约应有以下内容:建立产权的规则、对侵犯产权行为实施惩罚以及相应的税收制度,并且通过这种税收制度使得每个行为人都为促进和维护这个产权制度做出各自的贡献。在我们下面构建的模型中,我们把政府假设为一种既具有追求一般利益偏好、又具有追求特殊利益的行为主体。政府以法律(令)的形式向公众(社会)赋予并实施一项权利(如产权) 为了在概念上不引起歧义并考虑到习惯的称呼,我们把实施保护的权利称为产权,未经保护实施的称为是一项权利。本文中所述的权利和产权有时含义有些重合。事实上,我们在文中所谈论的产权是具有一般意义的,可以抽象地理解为行为人的一项最基本的权利。,其目的是能从这种权利中获取收益,这种收益既可以是一种政治上的支持,也可以是一种实际的税收收入。毫无疑问,一国经济增长的一个前提条件就是要有一个界定明确的基本产权制度(North,1990),因此,从某种意义上讲,政府界定并实施一项基本权利制度,可以保证一国的GDP的最大化和政府收益最大化之间存在着一致性。也就是说,政府的利益最大化与一国GDP的最大化是统一的,界定明晰的产权制度无疑是GDP最大化的前提,在其它条件不变的情况下,政府一定会尽力使她的征税对象国民收入最大化,这样就可以同时提高政府的税收和人民的生活水平。2 在诺思的国家理论中,国家也有两方面的目标:一方面要使自身的利益最大化,另一方面国家由于可能潜在竞争者的存在,又必须实施和保护有效率的产权制度以使社会总产出最大化,从而获得更多的政治上的支持。因此,国家对一项有效率的产权的保护是持积极态度的。在本文,我们把政府当作一种提供保护和公正而获取收益的行为主体(或组织),并把政府向公众(社会)赋予并实施一项产权的过程模型化为政府与有限的、有差异的公众进行一场动态博弈。若无特别说明,本模型中的政府收益主要是指税收。2、对所构建模型的一个说明现在的问题是这样:由于在这个群体中缺乏对某项权利的实施和保护,一些行为人的利益就受到了侵害,他们期望向政府申请赋予他们这项产权以使其免于受损或受益。由于向政府申请产权是要支付成本的,而产权又具有公共产品的性质,它一旦被赋予,其收益人就不仅仅是那些申请人了,势必还存在着其他潜在的受益者,甚至是免费“搭车人”(free riders)。因此,在一定的行为人社会群体范围内,是否向政府申请产权、究竟谁向政府申请产权,同时也是一个“集体行动”(collective actions)问题。对政府而言,假设实际申请人的数量存在一个临界值,其含义是:对政府而言,当它观察到申请人数大于时,则赋予一项产权是一种有利可图的行为,即获取的收益(即税收)要大于政府对产权的实施成本;反之,若政府观察到申请人数小于时,则不能从赋予产权中获取收益,或者说,赋予产权获取的收益无法弥补其实施成本,因而对那一部分行为人的申请行动不予以理睬。3 现实情形也基本如此。政府是否实施一项政策,它首先要了解公众对这项政策的真实需求状况,其次它应知道这项政策能否为它本身及整个社会带来经济收益及经济的增长。本文中,从政府的视角而言,我们把这种政府做判断的标准抽象为一个参数,其意义如文中所述。当然,的大小会随着现实中政策所带来的实际经济绩效发生改变的,典型的情形就是我国改革初期农村土地承包法的逐步实施和推广。 本文中,我们假设政府对行为人是否申请产权是不完全信息的,也就是说,在政府所面对的这个行为人群体中,它无法确定那些行为人是产权的实际申请人。本文行为人策略的差异性表现为:在整个群体内,一部分行为人是产权的真正申请者,一部分不是。因而,行为人的博弈策略是有差异的。Palfrey和Rosenthal(1984,1985)给出的关于一个群体内部是否能供给使这个群体受益的公共品的参与博弈模型(participation games model)1该博弈模型的基本形式,可见张维迎:博弈论与信息经济学,第118页,第254页,及Palfrey and Rosenthal, 1984.“Private Incentive in Social Dilemma: The Effects of Incomplete Information and Altruism,” Journal of Public Economics 28: 171-93;Palfrey and Rosenthal, 1985.“Voter Participation and Strategic Uncertainty,” American Political Science Review 79: 62-78.,给了我们很大的启发。模型大致为:在有一个由n个行为人组成的群体中,如果一种公共物品被供给,那么每个行为人都将得到b=1的收益。行为人是否参与供给活动,属于私人信息,而这种公共物品被提供的充分必要条件是至少有个行为人参与供给活动,每个参与人所承担的成本都是c,其中0<c<1。显然,这时参与人的净收益为b-c>0。Palfrey和Rosenthal的结论为:对任意的值,存在着三种类型的均衡解。第一种类型就是所有的行为人都不参与公共产品的供给,这时所有行为人的净收益都是0,这是一种均衡。第二种均衡就是刚好有个行为人参与公共产品的供给,其他行为人没有参与。这是一种行为人纯策略博弈均衡,其中供给者的净收益为b-c,“搭便车”者的净收益为b。在这种均衡中,具有相同的支付结构的行为人采取了不同的策略。由于行为人要被确定谁是个供给人中的一员,可以说,实际达到这个均衡会有一个十分复杂的过程,应该需要一个较强的其它条件作保证。第三种均衡是混合策略(mixed-strategy)类型的。其中尤其令我们感兴趣的是被称作“对称混合策略均衡”(symmetric mixed-strategy),它指的是所有的行为人都使用同样的混合策略,而且这种混合策略使得在均衡中所有行为人在公共产品的供给与不供给之间无差异,这是由于行为人之间存在着不完全信息所致。给定博弈中的这种无差异,每个行为人觉得还是采用其他行为人都采用的这种混合策略为好。对称混合均衡的一个令人关注的特点就是每个行为人都使用相同的策略,同时他也相信其他的行为人也都使用这种策略。在我们随后所构建的模型中,其混合均衡也具有这样的性质。我们会给出这种均衡的一个较为准确定义。Palfrey和Rosenthal的参与博弈模型中,意图很清楚:只要有足够多的行为人参与供给的话,公共产品就会被自动地生产出来。有些公共产品是这样的,可是有些公共产品的供给就不是这么简单了,它们必须要有第三方行为主体强制地实施,才可被供给出来,我们所要分析的行为人之间的权利制度无疑就属于这一类型的公共产品。在下面所构建的一个二阶段动态博弈模型,可以说是对Palfrey和Rosenthal参与模型的一个改进和拓展。在我们的模型中,存在第三方行为主体政府。3、博弈模型的构建依据前面我们描述的经济,模型构建如下。设N=1,2,.n为n个行为人组成的行为人群体集合,i表示第i个行为人,iN,同时假设存在一个对权利的执行实施机构政府。由于这众多的行为人在资源禀赋、权利拥有以及行为偏好可能不尽相同一致,2由于我们所构建的经济中是根据对草地占有的先后(Prior Possession)原则来划分草地的拥有关系的(即最初的产权),因而不同行为人所拥有的草地大小及质量当然是不一样的。因此,这些行为人在策略上是有差异的。由分析的问题可知,一项权利对不同的行为人所带来的收益是有不同的。考虑到行为人偏好的特征属于私人信息,对于其他行为人而言具有不确定性,因此,我们不妨把这n个行为人划分成两大类:一类行为人预期到一项政府赋予的权利可使他们获取bi=1的收益;另一类行为人是预期不到权利收益,即他们认为bi=0,iN。我们称第一种行为人为bi=1类型的,第二种行为人称为bi=0类型的。3 bi=0及bi=1是我们所做的一个必要技术处理。其含义为:bi=0类型的行为主体,是指那些在政府没有实施权利之前,可以侵占其他行为人的权利而获取利益的人;bi=1类型的可能就是被侵占的行为人。在一项权利被实施以后,由于有惩罚机制,bi=0类型的行为人就要尊重他人的权利了,但这也要支付成本,再考虑到实施一项权利对他们也有收益的(如其权利免于被侵占),因此,我们不妨假设这类行为人的收益为0;而bi=1类型的行为人是权利被实施以后的直接受益者,我们不妨假设其收益为1。现实中与此相类似的另一种情形就是一个带有外部性问题的经济(an economy with externality),如污染问题。因此,我们把行为人的类型集合记为Ti=0,1,iN。用Si=0、1表示行为人i的纯策略集合,siSi,si=1表示行为人i向政府申请产权的策略,si=0表示不申请的策略。用q表示行为人i是bi=1类型的概率,那么1-q就表示行为人i是bi=0类型的概率,记q=pr(bi=1),1-q=pr(bi=0),1由于所有行为人的偏好特征对政府及其他行为人而言是属于私人信息,因此,我们不妨假设这个概率对所有的其他行为及政府而言都是相同的,也就是说政府和所有行为人对任意的bi=1类型的行为人都有共同的先验概率,即q=pr(bi=1),对N。对N。令向量b=(b1,b2,.,bn)表示n个行为人属于各自类型所对应的收益向量,其中bi0,1,pr(bi=1)=q, pr(bi=0)=1-q。定义集合B(b)=iNbi=1,B(b)表示所有属于bi=1类型的行为人的集合,设其总人数为,即=|B|。由于我们要考虑的是政府对一项权利的实施界定过程,那么,政府所面对就是谁申请权利,多少人申请权利。因此,对任意的行为人i,我们定义如下这种特殊的混合策略i,i为行为人的类型集合T=0,1到实数区间0,1的一个映射,即i:Ti=0,10,1,或者表示为一有序的数对,即i=pr(si=1|bi =1),pr(si=1|bi =0)。记i(bi)=pr(si=1|bi), biTi,对N。i显然就是对不同类型行为人申请权利的一个完整概率描述。令i表示行为人i的所有上述混合策略的集合,即ii,其中i =0,1×0,1。作所有i的笛卡尔积,得=1×2×···×n,用表示中的元素,那么显然就为向量组合(1,2,.,n)。 同样,我们用s表示所有行为人的纯策略组合(s1,s2,.,sn),那么可知,s就是的一个退化值:对N,当pr(si=1|bi=1)与pr(si=1|bi=0)的值为0或1时,的值就为s。令集合A=A()=iN|si=1,si为行为人i的纯策略,s=(s1,.,sn),它表示向政府申请产权的所有行为人的集合,与s的关系如上。集合A的总人数记为,即=|A|。用0<ci<1表示行为人i的申请成本,我们不妨假设对所有的行为人而言,他们的申请成本是相同的,即对i,jN,ij, 有ci=cj,记为c。由于政府的行动要视行为人的行动而定,在我们的模型中,也就是集合A的人数的多寡决定政府的行动。我们用g表示政府的行动,g(A)=1表示政府赋予并实施一项产权;g(A)=0表示政府不赋予产权。用0<<1表示政府的税收比率,即从每个产权受益者那里获取税收收益的比率,那么,政府的总收益就应是从产权的所有潜在受益者那里所得到的总税收,记为bg。根据前面的讨论,有下式成立:bg=,=|B|为产权实施受益者的人数。2尽管更为现实的情形是政府对所有的行为人都应该收税,但在决策一项政策是否实施,政府首先要考虑就是这项政策的受益人是谁、有多少。因此,本文中我们仅考虑政府对所有受益人的收税。令cg表示政府对产权的实施成本,它一般是指政府在实施法律(令)时的必要支出等。显然,政府的净收益为: bg-cg=-cg。我们假设cg,q,c和为共同知识(common knowledge)。还假设所有的行为人在行动开始时都有一个共同信念f(),它表示对于任意给定的KZ=0,1,2,n,刚好等于K,其概率的密度函数。3此处仅仅是为了理论上的假设需要,函数的具体形式无关紧要,并不影响我们后面的分析。这个由n个行为人和一个政府所构成的博弈模型我们记为,它就是下面的2阶段动态博弈:在博弈的开始,“自然”首先选择每个行为人的类型bi,biTi=0,1;第一阶段:行为人根据他的类型选择他的策略ii并以此策略采取行动;第二阶段;政府选择它的行动g(A)0,1;最后有个实施问题:即给定政府的行动g,行为人决定是否尊重他人的这项权利(产权)。笔者曾详述了这个实施问题的结果(李军林,2000):即如果政府决定实施一项产权的话(g=1),那么政府用强制的法律(令)等手段对任何不尊重产权的行为人的“处罚”就是可置信的,而这种“处罚”又足够重,以至于任何理性的行为人是没有必要违背法律(令)去侵犯产权的;当然,若没有政府的实施,行为人也不会相互尊重他人的权利,一项产权是建立不起来的。对现实中发生的一些行为人侵犯他人产权的行径,它属于一些小概率事件,在本文的分析中忽略不计,事实上,这并不影响本文所给出的一般性结论。因此,该博弈的实施问题的结论是肯定的,即政府实施产权,那么行为人都会尊重它。我们可以把政府与行为人的支付结构概括如下:政府的支付为: ug(g)=行为人i的支付依其类型而定,可表示为:由于受益人的人数对与于政府而言是不确定的,因此,我们只能分析ug(g)的期望支付,记为g(A,),很自然,我们定义:g(A,)=E(ug|(·|A,)),表示的是支付ug(g)的期望值,其中(·|A,)是政府关于一项产权受益者人数的后验概率(posterior beliefs),根据贝叶斯法则: (|A,)= (1)(其实也就是,(|A,)= =)(1)式中,pr(|q,n)为政府关于受益者人数的先验概率,表示的是n个行为人中有bi=1收益的受益者人数为的概率判断(当然这个行为人属于bi=1类型的概率都为q,这一点也是共同知识);pr(A|,)为条件概率,表示的是在个行为人中,向政府提出申请产权的所有行为人集合为A的概率判断,这些行为人的策略为向量组合的某些个分量。从这里我们也可以看出前面所定义的行为人i的混合策略i的意义所在。(1)式表示政府关于产权受益者人数的后验概率是根据贝叶斯法则(Bayes Rule)来进行修正的。我们知道,数理统计学中的贝叶斯法则是行为主体修正信念的唯一合理方法。这时,政府的期望支付g(A,)=E(ug|(|A,)就可以写为: (2)在(2)式中,若政府的决策变量g=0时,则=0,因此,我们就把分析的焦点放在g=1上。记,把(1)式代入该式,可得 (3)也就是说,在政府赋予产权的情况下,它的期望支付为:总收益的加权平均值减去政府的实施成本cg,其中权重为政府关于行为人的后验概率(|A,),0,1,2,,n。设C为行为人集合N的所有子集所组成的集合。1在集合论中,C被称为N的幂集(the power set of N),显然也有NC。且令集合W(g)=AC|(g|A)=1,该集合是由所有能使政府赋予产权的那些申请人集合所组成的集合。很显然,W(g)应是C的一个子集,即W(g)C。由于所有行为人的策略都是依赖于行为人的类型,因此,对于该博弈的任何行为人i而言,他的期望支付为vi(,g,bi)=E(ui|,g,bi),由前面行为人的支付结构,我们可得出行为i的期望效用为:vi(,g,bi)=E(ui|,g,bi)=(1-)·(bi)·pr(AW(g)|)-ci·i(bi)为了能使下面的分析讨论更加清晰,我们用本文模型中的变量把博弈论中的一个重要均衡概念-完美贝叶斯均衡(perfect Bayesian equilibrium)重述一遍,后面我们要使用这个概念。2有关完美贝叶斯均衡的一般性定义,可见张维迎:博弈论与信息经济学,第311312页。定义1:向量组合(*,g*,(·)是一个完美贝叶斯均衡(perfect Bayesian equilibrium),如果它满足以下三个条件:(1)对bi0,1,有i(*,g*)i(-i*,i,g*),对N,ii;(2)给定*,对AC,都有g*(A)=g·(g=1|·|A,*);(3)对0,1,2,n,如果pr(|A,*)>0,那么后验概率(|A,*)是通过贝叶斯法则得到,即(|A,)=, 该均衡简记为PBE。显然,上述定义的条件(1)是说在给定了政府和其他行为人的策略,行为人i的策略最大化其期望支付;条件(2)是说在给定了政府的信念(belief),政府的策略g*使其期望支付最大化;条件(3)表明政府的后验概率(posterior beliefs)是由它的先验概率(prior beliefs)和行为人的策略根据贝叶斯法则修正得来的。这个定义说明政府的信念或概率(beliefs)是在均衡路径上的(equilibrium path)。这时就会产生这样的问题:如果政府根据它的信念,观察到一个零概率事件发生了,即*=0=|i(bi)=0,bi0,1,iN,但是A。对这类问题我们就利用直觉原则IC(Intuitive Criterion)进行处理(Cho和Kreps,1987,及张维迎,1996)。按照IC原则,这意味着后验概率(bi=1|si=1)=1,且(bi=0|si=1)=0,也就是说,政府关于发生的这种非均衡路径上的零概率事件被处理成为政府认为bi=0类型的行为人申请产权的概率为0。这样就把一些不合理的劣策略剔除出去(如在本文中,bi=0类型的行为人申请产权就是一种不合理的行为),对政府在非均衡路径上的后验概率作了更严格的限制。4、博弈模型的均衡(解)模型与前面介绍的那个由Palfrey 和Rosenthal给出的“参与模型”(participation games,简记为PR模型)在结构上是基本一致,只不过在中加进了一个特殊的行为主体-政府。比照一下PR模型,此处政府就相当于公共产品-产权的最终生产者和实施保护者。只要参与人数达到一定的规模以后,政府就会把这种特殊的公共产品-产权制度供给出来1在PR模型中,一个暗含的假设就是只要供给人达到一定数量后,公共产品就会自动生产出来,正如我们前面分析的那样,有些产品是这样。有些却不是这样,它必须要有一个最终协调人。因此,行为主体在进行策略选择时,首先要考虑的是产权制度能否为其带来收益,从而决定他是否申请产权,作为公共产品的产权制度,有时不申请也可能为其带来收益,这一点与PR中的行为人策略选择并无二致。政府在模型中只是起到对产权的实施保护作用,对行为人而言,就是产权制度确定以后,他们是否遵守这项制度,这一点我们在前面已经分析过了,答案是肯定的。从而可知,模型和PR在结构上与行为人的策略选择上是基本一致的。因此,模型也有三种类型的均衡解2事实上,我们只要把PR模型中求解的方法应用于我们的模型,也可以得出同样的结论。本文限于篇幅,就直接把结论给了出来,有兴趣的读者,可参见:Palfrey和Rosenthal,1984,1985.。第一种类型均衡就是所有的行为人都选择si*=0,N,这时政府的选择为g*=0,即无人申请产权,那么政府也不赋予产权。第二种类型均衡是n个行为人中恰好有个行为人申请产权,这时政府赋予产权,其中,为政府决定是否赋予产权的临界值,这时,个行为人使用的是纯策略si*=1,g*=1。第一种均衡结果的现实意义一目了然,就是产权制度没有建立起来,本文就不予以重点分析。第二种均衡结果的达成,中间要经历很复杂的过程。因为要在n个行为人中确定刚好有个行为人申请产权就是一项不容易的结果,本身就是一个复杂繁琐的博弈过程,尽管这种均衡也意味着一项产权制度的建立,但其过程却是另外的一条途径,本人将有另文详尽分析论述。以上两种均衡都是纯策略均衡,这个博弈一定存在第三种类型的均衡-即所有行为人都采取混合策略且政府采取相应纯策略的混合策略均衡(Wilson,1971及张维迎,1996,第111112页)。这是本文主要关注的均衡结果。事实上,可以看出,我们所构建的博弈模型是一个对称博弈,即n个行为人都面对着相同的博弈对象与相同的支付结构,至于政府,它只不过是产权制度的最后确立者和实施者,对其它每个行为主体而言,这种作用也是对称的。对称博弈的一个最显著特点就是其混合策略均衡中的所有行为人(政府除外)的(混合)策略均衡也是对称的,即所有行为所采取的混合策略都是相同的1关于这个结论见张维迎著:博弈论与信息经济学,第259第273页相关问题的分析讨论。因此,本文模型中的混合均衡一定是对称的。下面的定义、引理、定理及结论给出这个博弈的结果。引理、定理及结论的证明见附录。引理1:如果向量组合(*,g*,(·))为博弈模型的一个完美贝叶斯均衡(perfect Bayesian equilibrium)的话,那么,对N,必有(0)=0。这个引理是说,在博弈的混合均衡中,bi=0类型的行为人并不向政府申请产权,其现实意义就是预期不到收益的行为人,当然不会主动积极地申请产权,只有bi=1类型的人申请。这样,我们就可以把行为人的一些不合理策略剔除出去,对政府在非均衡路径上的后验概率作了更严格的限制,以简化我们的分析。但在这种贝叶斯均衡中,由于行为人的策略是类型依赖(存)的,而每个行为人的类型(是bi=0类型还是bi=1类型)又只有行为人自己知道,因此,当所有行为人都采取混合策略时,政府就无法确定某个行为人是否申请产权。在本文中,由于是对称的,因此,该模型的混合均衡-完美贝叶斯均衡(PBE)也一定是对称的,下面给出其定义。定义2:向量组合(*,g*,(·)是博弈的一个(行为人)对称完美贝叶斯均衡(agents symmetric perfect Bayesian equilibrium,简记为SPBE),如果它满足:对任意的行为人i,jN,ij,都有*i=j*成立。这个定义意味着,在的混合均衡中,对称的行为人之间在博弈策略上是无差异,即所有行为人都采取相同的混合策略,这是对称博弈中混合均衡的一个特征。由于博弈为对称的,且bi=0类型的行为人不申请产权(因为在均衡中,i(bi=0)=0),因此我们就只着重分析行为人的均衡策略i(bi=1)。这样对于每一个而言,我们就可以设:i(bi=1)=i(1)=,为bi=1类型的行为人申请产权的策略,对B(b),则0,1,对于=0和=1的特殊情况,其意义较明确,就是纯策略问题,前面已经给予了说明。我们仅考虑0<<1的均衡策略。从而我们就可以把政府的后验概率(|A,)中的变量A和分别用(=|A|)和来替代,其中i(1)=,对B(b)。又根据引理1及前面关于集合A和B的定义知,集合A=iN|si=1,sSi为集合B(b)=iN|bi=1,bi0,1的子集,即AB,因此,那么,pr(,pr(|q,n)=,这时政府的后验概率,也就是(1)式,就可具体地重新写为:(|A,)= =其中,pr(为个bi=1类型的行为人中,申请产权的人数刚好有位的概率;pr(是自然对行为人的分类,指在n个行为人中,属于bi=1类型的有人数位的概率,这样,我们就可以把政府的期望效用(3)式重新改写为:整理上式得: (4)(整理过程的数学推导见附录。)引理2:对于一个满足直观准则IC的对称贝叶斯均衡SPBE而言,若·>cg,则必有AW(g*),其中=|A|。引理2是说,只要有足够多的行为人申请产权的话,(引理2中的条件变形为后为>),那么政府就决定赋予产权(g*=1)。引理3:若>0,则必有>0。推论:在对称完美贝叶斯均衡SPBE中,政府的策略具有如下的特征,对于临界值Z而言,若时,则g*()=1;若<时,则g*()=0。推论的意义很明确。值得说明的是,在引理3中,若>0,不仅>0成立,而且对所有的x>,都有>0成立,是保证政府赋予产权的最小人数(临界值),这一点隐含在引理3中。引理4:如果向量组合*,g*,(·)是一个混合对称完美贝叶斯均衡(SPBE),那么下式一定成立,即: (5)其中ci为N中任意行为人i的申请成本,由前面的假设知道ci就是常数c,对N。引理4意味着如果C1-t,则在均衡中没有人申请。由于(5)式中只有两个变量与,那么我们就可以定义出下面两种对应关系。一个为y:(0,1)Z, Z为整数集合,具体为y()=minZ|g1|(·A,),|A|=>0,显然为保证政府赋予产权的申请人集合的最少人数,因此y给出了对于每个行为人的值,政府的临界值。同样,另一个对应为h:Z(0,1),具体为:h()=(0,1)|给定,为满足(5)式的值,故h给出了对于每个值,行为人的值。因此,这就意味着y和h都为最优反应关系或双方各自的最优反应函数(best-response),一个是行为人的,一个是政府的。下面的定理是说博弈模型的均衡-对称贝叶斯均衡SPBE,就是上面两个最优反应集合的交集,即SPBE的解集为(,)|=y()且h(),也就是说,定理中的条件(6)式保证了对于给定的而言,政府使用最优临界策略;条件(7)保证了对于给定的政府临界策略,每个行为人都使用同样的混合策略,这使得行为人在申请产权与不申请产权之间是无差异的。给定了这种无差异,每个行为也只好使用其他行为人都使用的这种混合策略了。这一点在引理4和定理的证明中可感觉到。定理:向量组合*,g*,(·)为博弈的一个SPBE的充要条件为:(i) 对iN,*i(0)=0;(ii)对iN,*i(1)=,g*()=1当且仅当,其中(,)满足: ; (6) = 0 (7)当且仅当 。 推论:在模型中的SPBE中,政府与行为人的期望支付Ea(g)、 Ea(i)(the expected payoffs)总是非负的。定理及推论告诉我们,政府与公众都可以从所申请并被赋予的产权制度中获取收益。三、结论性评述在本文所给出的这个博弈模型中,产权制度的最后确定是通过一个行为人对称完美贝叶斯均衡(agents symmetric perfect Bay