数据包络分析DEA课件.ppt
评价相对有效性的DEA模型 运筹学的新领域,技术效率,技术效率是指一个生产单元的生产过程达到该行业技术水平的程度。技术效率可以从投入与产出两个角度来衡量测度:产出/投入的比值 简单,但仅适用于单投入、单产出各投入、各产出赋予权重,加权产出/加权投入的比值权重的确定方法?固定的权重 通过数据本身获得权重,衡量一个单位的绩效,通常是用投入产出比这个指标,当所有投入和产出指标均分别可折算成同一单位时(例如货币值),容易根据投入产出比大小对要评定的决策单元进行绩效排序。,总况,参数方法,非参数方法,优势在于影响因素的分析;SFA具有统计特征,能研究传统假设中的参数检验;采用面板数据时可以进行跨期研究,随机前沿方法,数据包络分析,技术效率评价方法,无需考虑生产函数表达式及参数的分布形式,只需要考虑投入和产出的项目有哪些,且适用于拥有多投入和多产出的研究对象单周期计算,适用于小样本把所有偏离效率边界的情况归为无效率,造成效率程度的过高或过低;不能分析技术效率的影响因素;不具有统计特征,不能进行统计检验,基于DEA的技术效率影响因素的分析:DEA两阶段模型:DEA+TobitDEA三阶段模型:DEA+SFA+DEA SFA:排除环境变量和随机误差对效率评价的影响,调整投入产出指标DEA四阶段模型:DEA+Tobit+DEATobit 拟合投入变量的松弛量与环境变量的关系,DEA方法简介,数据包络分析方法(DEA,Data Envelopment Analysis)由著名的运筹学家A.Charnes(查恩斯),W.W.Cooper(库伯),及E.Rhodes(罗兹)于1978年提出,用于评价相同部门间的相对有效性(也被称为DEA有效)。该方法的原理主要是通过保持决策单元(DMU,Decision Making Units)的输入或者输出不变,借助于数学规划和统计数据确定相对有效的生产前沿面,将各个决策单元投影到DEA的生产前沿面上,并通过比较决策单元偏离DEA前沿面的程度来评价它们的相对有效性。,数据包络分析是一种对具有相同类型决策单元进行绩效评价的方法。DMU:效率的测度对象,任何具有可测量的投入、产出的部门、单位或个人,但必须具有可比性这里相同类型是指这类决策单元具有相同性质的投入和产出,如医院投入的是医护人员、面积、床位数、医疗设备和药品等,产出是门诊病人人次、住院病人人日、代培实习的医护人员数等。,数据包络分析是运筹学的一个新的研究领域.查恩斯和库伯等人的第一个应用DEA的十分成功的案例,就是评价为弱智儿童开设公立学校项目的效果.在评估中,输出包括“自尊”等无形的指标;输入包括父母的照料和父母的文化程度等,无论哪种指标都有无法与市场价格相比较,也难以轻易定出适当的权重(权系数),这也是DEA的优点之一.,查恩斯和库伯等人的第一个模型被命名为C2R模型.从生产函数的角度看,这一模型是用来研究具有多个输入,特别是具有多个输出的“生产部门”同时为“规模有效”与“技术有效”的十分理想且卓有成效的方法.,9,1985年查恩斯,库伯,格拉尼(B.Golany),赛福德(L.Seiford)和斯图茨(J.Stutz)给出另一个模型(称为C2GS2模型),这一模型用来研究生产部门间的“技术有效性”.,1987年查恩斯,库伯,魏权龄和黄志明又得到了称为锥比率的数据包络模型C2WH模型。这一模型可用来处理具有过多的输入及输出的情况,而且锥的选取可以体现决策者的“偏好”.灵活地应用这一模型,可以将C2R模型中确定出的DEA有效决策单元进行分类或排队.,DEA方法以相对效率概念为基础,以凸分析和线形规划为工具的一种评价方法,应用数学规划模型计算比较决策单元之间的相对效率,对评价对象做出评价,它能充分考虑对于决策单元本身最优的投入产出方案,因而能够更理想地反映评价对象自身的信息和特点;同时对于评价复杂系统的多投入多产出分析具有独到之处。,DEA是对其决策单元(同类型的企业或部门)的投入规模、技术有效性作出评价,即对各同类型的企业投入一定数量的资金、劳动力等资源后,其产出的效益(经济效益和社会效益)作一个相对有效性评价。,DEA方法的特点:适用于多输出-多输入的有效性综合评价问题,在处理多输出-多输入的有效性评价方面具有绝对优势DEA方法并不直接对数据进行综合,因此决策单元的最优效率指标与投入指标值及产出指标值的量纲选取无关,应用DEA方法建立模型前无须对数据进行无量纲化处理(当然也可以),无须任何权重假设,而以决策单元输入输出的实际数据求得最优权重,排除了很多主观因素,具有很强的客观性DEA方法假定每个输入都关联到一个或者多个输出,且输入输出之间确实存在某种联系,但不必确定这种关系的显示表达式DEA可以用来研究多种方案之间的相对有效性(例如投资项目的评价);研究在决策之前去预测一旦做出决策后它的相对效果如何(例如建立新厂后,新厂相对于已有的一些工厂是否为有效).,DEA方法的特点:,DEA的应用:经济效率评价中的应用区域经济研究中的应用资源配置中的应用技术进步与可持续发展中的应用绩效评价中的应用物流与供应链中的应用银行评价中的应用风险评估中的应用,DEA方法的工作步骤(1)明确问题阶段需要明确评价的目标,并围绕评价的目标对评价的对象进行分析确定各种因素的性质(可变或不变的、可控或不可控)考虑因素间可能的定性与定量关系确定决策单元的边界,对决策单元的结构、层次进行分析对结果进行定性的分析和预测(2)建模计算阶段建立评价指标体系选择决策单元,收集和整理的数据具有可获得性选择适当的DEA模型进行计算(3)分析结果阶段对结果进行比较和分析,找出无效单元无效的原因,并提供进一步改进的途径根据定性的分析和预测的结果来考察评价结果的合理性,效率值与生产前沿面的关系,无效性:经济学中也称其为强可处置性,表明在原来生产活动基础上增加投入或减少产出进行生产总是可能的,除了凸性和无效性,生产可能集T还满足锥性和最小性公理。锥性公理:对任意的 及数 均有也就是说,若以投入量x的k倍进行输入,那么输出量也以原来产出y的k倍产出是可能的最小性公理:生产可能集是满足凸性、无效性、锥性公理的所有几何的交集。满足以上条件的集合T是唯一确定的。,例 有4个银行储蓄所,每月完成10000笔人民币的存款、取款业务,但其投入情况不同,见下表,试分析这4个储蓄所的绩效。,解:为了进行分析,以职员数为横坐标,营业面积为纵坐标将4个储蓄所的投入标记于下图中:,生产前沿面,生产可能集,DEA有效,折线 和折线右上方所有点组成的集合为生产可能集。,即这些点多对应的职员数和营业面积所组成的储蓄所均有能力完成每月10000笔的存款业务。,由虚线和 形成的数据包络线称生产前沿面。,即不可能由这条包络线的左下方对应的职员数和营业面积组成的储蓄所能完成每月10000笔的存款业务。,处于包络线(或生产前沿生产面)上的决策单元称为DEA有效(或Pareto有效)。即对 三个决策单元来说,为完成每月10000笔的存款业务,如要减少职员,必须增加营业面积,如果要减少营业面积,必须增加职员数,不可能同时既减少职员又减少营业面积。,、DEA基本原理和模型,基本概念CCR模式 投入导向 产出导向比率式、原问题、对偶问题BCC模式 投入导向 产出导向DEA执行程序生产效率(整体技术效率)、(纯)技术效率 规模效率案例讨论,DEA基本原理和模型,投入产出数据表,各字母定义如下:,xij-第j个决策单元对第i种类型输入的投入总量.yrj-第j个决策单元对第r种类型输出的产出总量.vi-对第i种类型输入的一种度量,权重系数ur-对第r种类型输出的一种度量,权重系数i-1,2,mr-1,2,sj-1,2,n,CCR模型概念,理想假設 生产过程属固定规模报酬,即是当投入量以等比例增加时,产出亦应等比增加。CCR模式投入导向 以投入之角度探讨效率,既在目前之产出水准下,比較投入资源之使用情形,称为投入导向效率CCR模式产出导向 以产出之角度探討效率,在相同投入水准下,比较产出的达成状况,称为产出导向效率。,(1)投入导向CCR模型的规划式假设当前要测量的DMU记为DMUk,附加条件:总可以选择适当的权重,使得所有DMU采用上述权重得出的效率值,其效率=产出的加权组合/投入的加权组合,对第k个决策单元进行效率评价,一般说来,越大表明DMUk能够用相对较少的输入而取得相对较多的输出。这样我们如果对DMUk进行评价,看DMUk在这n个DMU中相对来说是不是最优的,我们可以考察当尽可能的变化权重时,的最大值究竟是多少。,以第k个决策单元的效率指数为目标,以所有决策单元的效率指数为约束,就构造了如下的CCR(C2R)模型:,CCR比率模式之概念,由上式可知,DEA事实上是求产出与投入之比值,较特殊的是、为已知数,而模式即在各所有DMU的效率值都不超过1的条件下,找寻最有利的加权值(即、)使得被评价DMU的效率值最大化。,因此,模型确定的权重是对被评价对象最有利的。从这个意义上讲,CCR模型是对被评价DMU的无效率状况作出的一种保守的估计。,为什么说CCR模型是基于规模收益不变的呢?假设一项生产技术的规模收益不变,则在技术效率保持不变的条件下,如果投入变为原来的t倍,其产出也会变为原来的t倍。,上述规划模型是一个分式(非线性)规划,并且存在无穷多个解。约束条件等价于使用CharnesCooper变化,令:可变成如下的线性规划模型P:,利用线性规划的最优解来定义决策单元j0的有效性,从模型可以看出,该决策单元j0的有效性是相对其他所有决策单元而言的。对于CCR模型可以用规划P表达,而线性规划一个重要的有效理论是对偶理论,通过建立对偶模型更容易从理论和经济意义上作深入分析,(D/),可以看做是一个虚拟的DMU,其投入不高于 决策单元j0的投入,产出不低于决策单元j0的产出。如果决策单元j0处于无效率的状态,则最优解构建的虚拟决策单元 就是被评价DMU的目标值,规划P的对偶规划为规划D/:,模型的目标函数最优解为,表示在当前技术水平下,被评价DMU在不降低产出水平的条件下,其投入能够缩减的最大限度。越小,表示投入可以缩减的幅度越大,效率越低。表明DMU处于技术有效状态。(2)投入导向CCR模型图解,(3)产出导向的CCR模型其规划式其对偶式该对偶模型是以投入既定的条件下,各项产出可以等比例增长的程度来对无效率的状况进行测量。,模型的最优解为,在当前技术水平下,被评价DMU在不增加投入的条件下,其产出能够增加的最大比例为 越大表示效率越低。由于,所以一般采取 表示效率值(4)产出导向CCR模型图解,52,某集团公司下属有甲、乙、丙三个企业,收集到反映其投入(固定资产年净值x1、流动资金x2、职工人数x3)和产出(总产值y1、利税总额y2)的有关数据如下表,实例,评价这几个企业的生产效率。,53,由于投入指标和产出指标都不止一个,故通常采用加权的办法来综合投入指标值和产出指标值。,对于第一个企业,产出综合值为60u1+12u2,投入综合值为4v1+15v2+8v3,,我们定义第一个企业的生产效率为:总产出与总投入的比,即,假定u1,u2,v1,v2,v3分别为产出与投入的权重系数,54,类似,可知第二、第三个企业的生产效率分别为:,我们限定所有的生产效率hj值不超过1,即,这意味着,若第k个企业hk=1,则该企业相对于其他企业来说生产率最高,或者说这一生产系统是相对有效的,若hk1,那么该企业相对于其他企业来说,生产效率还有待于提高,或者说这一生产系统还不是有效的。,55,即,因此,建立第一个企业的生产效率最高的优化模型如下:,这是一个分式规划,需要将它化为线性规划才能求解。,56,分式规划化为线性规划,57,对偶规划,投入,产出,CRS的假设适合于所有厂商均以最优规模运营的情况,然而由于不完全竞争、政府规制、财务约束等因素,实际生产单元并没有处于最优规模的生产状态1984年Banker、Charnes和Cooper在Management Science发表了“Some models for estimating technical and scale inefficiencies in data envelopment analysis”,提出了BCC模型,用于解释规模报酬可变(VRS)的情况CCR模型得出的技术效率包含了规模效率(Scale Efficiencies,SE)的成分,而使用VRS设定允许没有SE效应而对TE进行计算,称之为“纯技术效率”。,基于规模报酬可变的BCC模型,投入(产出)导向规划式:作用:使投影点的生产规模与被评价DMU的生产规模处于同一水平凸性约束条件基本上确保无效厂商只与类似规模的“基准”厂商比较。也就是,DEA前沿上的投影点是观测厂商的凸组合。在CRS模型中没有这个凸性约束。因此,在CRS模型中,被评价厂商可能与比它大(小)得多的参考厂商进行比较。而权数的总和将小于(或大于)1。,投入导向BCC模型图解:,产出导向BCC模型图解:,为了讨论和计算应用方便,进一步引入松弛变量s和剩余变量s,将上面的不等式约束(可看作是“松”的约束)变为等式约束,可变成:,强有效、弱有效与松弛变量问题,“松”的约束是松弛变量存在的基础,DEA模型的前沿是由分段函数构成的,而分段函数在空间坐标系中会出现与坐标轴平行的情况,这是松弛问题产生的根源。,求解松弛变量的方法 以投入导向径向模型为例,是一个常量,表示非阿基米德无穷小,可设置为0.00001 数值设置过大时会造成对偶模型无可行解。,为消除 产生的误差,可采用两阶段求解投入和产出松弛变量。第一阶段求出第二阶段,求解如下规划式:,规模效率BCC模型假定生产过程属于可变规模报酬(VRS),既是当投入量以等比例增加时,产出不一定等比增加,有可能规模递增或規模递减BCC模型既可以求解VRS生产技术下的技术效率,同时也为求解规模效率提供了方法通过比较计算CRS效率值和VRS效率值就可以分离出规模效率SE=TE/PTE,通过DEA模型可以判断被评价DMU的效率状态:有效或无效DEA有效可分为:强有效:生产处于这样的一种状态:任何一项投入的数量都无法减少,除非减少产出或增加另外一种投入的数量;任何一种产出的数量都无法增加,除非增加投入的数量或减少另外一种产出的数量 判断标准:弱有效:无法等比例减少各项投入的数量,除非减少产出的数量;无法等比例增加各项产出的数量,除非增加投入的数量可以减少某一项或几项投入数量或增加某一项或几项产出数量 判断标准:无需考虑是否存在 松弛问题 决策单元不是DEA有效,经济活动既不是技术效率最佳,也不是规模最佳,DEA有效性的定义,“技术有效”:若生产状态(x,y)满足,则称生产状态(x,y)是“技术有效”的(也即输出相对输入而言已达到最大)此时,点(x,y)位于生产函数的曲面上技术有效:相对于最优生产效率水平的目前投入要素的浪费情况“边际报酬递减规律”:生产函数的一阶导数表现为先增后减的规律(或函数先为凸,后为凹)所谓“规模有效”,是指投入量x既不偏大,也不过小,是介于规模收益由递增(递增)到递减(递减)之间的一种状态(即“规模收益不变”的最佳状态)规模有效:按照最优生产效率水平所能获得的最大产出情况,DEA有效的经济含义,技术有效还是规模有效?,DMU在CCR模型之下为DEA有效,DMU对应的生产状态(x0,y0)既为技术有效,也为规模有效DMU在BCC模型之下为DEA有效,DMU对应的生产状态(x0,y0)为技术有效的。,j使各个有效点连接起来,形成有效前沿面;非零的s+、s-使有效前沿面可以沿水平和垂直方向延伸,形成包络面。在实际运用中,对松弛变量的研究是有意义的,因为它是一种纯的过剩量(s-)或不足量(s+),则表示DMU离有效前沿面或包络面的一种径向优化量或“距离”其中 是决策单元j0对应的线性规划(D)的最优解,则 为DMUj0对应的(x0,y0)在DEA的相对有效面上的投影,它是DEA有效的,CCR模型中变量的经济含义,比例改进与松弛改进的关系无效DMU在前沿上的投影点代表其目标值目标值=原始值+改进值(投入改进值为负值)=原始值+比例改进值+松弛改进值,DMU数量、模型导向的选择(1)DMU数量的选择如果DMU的数量比投入产出指标的数量要少时,容易出现大部分甚至全部DMU均有效的结果(?超效率模型)一般来说,(2)投入和产出指标的选择大致满足:DEA不要求投入产出指标之间不存在高度相关性(共线性)尽量不要使用率指标,模型导向的选择投入导向:在不减少产出的条件下,要达到技术有效各项投入应该减少的程度把减少投入作为无效率单位提高效率的主要途径(投入不足时不宜选择投入导向)产出导向:不增加投入的条件下,要达到技术有效各项产出应该增加的程度把增加产出作为无效率单位提高效率的主要途径(需求不足时不宜选择投入导向)非导向:从投入和产出两个方面进行测算,利用投入导向与产出导向的DEA模型将会估计出完全一样的前沿,因此,二者均可以识别相同的有效厂商。只有当测算无效厂商的效率时,两种方法的测量结果才会出现差别。只有在规模收益不变情况下,这两种测量方法所得到的结果才会相等。,80,若干省份相对生产率水平比较,以各省全部独立核算工业企业为对象,DEA应用案例,81,评价江西省相对生产率的DEA模型,5.4 DEA 模型,82,评价江西省相对生产率的DEA模型,5.4 DEA 模型,83,湖南省的DEA模型如下,计算机求解结果为:,84,若干省份相对生产率水平比较结 果,5.4 DEA 模型,1.对生产水平的相对有效性分析-梁敏.边馥萍.生产水平的相对有效性分析.数量经济技术经济研究J2003.9:91-94,利用含有非阿基米德无穷小的CCR模型,对北京地区建立如下模型:,同样建立其他三个直辖市的模型,求得的解如下:,对于非DEA有效的DMU,可将其投影到DEA有效面,即把非DEA有效的DMU变成有效的DMU,以天津为例,为得到同样的总产值和财政收入,输入可减少到:,对经济效益的评价-侯风华,张在旭,徐青.DEA方法在石油企业经济效益评价中的应用.系统工程理论方法应用J2000.3:252-257 设研究对象为11个油田,将这11个油田简记为DMUj(j=1,2,11)输入指标的选取:投资总额;职工总数;销售成本;固定资产原值 输出指标的选取:原油产量(含天然气);利税总额;新增探明储量(含天然气),CCR模型的解,CCR模型的解,根据上述的DEA有效性的判别定理,可知:(1)达到DEA有效的DMU分别为:DMU1,DMU2,DMU4,DMU7,DMU9,DMU11(2)非DEA有效的DMU分别为:DMU3,DMU5,DMU6,DMU8,DMU10(3)非DEA有效的DMU进行投影计算结果如后,投影分析结果:,5个DMU1个产出2个投入1年资料,5个DMU1个产出1个投入,1个产出1个投入3年资料,程序参数设定,用“记事本”打开,设定后,以“另存新档”方式存档,扩展名为“ins”,5个DMU1年资料1个产出2个投入,程序参数设置文件名.ins,Thanks,