统计综合-数据处理与多指标评价方法.ppt
《统计综合-数据处理与多指标评价方法.ppt》由会员分享,可在线阅读,更多相关《统计综合-数据处理与多指标评价方法.ppt(125页珍藏版)》请在三一办公上搜索。
1、第十三讲 统计综合,提纲,1.权重确定的一般方法,2.数据处理的一般方法,3.常用综合评价方法,一、权重确定的一般方法,专家咨询法排序法(Delphi法)头脑风暴法层次分析法(AHP法)秩和比法(RSR法)相关系数法主成分分析法(PCA法)因子分析法算术均数组合赋权法(均数法)(算术均数组合赋权法的权重为前 种方法所得权值的算术平均数)连乘累积组合赋权法(累积法)(连乘累积组合赋权法的权重为前 种方法所得权重的累积分数),1.权数的确定方法分类,按权数的表现形式分为:绝对数权数;比重权数。通常采用比重权数归一化权数。按确定权数的方法分为:主观赋权法;客观赋权法。,2.主观赋权法,主观赋权法德尔
2、菲法(专家法)实际上各个专家可以根据自己的理解选择不同的方法相邻指标比较法;(先按重要性将全部评价指标排序,再将相邻指标的重要性进行比较层次分析法()互反式两两比较构权法。,主观赋权法特点,权数的特性(指主观权数、人工权数)重要性权数是一种重要性程度的量化值。指对合成值的影响程度大小。重要性本身是个综合的概念,表现在多个方面,如可以是“价值判断取向”上的重要性,也可以是合成时“分辨能力(信息含量)高低”的重要性,或“可靠度大小”的重要性。模糊性重要性本身就是个模糊的概念;习惯取点值。人工性没有绝对的正确错误标准;只能尽可能选择相对科学合理的权数。主观性受评权者主观意识的影响,3.客观赋权法,客
3、观赋权法从指标的统计性质来考虑,它是由客观数据决定。客观定权法包括模糊定权法、秩和比法、熵权法和相关系数法等,(1)变异信息构权(离散/方差信息构权)指标的区分度越高,对排序的影响就越大。基于这种观点,以区分度(方差)信息量为权重。目前,主要有两种方法:a)根据标准差大小来确定权数直接将各评价指标的标准差(系数)向量进行归一化处理而得。b)主成分分析法(PC构权法)根据方差矩阵计算特征根及特征向量,并以特征向量为权重。但事实上这种权数与原始变量的方差并不成正比,所以,严格地说,它反映的是变量之间的相关信息,而非方差信息。方差信息构权最主要的问题方差信息是否真正全面反映了综合评价的价值。因此,有
4、人提出,应该将方差信息权与重要性权结合起来。,(2)相关信息构权复相关系数法每个被选指标,根据其余指标对它的复相关系数来确定权数。复相关系数大,权数是应该取大还是取小?相关系数总和法对其它指标的相关系数的总和,再作倒数处理并归一化(但对负相关的处理也有争议)。(3)熵信息构权熵有不同定义,相应有不同评价方法。它本质上仍然是离散程度大熵值小权大。只是定义了一个新的测度变异情况的指标(1熵值)。由此,任一相对变异指标都可用来定权。,4.合成赋权法,合成方法 由单项评价值计算综合评价值的方法。1、算术平均法(加法合成、加减法合成)2、几何平均法(乘法合成、乘除法合成)3.混合合成法,加权算术平均法的
5、主要特点(1)对于数据的要求最宽松,用于合成的某一指标数值可以为0、为负;(2)各指标可以相互补偿(等量补偿),即此升彼降,总的评价值不变;(3)突出了评价分数较大、权数较大者的作用,适用于主因素突出性的评价;(对较大数值的变动更为敏感)。,几何平均法的主要特点(1)对数据要求较高,指标数值不能为0、负数,(2)鼓励被评价对象在各方面全面发展,任一方也不能偏废。此合成方法督促“全面发展”,而不是靠重点倾斜的方法取胜;(3)乘除法容易拉开评价档次,对较小数值的变动更敏感。,二、数据处理的一般方法,1.数据类型的一致化处理方法,极大型:期望取值越大越好;极小型:期望取值越小越好;中间型:期望取值为
6、适当的中间值最好;区间型:期望取值落在某一个确定的区间 内为最好。,什么是一致化处理?为什么要一致化?,2.数据指标的无量纲化处理方法(标准化),(3)功效系数法:,(1)标准差法:,(2)极值差法:,3.模糊指标的量化处理方法,在实际中,很多问题都涉及到定性,或模糊指标的定量处理问题。诸如:教学质量、科研水平、工作政绩、人员素质、各种满意度、信誉、态度、意识、观念、能力等因素有关的政治、社会、人文等领域的问题。,如何对有关问题给出定量分析呢?,按国家的评价标准,评价因素一般分为五个等级,如A,B,C,D,E。如何将其量化?若A-,B+,C-,D+等又如何合理量化?根据实际问题,构造模糊隶属函
7、数的量化方法是一种可行有效的方法。,3.定性指标的量化处理方法,假设有多个评价人对某项因素评价为A,B,C,D,E共5个等级:v1,v2,v3,v4,v5。譬如:评价人对某事件“满意度”的评价可分为很满意,满意,较满意,不太满意,很不满意将其5个等级依次对应为5,4,3,2,1。这里为连续量化,取偏大型柯西分布和对数函数作为隶属函数:,根据这个规律,对于任何一个评价值,都可给出一个合适的量化值。据实际情况可构造其他的隶属函数。如取偏大型正态分布。,三、常用综合评价方法,(一)计分法(二)Topsis法(三)秩和比(RSR)法(四)层次分析(AHP)法(五)模糊综合评价方法(六)多元统计分析方法
8、(七)灰色系统评价方法,(一)计分法,1.综合计分法根据评价目的及评价对象的特征选定必要的评价指标逐个指标定出评价等级,每个等级的标准用分值表示以恰当的方式确定各评价指标的权数选定累计总分的方案以及综合评价等级的总分值范围,以此为准则,对评价对象进行分析和评价,以决定优劣取舍特点:简便易行,过于粗糙。,计分法具体做法:按各个评价指标的经济重要性确定标准得分全部指标的标准得分的总和=100,单项指标的标准得分就是该指标的最高分(满分,也就相当于权数);确定各指标的对比标准;按三档记分改善得满分,持平得一半的分,下降得零分。加总各评价指标的实际得分 特点:简便易行,过于粗糙。,2、排队计分法 将评
9、价单位的各项评价指标依优劣秩序排队,再将名次(位置)转化为单项评价值,最后由单项评价值计算各单位的综合评价值(总分)。,排队计分法的优缺点,优点:简便易行,勿须另寻比较标准;各单项评价值有统一的值域;适用范围广泛(可用于定序以上层次的数据)缺点:原始数据信息的损失较大。,(二)综合指数法,一个或一组变量对某特定变量值大小的相对数称指数,反映某一事物或现象动态变化的指数称个体指数,综合反映多种事物或现象动态平均变化程度的指数称总指数,综合指数编制总指数的基本计算形式,定量地对某现象进行综合评价的方法称综合指数法,Ki 为单项评价指数:综合评价指数公式为:,评价指数可以为正指标,也可以为逆指标。但
10、必须同向化。一般是把逆指标转化为正指标采用倒数法,此时,综合评价指数才是越大越好。,加权指数法,试比较三个地区的综合经济效益。,三个地区的综合经济效益指数分别为:,=110.31%,=116.67%,=99.11%,加权指数法的优缺点,主要优点:意义直观明晰;主要缺点:各单项评价值没有统一的值域,影响评价指标的评价值之间的可比性。,(三)最优值距离法,最优值距离法的特点,综合评价值为逆指标越小越好(与最优值越接近);各单项评价指标的值域统一在(0,100)之间。评价结果容易受极端值影响。,(四)功效系数法,依据多目标规划原理提出单项评价得分:综合评价得分:几何平均法算术平均法,功效系数法的优缺
11、点,优点:能够充分反映评价指标的原始信息;各单项指标的值域基本上在(60,100)之间;评价结果受极端值影响的程度比指数法和最优值距离法都较弱。缺点:必须事先确定两个参照系(对比标准满意值和不容许值)。,(五)熵权法,对指标值越大越好的指标有,对指标值越大越好的指标有,熵权法是一种可以用于多对象、多指标的综合评价方法,其评价结果主要依据客观资料,几乎不受主观因素的影响,可以在很大程度上避免人为因素的干扰。,当 时,熵的定义:,第 j 个指标的熵权定义为:,对象的空间距离为:,归一化,p=2 欧氏距离,p=1 海明距离,海明距离,欧氏距离,(六)其它综合评价方法的应用,多元统计方法主成分分析法、
12、因子分析法、聚类分析法模糊数学方法模糊综合评价(评判)神经网络方法灰色系统分析方法还可以是多种方法的结合如:模糊神经网络方法、模糊聚类方法多种方法的评价结果再综合,或者选择与其它评价结果相关程度最高的结果为最终选定的评价结果。,5.1 因子分析法,将反映不同侧面的许多指标综合成为少数几个主因子,最后计算出综合得分。基本思想:根据变量之间的相关性大小把变量分组,使得同一组内变量之间的相关程度较高,不同组的变量之间相关性较低,每组变量代表一个基本结构(这个基本结构称为主因子或公共因子)。从具有错综复杂的关系的众多经济现象中找出几个主因子,每一个因子代表经济变量之间相互依赖的一种经济作用,抓住这些主
13、因子就可以帮助我们对复杂的经济问题进行分析和解释。,5.2 主成分分析法,通过研究指标体系的内部结构关系从而将多个指标转化为互不相关的、包含原来指标的大部分信息的少数几个综合指标(主成分),以各主成分的方差贡献率对它们进行加权,计算出综合评价得分。它实质上是一种同度量化值的加权算术平均值,主成分中的系数就是其权数。主成分方法的优点:1)消除变量之间的相关性;2)减少工作量(评价方法模式化、降维的简化作用)3)权数的非人为性(非随意性)。,应用主成分方法必须注意几点,样本容量要足够大(只对少数单位或时间进行评价就不能用);若样本出现不正常现象或异常点(应该将之删除),也不适用;评价单位的多少及增
14、减,都可能改变权数,从而影响评价结论。,应用主成分方法注意几点(续),属于一种相对评价,而非绝对评价。评价标准与样本有关;评价结果是一个相对优劣顺序。如进行经济效益评价,它的评价结果不能说明经济效益的水平的具体差异大小。它是原始变量的一种线性关系,没有考虑非线性情况。只适合于定量变量,不适合于包含定性变量的情况;常见的误解:把几个主成分的累计方差贡献率当作评价的把我程度/反映实际情况的程度。,5.3 灰色系统理论的关联分析,确定比较系列(评价指标体系)和参考系列(最优最劣两组);计算被评价对象与参考系列的关联度和从属度 关联度被评价对象与参考系列在各指标点的关联度的加权平均数,从属度综合反映了
15、评价对象远离最差系列的程度和接近最优系列的程度。根据关联度和从属度进行排序。特点:点关联度是建立在评价数据极差的基础上,既考虑了评价对象和整体的关系,又考虑了各评价对象之间的相互关系。,5.4 模糊神经网络,神经网络起源于对人脑的功能和结构的模拟,是由大量简单的处理单元广泛连接组成的复杂网络,对于需要同时考虑诸多因素和研究模糊信息问题特别适用。BP网络单向传播的多层网络由输入层、输出层和中间隐含层三个神经层次构成的模型。先要提出一组训练样本(每个样本由输入样本和理想输出组成),训练过程技术通过计算输出值于期望值的误差,通过修改权值(权数),直至理想输出与实际输出一致为止。,(六)Topsis法
16、,TOPSIS(Technique for order preference by similarity to ideal solution)法,即逼近理想解排序法,意为与理想方案相似性的顺序选优技术,是系统工程中有限方案多目标决策分析的一种常用方法。它是基于归一化后的原始数据矩阵,找出有限方案中最优方案和最劣方案(分别用最优向量和最劣向量表示),然后分别计算诸评价对象与最优方案和最劣方案的距离,获得各评价对象与最优方案的相对接近程度,以此作为评价优劣的依据。,1.设有n个评价对象、m个评价指标,原始数据可写为矩阵X(Xij)nm,2.对高优、低优指标分别进行同向化、归一化变换,3.归一化得到
17、矩阵Z(Zij)nm,其各列最大、最小值构成的最优、最劣向量分别记为,Z(Zmax1 Zmax2 Zmaxm),Z(Zmin1 Zmin2 Zminm),4.第i个评价对象与最优、最劣方案的距离分别为,5.第i个评价对象与最优方案的接近程度Ci为,例 某施工企业20042008年7项指标的实际值,用Topsis法比较该企业这5年的工程安全质量,Topsis法举例,变换后,得到矩阵,对各项指标进行同向化、归一化变换,计算各列最大、最小值构成的最优、最劣向量分别为,Z(0.4833 0.4805 0.4634 0.8178 0.4776 0.4487 0.5612),Z(0.4142 0.4081
18、 0.4321 0.2024 0.3916 0.4455 0.3118),计算各年与最优、最劣向量的距离(以2004年为例),C10.2497/(0.62890.2497)0.2842,计算接近程度(以2004年为例),可以看出,2008年综合安全质量最好,其次为2005年,随后为2004年、2007年,2006年最差,(七)秩和比(RSR)法,是利用秩和比RSR(Rank-sum ratio)进行统计分析的一组方法。秩:等级 秩和:等级和RSR是一个内涵较为丰富的综合性指标,具有01连续变量的特征,它以非参数分析方法为基础,通过指标数(列)、分组数(行)作秩的转换,再运用参数分析的概念和方法
19、研究RSR的分布,解决多指标综合评价问题。,设有m个指标,对n组数据进行评价,形成n行m列的数据阵,则:其中Rij 为分别按列编秩后各行的秩次。最小RSR=1/n,最大RSR=1。,秩和比法分析的步骤:分别对要评价的各项指标进行编秩计算各指标的秩和比(RSR)确定RSR的分布求回归方程排序分档,例1:采用秩和比法对某施工技术人员的4项考核指标进行综合评价业务考试成绩(X1)操作考核结果(X2)工种内测评(X3)工作量考核(X4),第一步,分别对要评价的各项指标进行编秩,遇相等评分时,取平均等级。,第二步,计算各指标的秩和比(RSR),其中:m为指标个数,n为分组数,Ri为各指标的秩次,RSR值
20、即为多指标的平均秩次,其值越大越优,计算秩和比(RSR)值,第三步,确定RSR的分布RSR频数f累积频数 秩号范围 平均秩次 累积频率Y(概率单位)。,Y为RSR的累积频率对应的概率单位值,Y=u+5,u标准正态分布的上分位点,RSR值正态性检验:Z=0.4772,双侧检验P=0.9767,说明RSR值呈正态分布,第四步,求回归方程 RSR=A+BY经相关和回归分析,应变量RSR 与自变量概率单位Y之间具有线性相关(r=0.9528)线性回归方程为:F=59.078,P=0.0002说明所求线性回归方程有统计学意义,第五步,根据RSR值排序分档 最佳分类归档的涵义是各档方差一致,相差具有显著性
21、。最佳分档准则为每档至少2例,尽量多分几组。最佳分档步骤,首先进行方差一致性检验,在方差一致的前提下,再作统计检验,方差分析结果判断各类间是否具有统计学差异,然后利用多重比较检验各类间差异是否显著。如果各类间的方差不一致或各类间的差异未达显著,则需考虑重新分档。,将各施工技术人员考核指标合理分档,分差、良、优三档。,各施工技术人员考核指标排序与等级分布,经方差齐性检验X2=2.3006,P0.05,说明各档方差一致方差分析显示:F=22.9722,P=0.0030,说明各档间有显著差异两两比较,P0.05,说明各档彼此之间均有差异,达到了最佳分档。,常用分档数及对应概率单位,表1 六种设备的主
22、要评价指标,秩和比法例2,假设某企业生产时有六种设备选择方案,采用的评价指标有成本、功耗、转速和可靠性,基础资料见表1,问应作何种设备选择决策?,六种设备评价指标的秩,R S R分布,表16 临界值与相应的概率,表 六种设备的分档结果,层次分析法是一种以定性与定量相结合的、系统化、层次化分析问题的方法。AHP是将半定性、半定量问题转化为定量问题的一种行之有效的方法,使人们的思维过程层次化,通过逐层比较其间的相关因素并逐层检验比较结果是否合理,从而为分析决策提供了较具说服力的定量依据。,(八)层次分析法,1、层次分析法基本步骤(1)建立层次结构模型;(2)构造出各层次中的所有判断矩阵;(3)层次
23、单排序及一致性检验;(4)层次总排序及一致性检验。,例 某工厂有一笔企业留成利润要由厂领导决定如何使用。可供选择的方案有:给职工发奖金、扩建企业的福利设施(改善企业环境、改善食堂等)和引进新技术新设备。工厂领导希望知道按怎样的比例来使用这笔资金较为合理。,步1 建立层次结构模型,在用层次分析法研究问题时,首先要根据问题的因果关系并将这些关系分解成若干个层次。较简单的问题通常可分解为目标层(最高层)、准则层(中间层)和方案措施层(最低层)。分析研究要符合决策者要求和意图决策者的目的是合理利用企业的留成利润,而利润的利用是否合理,决策者的主要标准为:(1)是否有利于调动企业职工的积极性,(2)是否
24、有利于提高企业的生产能力,(3)是否有利于改善职工的工作、生活环境。分析者可以提出自己的看法,但标准的最终确定将由决策者决定。,根据决策者的意图,可以建立起本问题的层次结构模型如图8.7所示。,图中的连线反映了因素间存在的关联关系,哪些因素存在关联关系也应由决策者决定。,对于因果关系较为复杂的问题也可以引进更多的层次。例如,在选购电冰箱时,如以质量、外观、价格、品牌及信誉等为准则,也许在衡量质量优劣时又可分出若干个不同的子准则,如制冷性能、结霜情况、耗电量大小等等。,建立层次结构模型是进行层次分析的基础,它将思维过程结构化、层次化,为进一步分析研究创造了条件。,步2 构造判断矩阵 层次结构反映
25、了因素之间的关系,例如图中目标层利润利用是否合理可由准则层中的各准则反映出来。但准则层中的各准则在目标衡量中所占的比重(权值)并不一定相同,在决策者的心目中,它们各占有一定的比例。怎样来确定合理的权值?,Saaty等人建议可以采取对因子进行两两比较建立成对比较矩阵的办法。即每次取两个因子xi和xj,以aij表示xi和xj对Z的影响大小之比,全部比较结果用矩阵A=(aij)nn表示,称A为ZX之间的成对比较判断矩阵(简称判断矩阵)。容易看出,若xi和xj对Z的影响之比为aij,则xj和xi对Z的影响之比应为:,定义:若矩阵A=(aij)nn满足,显然判断矩阵是正互反矩阵。,从心理学观点来看,分级
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 综合 数据处理 指标 评价 方法

链接地址:https://www.31ppt.com/p-6332937.html