第八章序贯决策分析ppt课件.ppt
第八章 序贯决策分析,广西大学数学与信息科学学院运筹管理系,8.1多阶段决策,8.1.1多阶段决策问题 决策过程比较复杂;需要将过程分为若干个相互联系的阶段,分别对每阶段都做出决策;各阶段的决策结果前后相互衔接,彼此相互关联,前阶段决策结果影响后阶段决策目标,后阶段决策状态又依赖于前阶段状态设置;各个阶段决策形成一个完整的决策过程(序列);,8.1多阶段决策,8.1.1多阶段决策问题 决策者关心的是整个决策过程的总体效应,而不单是各阶段的决策结果。总之,若一个决策问题需要经过相互衔接、相互关联的若干阶段决策才能完成,则自然称之为多阶段决策。,8.1多阶段决策,8.1.2多阶段决策方法及其应用实例多阶段决策分析的步骤适当地划分阶段;确定各阶段的状态变量,寻找各阶段之间的联系;从后到前用逆序归纳法进行决策分析,每一阶段决策可采用各种单阶段决策方法。主要方法是决策树方法和动态规划方法。,8.1多阶段决策,例8.1 某企业考虑是否花费1万元购买某新产品专利。若购买了专利,可进行大批生产(a1)、中批生产(a2) 或小批生产(a3),可能出现的市场销售情况也分为畅销(1)、一般(2)和滞销(3 )三种。其收益(利润,万元)矩阵如下表:,例8.1,为了更正确地掌握市场情况,正式投产公司打算先生产少量产品试销,试销费需要5000元。试销结果分为产品受欢迎(H1),一般(H2)和不受欢迎(H3)三种。由于试销面不宽,试销结果的准确性有限。其准确度(似然分布矩阵)见下表:,例8.1,如不买此项专利,把这笔费用用在其他方面,在同样的时期可获利1.1万元。那么,该公司应该如何决策?(1)是否买专利?(2)如果买专利,是否采取试销办法?(3)如果不试销,应大批生产,中批生产还是小批生产?如果试销,又应该如何根据试销结果决定其行动?,第一阶段,1,2,7,买专利,不买专利,试销,不试销,3,4,5,6,H1,H2,H3,8,9,10,a1,a2,a3,1,2,3,(略),第二阶段,第三阶段,例8.1,例8.1,解:这是一个三阶段决策问题,采用逆序归纳法进行决策分析,先要计算在一定的试销结果下的各后验概率。由全概率公式:,计算得:,例8.1,再由贝叶斯公式:,计算得:,例8.1,当试销结果为 H1时:,故当试销结果为 H1时,应选择大批生产a1,截去方案a2、a3,结点4的值为3.406万元。,-结点8,-结点9,-结点10,例8.1,当试销结果为 H2时:,故当试销结果为 H2时,应选择中批生产a2,截去方案a1、a3 ,结点5的值为2.62万元 。,例8.1,当试销结果为 H3时:,故当试销结果为 H3时,也应选择中批生产a2,截去方案a1、a3 ,结点6的值为1.53万元 。,例8.1,试销收益期望值:,故当不试销时,应选择大批生产a1,截去方案a2、a3 ,结点7的值为2.7万元。,不试销的收益期望值:,-结点3,例8.1,决策:(1)购买专利;(2)不试销;(3)大批生产a2。,购买专利总期望收益2.711.7万元,大于不买技术的收益1.1万元,截去不买专利方案,结点1的值为1.7万元 。,试销收益期望值扣除试销费用5000元后小于不试销的收益值,截去试销方案,结点2的值为2.7万元。,第一阶段,1,2,7,买专利,不买专利,试销,不试销,3,4,5,6,H10.44,H2 0.39,H3 0.17,8,9,10,a1,a2,a3,0.818,0.136,0.046,(略),第二阶段,第三阶段,例8.1,4万元,2万元,3万元,1.1万元,3.406万,2.77万,1万,3.406万,2.62万,1.53万,2.78054万,-0.5万,2.7万,2.7万,-1万,1.7万,8.1多阶段决策,有一类多阶段决策问题,在进行决策后又产生一些新情况,需要进行新的决策,接着又有一些新的情况,又需要进行新的决策。这样决策、情况、决策,就构成一个序列,这就是序列决策。特点:决策次数事前并不明确,决策阶段划分次数依赖于决策过程中出现的特殊状况。仍可用决策树法解这类问题,关键是:确定一个决策序列终止的原则。,【例8.2】,某厂家的产品装箱出厂,每箱有产品1000件,产品的次品率有0.01,0.40,0.90三种可能,相应概率分别为 0.2,0.6,0.2。有两种产品检验方案:整箱检验(a1),检验费100元;不作整箱检验(a),在销售中若顾客发现次品,允许调换并赔偿,每件损失0.25元。,【例8.2】,为了更好地选择检验方案,可先从任意一箱中随机地抽取一件产品作为样品。第一次抽样后,可继续进行第二次、第三次等若干次抽样,每次抽样成本均为4.2元,样本容量均为1。试进行序列决策:(1)是否需要抽样?(若需要,抽样几次?)(2)在抽样或不抽样的前提下,采用何种方案进行检验?,【例8.2】,解: 1,2,3分别表示产品次品率为 0.01 ,0.4,0.9三种状态。对于抽样检验一件产品,X=1和X=0分别表示样品为次品和合格品两个结果。结果值均用期望损失值表示。序列决策树图不能够一次绘制成功,而是随着决策过程序列的延伸和终止依次进行。为了简化图形,行动方案al和a2、可能出现的状态及其对应的损失值均在图中略去,仅在方案枝末端标注上期望损失值。,4,5,3,2,8,6,7,抽样,继续抽样,a1,a2,A1,A2,A3,A4,不抽样,X1=0,X1=1,停止抽样,9,X2=0,X2=1,a1,a2,继续抽样,停止抽样,(略),【例8.4】,相应的损失矩阵为,先进行第一次抽样的后验概率计算,该问题的费用矩阵为:,【例8.2】,【例8.2】,第一次抽样的后验概率矩阵为,【例8.2】,后验行动方案的期望损失值矩阵为,一次抽样后最满意方案分别为:,6.89,4.325,0.4582,19.5,2.69,33.40,4.325,0.4582,53.31,19.5,25,抽样,a1,a2,a1,a2,a1,a2,A1,A2,A3,A4,S1,S2,不抽样,X1=0,X1=1,0.578,0.422,0.3426,0.6228,0.0346,0.3426,0.5687,0.4265,0.0047,0.5687,0.4265,0.2,0.6,0.2,0.0047,0.5687,0.4265,0.2,0.2,0.6,97.5,0,0,0,0,125,97.5,0,0,0,0,125,97.5,0,0,0,0,125,期望损失值(包含抽样费用),4.20,若为正品,则无须检验整箱产品; 若为次品,则整箱检验。,最满意方案是,应抽取一件产品作样品检验。,【例8.2】,在A2上X1=1的决策点处,由于行动方案a1的期望损失值0.4582已小于抽样费用4.20,所以第二次抽样分支S2在此处被截断,决策序列在该分支上终止。而在Xl0的决策点处,由于行动方案al,a2。的期望损失值分别为33.40和4.324,均大于抽样费用4.20,因此,在此分支上,可进行第二次抽样,抽样结果用X2表示。X20和X2=1分别表示第二次抽样抽取一个样品为正品和次品。,【例8.2】,第二次抽样的后验概率计算如下:,【例8.2】,【例8.2】,第二次抽样的后验概率矩阵为,后验行动方案的期望损失值矩阵为,二次抽样后最满意方案分别为:,【例8.2】,由于X2=0在的决策点处,方案a2的期望损失值0.6038已小于抽样费用4.20,则序列决策的这一分支应该终止。同样,对于X2=1决策点处,由于方案a1的期望损失值1.1778也小于抽样费用,则这一分枝也应终止。于是,到此决策序列全部终止。,【例8.2】,4.20,a1,a2,s1,a1,a2,s2,X1=0,25,33.4,4.325,4.20,19.5,0.578,a1,a2,s3,X2=0,46.17,0.6038,4.20,0.7163,a1,a2,s3,X1=1,13.73,4.20,0.2837,1.1778,a1,a2,s2,X1=1,13.73,4.20,0.422,0.4582,A1,A2,A3,S1,S2,6.89,2.69,4.325,0.4582,0.7666,4.325,1.1778,【例8.2】,在A3上 X2=0的决策点处,最满意行动方案为a2 ,截去a1和 s3;在 X2=1的决策点处,最满意行动方案为 a1,截去 a2和 s3。在 s2状态点处,期望损失值为:,【例8.2】,在A2上 X1=0的决策点处,最满意行动方案为a2 ,截去a1和 s2;在 X1=1的决策点处,最满意行动方案为 a1,截去 a2和 s2。在 s1状态点处,期望损失值为:,在A1决策点处,最满意方案的期望损失值为:,所以截去a1和a2。,【例8.2】,综上所述,决策是:应该进行一次抽样检验。若为正品,则采取行动方案a2,即整箱产品不予检验;若为次品,则采取行动方案a1,即整箱产品予以检验,序列决策过程也可以用简化决策树图表示。,6.89,2.69,4.20,4.325,0.4582,s1,0.578,0.422,a1,a2,4.325,0.4621,8.2马尔可夫决策,研究这样的一类决策问题:采取的行动已经确定,但将这个行动付诸实践的过程又分为几个时期。在不同的时期,系统可以处在不同的状态,而这些状态发生的概率又可受前面时期实际所处状态的影响。其中一种最简单、最基本的情形,是每一时期状态参数的概率分布只与这一时期的前一时期实际所处的状态有关,而与更早的状态无关,这就是所谓的马尔可夫链。,8.2马尔可夫决策,8.2.1马尔可夫决策问题马氏过程马尔科夫( M . A . Markov )提出一种描述系统状态转移的数学模型,称为马尔科夫过程,简称马氏过程。马氏决策利用马氏过程分析系统当前状态并预测未来状态的决策方法,称为马尔科夫决策,简称马氏决策。,8.2马尔可夫决策,8.2.2马尔可夫链与转移概率矩阵 若随机过程X(t), tT,对于任意的t1t2tn,tiT都有Px(tn)y | x(tn-1)=xn-1, , x(t1)=x1=Px(tn)y | x(tn-1)=xn-1则称X(t), tT具有马尔可夫性。含义:x(tn)的将来只是通过现在与过去发生联系,一旦现在已知,则将来与过去无关。,8.2.2马尔可夫链与转移概率矩阵,条件概率Pxn=j | xn-1=i 称为转移概率,表示系统在n-1步状态为i时,第n步状态为j的概率一步转移概率。若一步转移概率不随时间变化(具有稳定性),记 pijPxn=j | xn-1=i ,称矩阵P(pij )为转移概率矩阵。其中:,8.2.2马尔可夫链与转移概率矩阵,马尔可夫链定义如果随机过程Xt, t=1,2, ,满足下述性质,则称Xt是一个有限状态的马尔可夫(Markov)链。(1)具有有限种状态;(2)具有马尔可夫性;(3)转移概率具有平稳性。,8.2马尔可夫决策,例: 某企业为使技术人员具有多方面经验,实行技术人员在技术部门、生产部门和销售部门的轮换工作制度。轮换办法采取随机形式,每半年轮换一次。初始状态,即技术人员开始是在某部门工作的概率用Pj(0)表示,j1,2,3;pij表示处于第i个部门的技术人员在半年后转移到第j个部门的概率。,8.2马尔可夫决策,已知:,问某人开始在第1部门工作,一年后在第2部门工作的概率是多少?一年后,技术人员在3个部门工作的概率各为多少?,8.2马尔可夫决策,解:由状态1经过两次转移到状态2的所有途径为112,122,132记由状态i经两步转移到状态j的概率为,则:,若某人开始在第一部门工作,则一年后在第二部门工作的概率是50%。,8.2马尔可夫决策,解:记一年后技术人员在第j个部门工作的概率为Pj(2),则:,一年后,技术人员在3个部门工作的概率,8.2马尔可夫决策,由上例可看出,从而有,一般地,有,8.2马尔可夫决策,8.2.3稳态概率,为稳态概率。,由于初始状态对n步转移后所处状态的影响随n增大而减少,故:,因此我们可以从n步转移矩阵的 极限取得稳态概率分布,称,8.2马尔可夫决策,得,且,此方程组称为稳态方程。,记,则,8.2.4 马尔可夫应用实例,例8.8 某生产商标为A的产品的厂商为了与另外两个生产同类产品B和C的厂家竞争,有三种可供选择的措施:(1)发放有奖债券;(2)开展广告宣传;(3)优质售后服务。三种方案分别实施以后,经统计调查可知,该类商品的市场占有率的转移矩阵分别是,例8.8,该类商品的月总销售量为1000万件,每件可获利1元。另外,三种措施的成本费分别为150万,40万,30万。为长远利益考虑,生产商标为A的产品的厂商应该采取何种措施?解:采取第一种措施的稳态概率,解得:,且,例8.8,解:同理可解出采取第二、第三种措施的稳态概率分别为:,计算生产A的厂商采取三种方案的期望利润如下:,因此生产A的厂商应采取的长期策略为方案(2)。,例8.9,我国出口某种设备,在国际市场上的销售状况有两种:畅销和滞销。畅销每年可以获利100万元,滞销时每年仅获利30万元。以一年为一个时期,如果不采用广告推广产品或采取广告措施,状态的转移矩阵分别如下,不采取广告措施,采取广告措施,例8.9,假定上一年处于畅销状态,每年的广告费为15万元。为了保证今后3年的利润最大化,是否应该采用广告措施?解:(1)若不采取广告措施,上一年畅销情况下,三年的期望利润总和为:,例8.9,解:(1)若采取广告措施,上一年畅销情况下,三年的期望利润总和为:,因此,为使三年所获期望利润最大,在上一年畅销情况下,最满意的方案是不采取广告策略。,例8.10,上例中,若每年是否采取广告策略需要依据上一年的经营情况而定,应该如何决策?解:这是一个三阶段决策问题。可画决策树,用逆序归纳法分析。,8.3群决策简介,8.3.1群决策概念群决策也称多人决策,是指由多人参加进行行动方案的选择活动。在现实生活中,决策往往是群体行为。原因:公正、民主社会的要求;集体领导;社会的发展与知识的进步,使知识、信息量急剧增长,决策问题愈来愈多也愈来愈复杂。,8.3.1群决策概念,群体决策理论研究的问题一般具有三个前提:自主性:决策者有独立选择机会,其行动不受较高层权利的支配,但不排除群体成员间相互影响。共存性:决策成员都在已知的共同条件下进行选择。共意性:群体做出的必然是所有参与者一致能够接受的方案。,8.3.1群决策概念,群体决策研究比个人决策研究复杂。这主要由几个因素引起:优先度:集体中每个成员都有各自的目标和优先观念以及不同的效用函数。主观概率判断:群体中各成员由于信息的感受和处理方式不一样,对未来状态出现概率的估计也不同。 沟通:集体决策可以在完全没有沟通信息的情况下进行,而更多的决策是在有相互沟通信息的情况下进行。,8.3.2群体决策的有效程度,1、群体决策的有利因素(相比于个人决策)集思广益:群体决策所需运用的知识和信息,可从群体中取得;参加群体决策的决策者往往也是决策的执行人,因而决策就成为大家的决议,从而能为更多成员所接受。2、群体决策的不利因素(相比于个人决策)成员在表态时的从众心理(保持沉默,不愿意提出不同意见,附和多数意见);突出个人左右决策;成员的“固执己见” 。,8.3.2群体决策的有效程度,3、群体决策与个人决策的对比(1)决策的正确性群体决策比较切合实际(2)决策的速度群体决策需要比个人决策花费更多的时间 (3)决策的创造性个人决策具有较大的创造性(4)决策的风险性会出现群体决策的极化现象,8.3.3群决策的分类,可根据群中成员的行为将群决策问题分为:1、集体(collective)决策研究各成员间不存在根本利益冲突的群决策问题,决策追求的是群作为整体的利益。又可按群的组织结构分为:委员会和递阶的权力结构。2、冲突分析研究成员间存在利益冲突的对策(博弈)问题,群中的成员追求自身的利益和与其他人对立的价值。,群决策,集体决策,冲突分析,委员会,Team Theory,一般均衡理论,组织机构决策,一般对策论,协商与谈判,主从对策与激励,仲裁与调解,亚对策论,社会选择,专家判断和群体参与,内容及解决办法,投票表决,社会选择函数,社会福利函数,: : :,递阶优化,组织决策,管理,: : :,8.3.4投票表决,群决策中涉及面最广、最为重要的部分是社会选择。社会选择是指公众就有关的重要问题,如重要职位的人选,政策的制订乃至国家政治体制的确定等等,进行决策。经常采用的社会决策方法是投票表决和市场机制。投票表决常用于政治决策市场机制常用作经济决策(是投票的特殊形式以货币投票),8.3.4投票表决,1、非排序式选举:选票上不反映投票人对候选人的偏好。(1)只有一人当选的情况采用计点式选举:每个投票人只有一票,以无记名方式投给自己最中意的候选人。简单多数制(相对多数制):超过两个候选人时,该方法不可靠。过半数代表制(可能需要二次投票或反复投票)若第一轮投票后无人过半数还可采用取舍表决法:每次淘汰得票数最少的候选人。,简单多数票法则不公平!,例:11个投票人,4个候选人(a、b、c、d),每个投票人以各候选人的偏好次序如下:,投票人,偏好次序,b当选,过半数票原则双如何?,例:11个投票人,4个候选人(a、b、c、d),每个投票人以各候选人的偏好次序如下:,投票人,偏好次序,b当选,二次投票的例子,例:11个投票人,4个候选人(a、b、c、d),每个投票人以各候选人的偏好次序如下:,投票人,偏好次序,第一轮a、d淘汰第二轮c将当选,不公平的原因,非排序式选举没有充分考虑投票人的偏好次序,因此无论是按简单多数还是过半数原则,选举结果均不可靠。Condorcet原则法国数学家康多西特(M.Condorcet)在18世纪就指出:当存在两个以上的候选人时,只有一种办法能严格而真实地反映多数成员的意愿对候选人进行成对比较,若存在某个候选人能按过半数原则击败其他所有候选人,则被称为Condorcet候选人,应由此人当选。,8.3.4投票表决,1、非排序式选举:选票上不反映投票人对候选人的偏好。(2)同时有两人或多人当选的情况一次性非转移式投票表决每个投票人只有一票,以无记名方式投给自己最中意的候选人,按简单多数法确定当选者。(按得票数从高到低确定当选者)复式投票表决每个投票人可投的票数等于当选人数,但对每个候选人只能投一票。,(2)同时有两人或多人当选的情况,受限的投票表决法每个投票人可投的票数必须小于当选人数,但对每个候选人最多只能投一票。累加式投票表决每个投票人可投的票数等于当选人数,选票可任意支配,可全部投给某一候选人,也可随意分配给若干候选人。名单制不对候选人投票,而是对政党或组织投票,根据各政党的得票数分配席位。,(2)同时有两人或多人当选的情况,可转移式投票每轮投票中,每个投票人只有一票。第一轮投票后计算:Q投票总数/(席位数1),得票数Q的候选人均当选,得票数最少者淘汰;若有剩余席位,则由未当选者在下一轮投票中竞争,直到选出全部当选者。认可选举只要投票人愿意,他可以投票给尽可能多的候选人,但对每个候选人最多只能投一票。由得票最多的候选人当选。(若存在Condorcet候选人,该方法是非排序式选举中唯一能定出Condorcet候选人的方法),8.3.4投票表决,2、排序式选举:选票上反映投票人对候选人的偏好,又称偏好选举。最初由C De Borda(波德)在1770年提出波德规则:投票人在无记名投票时对各候选人排序,如:给其最满意的候选人标1,排名第二的候选人标2,投票完成后计数(波德数),用以表示群对各候选人的排序。Condorcet原则:若群中认为候选人x优于候选人y的人数超过认为候选人y优于候选人x 的人数,则群认为x优于y;若两者人数相等,则群认为x与y无差异。,波德规则,波德规则在实用时亦会出现相悖的情况。例投票人保持对原有各方案的优先顺序,引入不相干的预选方案可能会改变原方案的群排序结果。,原因:波德规则的结果和方案数相关;波德数未提供优先强度的信息。,D,4,3,1,1,2,3,2,4,1,4,2,3,7,8,7,8,Condorcet规则的投票悖论,例:设60个成员对三个候选人的态度是:23人认为a b c,17人认为b c a,2人认为 b a c,8人认为 c b a,10人认为c a b。两两比较得:认为a b 的人数为33人大于认为 b a 的人数27人,故群决策a b ;认为 b c 的人数为42人大于认为 c b 的人数18人,故群决策b c ;认为a c 的人数为25人小于认为 c a 的人数35人,故群决策c a ;,群排序不再具有传递性,而是出现多数票循环!,8.3.4投票表决,以上各种决策规则都反映了人们对于一种通用的公平的群体决策规则的追求:将个人优先顺序集结为一致认可的群体优先顺序。但在50年代,阿罗(Arrow)等人证明了社会选择并不能在完全符合理性的条件下将个人选择顺序集结为群体的选择顺序,少数服从多数的规则并不能提供一个令人满意的社会选择顺序。不存在一种能在各种环境条件下运用而不会产生悖论的规则。,8.3.5 常用的群决策方法及应用实例,设群效用函数具有线性表达式:,其中:X为方案集,ui(x)为第i个决策者已知的效用函数。确定群效用函数的关键,在于确定权数向量,8.3.5 常用的群决策方法及应用实例,1、委托求解法假设群中各成员对选择权都负有责任;群中各成员对选择权的值各有各的意见。委托过程还必须满足以下三点公设:(1)委托公设(2)决策公设(3)代替公设,1、委托求解法,(1)委托公设群的n个成员中的每一个人,都有一委托小组,这个小组是由群中其余n-1个成员组成。成员i 对委托小组每个成员j 指定一个权数Pij,有,当且仅当i=j时,pij=0 ,并且,(一)委托求解法,(3) 代替公设用成员i的委托小组的群效用函数去代替成员i的效用函数,每次替代均作为委托求解的一个步骤。,(2)决策公设每个委托小组都有一形式为 的群效用函数,对方案进行排队,权数按委托公设确定。,1、委托求解法,委托求解法的步骤假设成员i知道其他每个成员的效用函数,不知道其他成员设定的权。成员i能够根据其他成员的效用函数选权 pij (j=1,2, ,n) ,使这些效用函数的组合几乎能够反映成员i的偏好。(1)设成员i对他委托的小组中各成员的效用为 ,指定的权系数为pij (j=1,2, ,n) ,则成员i的效用函数 用委托组的群效用函数代替,即,1、委托求解法,委托求解法的步骤(2)将步骤(1)得到的效用函数 作为各成员的效用函数,一般仍用原设定的权系数 ,第二步再产生成员i的新的委托效用函数,(3)继续上面的委托过程,则成员i第k步的委托效用函数,1、委托求解法,若:当且仅当存在唯一方案x,其效用函数值uk(x)不劣于其余方案,则委托过程中止,无需确定群效用函数。若需对所有方案按群效用优劣值排序,则需确定群效用函数如果uk的每个分量均收敛于相同的函数u,委托过程将产生唯一的群效用函数。即,这里,u为群效用函数, 为成员i第k步的委托效用函数。,1、委托求解法,这里应该注意通过上式计算 时,应该借助齐次马尔可夫链的遍历性,归结为求解方程组,即,满足条件 的唯一解。,又,2、逐步形成群的意见的方法,也称名义群体法(NGT)(Nominal Group Technique)适合规模较小的群,以59个成员为宜,整个过程通常需要6090分钟。步骤:群中有一组织者去指导实施以下步骤:每个成员在安静的环境下写出自己的意见;组织者不分先后的听取并记录这些意见;集体逐条讨论这些意见,并清楚它们的意义;对归纳意见所形成的条目的重要性作初步投票;讨论初步投票结果;最终投票。,3、特尔菲法(Delphi法),与NGT方法相似,不同之处在于:成员数以2050人为宜;书面反映;整个过程大约需要12个小时。三个重要特征匿名反应:向群中每个成员发意见咨询表,匿名反应意见;迭代和受控反馈:包括几次迭代(轮),每一轮都把收集到的意见经过统计处理反馈给群中的成员,经过信息反馈,各成员意见将逐步集中;统计群的反应:把最后一轮得到的各成员的意见,组合成群的意见。,3、特尔菲法(Delphi法),Delphi法的实施步骤:提出问题;(要进行决策,预测或技术咨询的问题)选择并确定群中成员(反应者);对群成员的要求代表性广;对问题较熟悉,丰富的知识,经验,权威性;感兴趣,有时间投入;人数适当.,3、特尔菲法(Delphi法),Delphi法的实施步骤:制订第一个咨询表,并散发给群的成员;收集第一个咨询表,并进行分析;制订第二个咨询表,并散发给群的成员;收集第二个咨询表,并对数据进行统计处理;制订第三个咨询表,并散发给群的成员;收集第三个咨询表,并对新数据进行统计处理;准备最后的报告。,3、特尔菲法(Delphi法),几种常用的统计指标和计算方法中位数和上、下四分位点将所有数值(专家意见)按从小到大的顺序排列并分成四等份,处于三个分割点位置的数值就是四分位数。下四分位数:最小的四分位数,所有数值中,有四分之一小于下四分位数,四分之三大于下四分位数。中位数:中点位置的四分位数。上四分位数:最大的四分位数,所有数值中,有四分之三小于上四分位数,四分之一大于上四分位数。,3、特尔菲法(Delphi法),几种常用的统计指标和计算方法中位数和上、下四分位点中位数表示专家意见的协调结果,上、下四分位数表示专家意见的分散程度,上、下四分位数越接近中位数,表示专家意见越集中。,3、特尔菲法(Delphi法),几种常用的统计指标和计算方法均值和方差方案的优劣程度常用方案的评分值表示。设m个专家对n个方案进行评价,aij表示第i个专家对第j个方案的评分值,则方案评分均值和方差分别为Mj和Dj:,3、特尔菲法(Delphi法),几种常用的统计指标和计算方法满分频率和变异系数满分频率Kj 是对第j个方案打满分专家人数和参加咨询专家人数之比;变异系数Vj 表示方案评分值的波动程度。,3、特尔菲法(Delphi法),几种常用的统计指标和计算方法协调系数:表示专家评价中的相互协调程度,用方案的评价等级测算。 设m个专家对n个方案进行评价,cij表示第i个专家对第j个方案的评价等级(以自然数表示,等级1最高,记:,Sj称为方案j的等级和,dj为方案j的等级和与全部方案等级和的均值之差。,协调系数,当各位专家对各方案没有给出相同等级时,协调系数计算公式为,当存在相同等级时,协调系数计算公式为,其中,Ti为相同等级指标,计算公式为,L为第i个专家评价中相同等级的组数,tk表示在L组中第k组相同等级的方案数,k=1,2, ,L。,4、多指标群组决策方法,在各专家作出独立评价后,根据各个专家不同的评价结果,综合成群组决策结论的方法。常用有(1)综合加权法设有m个方案,n个指标,s个决策者。n个指标的权重向量为,第k个决策者的权重系数为k,(1) 综合加权法,综合加权法的步骤:专家组的每个决策者单独对各方案进行多指标决策。设第k个决策者对第i个方案的第j个目标评价值为,评价值采用统一标准评分,得到评价值矩阵:,(1) 综合加权法,综合加权法的步骤:分别计算各方案的算术加权平均分和几何加权平均分,几何加权平均分,算术加权平均分,(1) 综合加权法,综合加权法的步骤:计算各方案的混合平均分,计算各方案的评价系数,计算各方案的总体平均分,根据评价系数,对各方案进行群组决策排序。,关键词,逆序归纳法 (reverse order induction)多阶段决策 (multistage decision-making)序列决策 (sequential decision-making)马尔可夫决策 (Markov decision-making)群决策 (group decision-making),