研究生决策理论与方法课程.ppt
《研究生决策理论与方法课程.ppt》由会员分享,可在线阅读,更多相关《研究生决策理论与方法课程.ppt(250页珍藏版)》请在三一办公上搜索。
1、决策理论与方法研究生课程,胡隆基华中科技大学公共管理学院,第一讲 引论,本讲主要内容,1.何谓决策?2.系统化决策的过程3.决策的类型4.决策理论的发展历程5.本课程的内容安排6.考试方法,1.何谓决策,1决策的定义,决策就是对各种可行方案的选择。是面对“选择性”时所作的“抉择”。决策判断抉择“选择性”是决策的必要和充分条件,要避免“霍布森选择”。判断是个认识过程,表现为对某一现象的认识,确定对象是否具备某种属性。好的决策好的结果,但会提高取得好的结果的概率。坏的决策也可能碰巧取得好的结果(“谋事在人,成事在天”),2.系统化决策的过程,2.1 决策一般过程,目标(含价值观与准则),买车决策,
2、一、识别问题老王上班地点离家很远,每天都要6点起床去挤8路电车上班,很是痛苦。某天突发横财,为了自己多年7点起床的梦想,决定买车。老王认为自己的问题是:“如何买一辆适合自己的车”,二、拟定备选方案大众GOLF本田飞渡东风标致307现代伊兰特,三、确定决策目标和标准目标:自己满意的车标准:价格、耐用性、油耗、舒适性、外形,给每个标准赋予权重,四、依据目标和标准对备选方案进行评估步骤一,步骤二,五 方案选择本田飞度,3 决策问题的类型,3.1 决策的人数,个人决策。决策者一个群体决策。决策者多个,一起对一个共同的问题进行决策。,3.2 方案的多少,单一方案接受与否的是非决策问题多个备选方案中选择一
3、个方案的单选决策问题多个备选方案中选择多个方案的组合决策问题,3.3 有否对手,独立决策。你的决策对别人没影响,别人的决策对你也没影响互动决策,也称为对策(博奕论)。对方的决策,就是本方的未来客观条件,反之,本方的决策也是对方的未来客观条件。,3.4 未来状况信息的特征,确定性决策。田忌、齐威王赛马,非确定型决策(Indeterminateness):风险决策,不确定型(Uncertainty)决策,3.5 决策目标的多寡,单目标决策多目标决策,3.6 决策的目的,个人决策为自己决策。标准:“自己不后悔就行”,决策过程不需要公开透明公共决策为他人决策。标准:“大家的认可”,所以决策过程需要公开
4、和透明,同时需要相关人员的参与。政治就是妥协,4 决策理论的分类和发展历程,4.1 决策理论的分类,一般来说分为两类:理性决策。出发点是提供一套规则,以综合反映人们的优先观念和对不确定前景的信念,从而选择出满意的方案。行为决策。主要是研究决策中的心理和认知内容(这是一个已经获得两次),4.2 发展历程,理性决策理论:(两个主题:“准则”和“不确定性”)理性决策理论是1738年,伯努利提出效用值的概念,以及用概率反映不确定性1881年,埃奇沃思,提出序数效用论1931年,拉母西,1944冯 洛伊曼和摩根斯坦提出效用值运算定理。基数效用论再次兴起1950s萨维奇建立贝叶斯决策理论1966年,霍华德
5、决策分析:应用决策理论,首次提出“决策分析”一词。,行为决策理论:1978年,西蒙获得诺贝尔奖(50年代就开始研究了)行为决策理论的开创者:爱德华兹和阿莱斯(1988年诺贝尔奖得主)。2002年,卡尼曼(诺贝尔奖),特沃斯基神经心理学、神经决策理论。这个领域还会有人获奖。,群体决策1972,阿罗。群体决策、社会选择理论1986,布坎南,政治决策的经济分析1998,阿马蒂亚森。社会选择理论,5 本课程内容安排,2 不确定型决策3 风险决策回顾4 博弈论基础,6 考试方法,?,参考书,李怀祖决策理论导论机械工业出版社,1992李瑛决策统计分析6、7、9章,天津大学出版社,2005丁以中,Jenni
6、fer S.Shang管理科学运用Spreadsheet建模和求解9、10章,清华大学出版社,2005年如果对决策心理学感兴趣自己参阅:庄锦英,决策心理学,上海教育出版社,2006马可斯.巴泽曼管理决策中的判断第六版,人民邮电出版社,2007哈蒙德,肯尼,莱福,决策的艺术上海人民出版社,2003,第二讲 不确定型决策分析,本讲主要内容,1.何谓不确定型决策?2.乐观决策法3.悲观决策法4.乐观系数决策法5.最小的最大后悔值法6.拉普拉斯决策法,1.何谓不确定型决策,1.1 引例,假设北京市机场要进行扩建,需要重新选址再建一个机场。已经确定了两个可能的新机场建设地址:A和B,但是还没有下最终结论
7、。希尔顿酒店计划在新机场附近新建一家酒店。该酒店面临的决策问题就是:在哪里购买土地?,拟定方案:1)在A购买;2)在B购买;3)在AB都购买;4)都不买设定目标和标准:收益最大化评价。分析这类问题最常见的方法是构建一个收益矩阵。自然状态:未来决策环境中可能出现的各种状况称之为自然状态。收益矩阵就是有关:所有备选方案在每一种可能的自然状态下最终结果的总结表。,收益表,数据表,引例的收益矩阵,特点:机场究竟建在何处对于希尔顿酒店来说,完全不知道。这就是不确定型决策。也就是究竟哪一个自然状态会发生,决策者没有一点信息。,2.乐观决策法,乐观决策法,又叫:好中求好法、最大最大法。基本思想就是:认为在最
8、乐观的自然状态下具有最大收益值的那个方案就是最佳方案。求法:首先求出每个行动方案在各种自然状态下的最大收益值,然后求出各个最大收益值的最大值,该最大值对应的方案就是最佳方案。,13,11,5,0,乐观决策有时候会导致决策失误!,思考题 用乐观法求解下题,3.悲观决策法,也叫坏中求好法(Wald方法),最小中的最大化法。认为最悲观的自然状态下具有最大效益的哪个方案就是最佳方案算法:首先求出每个方案在各种自然状态下的最小收益值,然后求出各个最小收益值中的最大值,该最大值对应的方案就是最佳方案。,12,8,1,0,思考题:为什么悲观决策法不是坏中求坏呢?,悲观决策法也可能犯错误,思考题:用悲观法求下
9、题,4.乐观系数决策法,又称为Hurwicz 决策法、折衷法。首先主观设定一个0,1之间的乐观系数。当系数为0时,为悲观法,为1时,就是乐观法。计算出各个方案的最乐观结局与最悲观结局的折衷值,其公式为:,比较各个行动方案的结果,选择受益最大的那个行动方案。,0.5,1.5,2,0,思考题:用乐观系数法求下题,5.最小的最大后悔值法,概念和计算步骤,也称Savage方法。所谓某个方案在某个自然状态下的后悔值(或者机会损失)等于某个自然状态的最大报酬值减去该方案在该自然状态下的报酬值。首先将收益矩阵转化成后悔值矩阵;决策准则:在全部方案的最大后悔值中选取最小值对应的方案。,原来的收益矩阵,23,2
10、1,12,13,用最小的最大后悔值法求解下题,后悔值矩阵,200,140,100,注意!,在Savage法的指导下,有时候可能会作出莫名其妙的决策。例如:考虑下面的收益矩阵,转化为后悔值矩阵,4,5,假定还有一个备选方案,,后悔值矩阵,6.拉普拉斯决策法,概念和计算步骤,也称为等可能法。其思想是假定各种自然状态出现的可能性是相同的,然后计算各种方案的期望收益。假设有n中可能发生的自然状态,假定每种自然状态发生的概率均相等,则每种自然状态发生的概率等于1n;由此计算出各种方案的期望收益。选择期望收益最大的方案为最优方案。,113.3,130,153.3,补充例子,例:假设某种产品只能批量生产,成
11、本30元/件,批发价35元/件,当月售不完1元/件。每批10件,最大生产力40件/月(批量生产与销售),应如何决策?,第三讲 风险型决策分析,本讲主要内容,part1.何谓风险型决策?Part2 期望收益理论1.最大期望价值法2.最小期望后悔值法3.灵敏性分析4.决策树技术5.多级决策问题6.贝叶斯决策part3.期望效用理论part4.前景理论,Part1.何谓风险型决策,基本概念,1、风险型决策的特征:(1)目标明确;(2)存在两个以上的行动方案;(3)存在两种以上的自然状态;(4)各方案在各自然状态下的损益可计算;(5)未来出现哪种状态不确定,但可估其 概率。,收益表,希尔顿酒店购地的例
12、子,支付(收益)矩阵,Part 2.期望收益理论,最大期望价值法,期望价值(EMV):第i个方案的期望价值定义为:其中,Rij表示备选方案i在第j个自然状态下的益,pj表示第j个自然状态发生的概率。,支付(收益)矩阵,2,3.4,1.4,0,EMV,EMV的含义,EMV是假设决策主体重复进行同一个决策问题时,不断选择某个方案的长期平均收益。所以只有当我们不断面对同意决策问题的时候,选择EMV值的备选方案才有意义,才可能获得该平均收益。当决策只需进行一次的时侯,按照EMV决策原则行事,风险就比较大。,思考题 用最大期望价值法求解下题,方案A的风险相对要大,而EMV决策没考虑这种风险,我们会在效用
13、理论中讨论这个问题,2.最小期望后悔值法,基本概念,思考题:什么是后悔值?期望后悔值(EOL)算法:与前面计算期望收益类似,无非是将收益矩阵替换成后悔值矩阵,最大EMV决策法与最小EOL决策法是等价的,3.灵敏性分析,基本概念,灵敏性分析(也叫敏感性分析),就是改变系统的输入,看输出如何随之变化。对于风险决策中的最大EMV决策法来说,灵敏性分析的任务就是分析随着自然状态的概率的变动,各个方案的EMV的变化趋势。,例题:购地决策的灵敏性分析,2,3.4,1.4,0,EMV,假设机场建在A处的概率变为0.6则EMV A130.6-12*0.4=3EMV B=-8*0.6+11*0.4=-0.4EM
14、V AB=5*O.6-1*0.4=2.6EMV NON=0,各方案EMV变动与P(A)变动的关系,0.4,0.6,EMV,P(A),4.决策树技术,41 决策树的概念,决策树技术是分析决策问题的有效工具之一。特别是当决策问题是多级决策问题时。决策树由以下三个部分构成:(1)决策节点(),方案分枝(2)状态节点(),概率分枝(自然状态)(3)结局节点(),旁边的数字每一行动方案在相应自然状态下的收益值。,决策节点,方案分枝,状态节点,概率分枝,S2,p2,S1,p1,Sn,pn,1000,4000,7000,Am,A2,A1,决策节点,方案分枝,状态节点,概率分枝,损益值,结局节点,42 决策树
15、的结构,-,-,-,思考题:试着将希尔顿酒店的问题转化为决策树,44 利用决策树的求解步骤,决策树技术的使用步骤:(1)绘制决策树(2)从右到左,计算出各个行动方案的期望收益值,并将结果标在相应的状态节点上。(3)选择期望收益值最大的行动方案作为最优方案,2,3.4,1.4,0,3.4,例1:某公司有两个建厂方案,寿命相同,但投资收益不同,情况如下,决策节点 方案分枝 状态节点 概率分枝 损益值,销路好(0.7),销路差(0.3),1,2,3,830,1400,-500,240,-60,销路好(0.7),销路差(0.3),建大厂,建小厂,830,150,5.决策游戏面临不确定条件下的群体决策,
16、2006年5月17日,有一架飞机在沙漠中发生意外,你和一部分的生还者,面临 生死存亡的选择,事件背景4-1 事发在当天上午10点,飞机要在位于美国西南部的沙漠紧急着陆。着陆时,机师和副机师意外身亡,余下你和一群人幸运的没有受伤。,事件背景4-2 出事前,机师无法通知任何人有关飞机的位置。不过从指示器知道距离起飞的城市300公里;而距离最近的城镇,是西北偏北200公里,该处有个矿场。,事件背景4-3 该处除仙人掌外,全是荒芜的沙漠,地势平坦。失事前,天气报告气温达华氏108度。也就是摄氏42度左右;地表温度54摄氏度。,事件背景4-4 你穿着简便:短袖恤衫、长裤、短袜和皮鞋。口袋中有十多元的辅币
17、、五百多元纸币、香烟一包、打火机和原子笔各一支。,事件背景 事发在当天上午10点,飞机要在位于美国西南部的沙漠紧急着陆。着陆时,机师和副机师意外身亡,余下你和一群人幸运的没有受伤。出事前,机师无法通知任何人有关飞机的位置。不过从指示器知道距离起飞的城市120公里;而距离最近的城镇,是西北偏北100公里,该处有个矿场。该处除仙人掌外,全是荒芜的沙漠,地势平坦。失事前,天气报告气温达华氏108度。你穿着简便:短袖恤衫、长裤、短袜和皮鞋。口袋中有十多元的辅币、五百多元纸币、香烟一包、打火机和原子笔各一支。,“沙漠求生”专家的答案,在第二次世界大战期间,一位专家曾在撒哈拉沙漠工作,研究在沙漠求生的问题
18、。他搜集了无数事件和生还者的资料,给出以下答案,并详细解释其理由。,1 化妆镜 在各项物品中,镜子是获救的关键。在白天用来表示你的位置,是最快和最有效的工具。镜子在太阳光下,可产生相当于五到七万支烛光;如反射太阳光线,在地平线另一端也可看到。如没有其他物品,只有一面镜子,你也有80%获救的机会。,2 每人外套一件 如失事的位置被获悉,在拯救队未到前,便要设法减低体内水分的散发。人体内有40%是水分,流汗和呼吸会使水分消失,保持镇定可减低脱水的速度。穿上外套能减低皮肤表面的水分散发,假如没有外套,维持生命的时间便减少一天。,3 每人4公升清水 如有上述(1)、(2)两项物品,可生存三日。水有助减
19、低身体内脱水的速度,口渴时,最好喝水,使头脑清醒。尤其是在第一天,要制造遮蔽的地方。当身体开始脱水时,喝水也没有多大效用。,4 手电筒(4个电池大小)在晚上,手电筒是最快和最可靠的发讯号工具。有化妆镜和手电筒,24小时都可以发出信号。电筒也有其他用途:日间可用电筒的反光镜和玻璃做信号及点火引燃之用;装电池的部分可用来挖掘或盛水。(参考塑料雨衣部分之蒸馏作用)。,5 降落伞(红色和白色)可用做遮荫和发信号。用仙人掌做营杆,降落伞做营顶,可降低20%的温度。,6 大砍刀 刀可切断坚韧的仙人掌,也有其他用途。刀可排列在较前的位置。,7 塑料雨衣 可做“集水器”。在地上挖一洞,用雨衣盖在上面,然后在雨
20、衣中央放一小石块,使之成漏斗形。日夜温差可使空气的水分附在雨衣上,将雨衣上的水滴在电筒盖中存储。每天大约可收集半公升的水。,8 0.45口径手枪(装有弹药)第二天之后,你们说话和行动已很困难,身体已经产生6-8%的脱水,手枪于是成为很有用的工具;弹药有时要做起火之用。国际的求救信号是连续发三个短的符号。在无数事件中,由于求生者不能发出求救声音,所以没有被人发现。另外,枪柄可做锤子用。,9 每人太阳镜1副 在猛烈的太阳光下,会患光盲症。用降落伞遮荫可避免眼睛受损;也可用黑烟将眼镜熏黑;用手绢或纱布蒙眼,也可避免眼睛被太阳光灼伤。但用太阳镜则更舒适。,10 薄纱布1箱 沙漠湿度低,身体的脱水会使血
21、液凝结,减少血液流失。有事件记录:有一男子体内失去水分,而身上的衣服已被撕破,倒在尖锐的仙人掌和石块上,满身伤口,但没有流血。后来被救,饮水后伤口才流血。纱布可当绳子或包扎脚部、足踝、头部或面部做保护之用。,第四章 对策论博弈论基础,引言、博弈论发展历程,博弈论(game theory)是由美国数学家冯诺依曼(Von.Neumann)和经济学家摩根斯坦(Morgenstern)于1944年创立的带有方法论性质的学科,它被广泛应用于经济学、人工智能、生物学、火箭工程技术、军事及政治科学等。,1994年,三位博弈论专家即数学家纳什(Nash,他的故事被好莱坞拍成电影美丽心灵,该影片获得了2002年
22、奥斯卡金像奖的四项大奖)、经济学家海萨尼(Harsanyi)和泽尔滕(Selten)因在博弈论及其在经济学中的应用研究上所作出巨大贡献而获得诺贝尔经济学奖。,1996年,两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯(Mirrlees)和维克里(Vickrey)、以及2001年三位经济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运用博弈论研究信息经济学所取得的成就而成为这两个年度的诺贝尔经济学奖得主。专家预计,近几年还会有更多的博弈论专家可能获得诺贝尔经济学奖。,一、囚徒困境,1.囚徒困境 两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据
23、。警方将两人分别置于两间房间分开审讯,政策是:若一人招供但另一人未招,则招者立即被释放,未招者判入狱10年;若二人都招则两人各判刑8年;若两人都不招则未获证据但因私入民宅都拘留1年。,表1 囚徒困境博弈 乙 招 不招 招 甲 不招(问题1:甲、乙如何选择?),尽管甲不知乙是否招供,但他认为自己选“招”最好,因而甲会选择“招”,乙也同样会选择“招”,结果各判8年;但若两人都不招,结果是两人只被判1年,但这种结果是不会出现的。我们可以运用“剔除劣策略”的方法来获得这样的结果。,甲或乙可以作出的选择被称为“策略”,如“招”或“不招”都是策略。,对甲来说,尽管他不知道乙是选择了“招”还是“不招”,他发
24、现他自己选择“招”都是比选择“不招”为好的。因此,“不招”是相对于“招”的劣策略,他不会选择劣策略。所以,甲会选择“招”。同样,根据对称性,乙也会选择“招”,结果是甲乙两人都“招”。,甲和乙是参与博弈的人,称为“局中人”。表1中每一个小方格内的数字被称为局中人的支付,其中左边的数字代表甲的支付,右边的是乙的支付。表1中的双变量矩阵称为博弈支付矩阵。局中人所选择的战略构成的组合(招,招)被称为博弈均衡。这个组合中前后两个战略分别表示甲和乙所选择的战略。,表1 囚徒困境博弈 乙 招 不招 招 甲 不招,甲和乙都不会选择劣策略“不招”,称为“剔除劣策略的占优策略均衡”。其中“招”是占优于(优于)“不
25、招”的占优策略。我们可以利用这个道理来分析日常生活中的许多不合作现象。,2.生活中的“囚徒困境”例子,例子1 商家价格战 出售同类产品的商家之间本来可以通过共同将价格维持在高位而获利,但实际上却是相互杀价,结果都赚不到钱。当一些商家共谋将价格抬高,消费者实际上不用着急,因为商家联合维持高价的垄断行为一般不会持久,可以等待垄断的自身崩溃,价格就会掉下来。,譬如,2000年我国几家生产彩电的大厂商合谋将彩电价格维持高位,他们搞了一个“彩电厂家价格自律联盟”,并在深圳举行了由多家彩电厂商首脑参加的“彩电厂商自律联盟高峰会议”。当时,国家有关部门还未出台相关的反垄断法律,对于这种在发达国家明显属于违法
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 研究生 决策 理论 方法 课程
链接地址:https://www.31ppt.com/p-5806224.html