欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > DOC文档下载  

    基于贝叶斯网络的西藏区域经济影响因素分析硕士学位论文.doc

    • 资源ID:4022663       资源大小:696KB        全文页数:46页
    • 资源格式: DOC        下载积分:8金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要8金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    基于贝叶斯网络的西藏区域经济影响因素分析硕士学位论文.doc

    硕 士 研 究 生 学 位 论 文题 目 基于贝叶斯网络的西藏区域经济影响因素分析Tibets regional economic impact of factor analysis based on Bayesian networks扉页:独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人或集体已经发表或撰写过的研究成果,对本文的研究做出贡献的集体和个人均已在论文中作了明确的说明并表示了谢意。研究生签名: 日 期: 论文使用和授权说明本人完全了解云南大学有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交学位论文和论文电子版;允许论文被查阅或借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。 (保密的论文在解密后应遵循此规定)研究生签名: 导师签名: 日 期: 本人及导师同意将学位论文提交至清华大学“中国学术期刊(光盘版)电子杂志社”进行电子和网络出版,并编入CNKI系列数据库,传播本学位论文的全部或部分内容,同意按中国优秀博硕士学位论文全文数据库出版章程规定享受相关权益。研究生签名: 导师签名: 日 期: 摘 要由于自然条件十分恶劣和残酷,以及种种历史原因,西藏地区的经济发展水平一直远远落后于全国平均水平。改革开放以来,中央加大了对西藏地区经济发展的扶持力度,促进西藏地区的经济发展。近年来,西藏地区一直保持高速的经济发展,经济总量稳步提高,产业结构进一步优化,城乡居民的收入水平有了显著提高,大大改善了西藏人民的生活水平。西藏地区的经济发展水平直接关系到我国整体的经济发展水平以及现代化建设的进程,更是关系到西藏地区以及我国的经济社会的和谐发展。因此,我们更应该关注西藏地区的经济发展。研究西藏地区的经济发展作为区域经济研究的一部分,能够促进区域经济研究的纵深发展,对促进西藏地区的经济发展具有重要意义。本文引入贝叶斯网络模型分析西藏区域经济发展的影响因素,运用定量分析和定性分析、实证分析与规范分析相结合的方法,以相关理论为基础,以相关实践为借鉴,通过系统性地结合相关的定性资料和定量的数据,构建贝叶斯网络模型。由于贝叶斯网络模型具备了图形化的表示方法,而且因果关系推理清晰,并且支持不完全数据的推理以及不确定性的推理等优势,所以能够较好地处理西藏区域经济发展的数据,得出可理解性强的结论。本文首先通过文献理论分析以及对西藏区域经济发展的实例研究,对西藏地区经济发展的历程、现状及存在的问题进行梳理和分析,然后构建贝叶斯网络模型并对模型的有效性和可行性进行分析,并对模型结果进行解释,分析西藏区域经济发展的影响因素及影响程度,找出制约西藏地区经济发展的主要原因,最后提出相应的对策与建议以期促进西藏地区的经济发展。关键词:西藏;区域经济;贝叶斯网络IAbstractDue to the natural conditions in Tibetan areas is harsh and cruel, as well as various historical reasons, the economic development in Tibetan area has been lagging far behind the national average. Since China implemented its reform and opening up policies, Chinese Central Government stepped up more support to Tibet for its economic development. Chinese Central Government held several work conference about Tibetan issues and developed a series of special policies to promote its economic development according to the actual situation of economic and social development from the different periods. In recent years, Tibet has maintained rapid economic development-the total economy steadily improved, the industrial structure optimized further, the income level of urban and rural residents have been significantly improved, and the living standards of all the people in Tibet have greatly improved by the joint efforts of Chinese Central Government and the Tibetan people. Regional economic development in Tibet has achieved remarkable results, but the overall level still lags behind central and eastern regions in China. The level of economic development in Tibet is not only directly related to the overall level of economic development and modernization in China, but also is related to the harmonious development of the Tibetan areas. Therefore, we should be concerned about the region's economic development in Tibet. The study of economic development in Tibet as part of a regional economic research, can contribute to the depth of the regional economic development, enhancing the theoretical depth of the theory.IIThis paper introduces a Bayesian network model to analyze the factors affecting the economic development of Tibetan area. By constructing a Bayesian network model, the paper systematically combines qualitative data with quantitative data. Bayesian network model with graphical representation, clear causality and more support of incomplete or uncertain data is better able to handle the data of Economic Development in Tibetan areas to receive final results well understood.Firstly, this paper sorts out and analyzes the economic development history, current situation and problems in Tibetan areas; secondly, builds the Bayesian network model and then analyzes the effectiveness and feasibility of the model as well as model results; thirdly, do the analysis of influencing factors to the economic development in Tibetan areas to identify the main reason for restricting economic development in Tibetan areas; finally, get the corresponding countermeasures and suggestions in order to promote economic development in Tibetan areas. Key Words: Tibet; Regional Economics; Bayesian network.第一章 绪论1.1选题背景及研究意义西藏地处亚洲大陆的内陆腹地,全区平均海拔高度在4000米以上,空气稀薄,低温缺氧,自然条件十分恶劣,加之种种历史原因,使得西藏地区的经济发展水平一直远远落后于全国平均水平。在农业上,西藏农业还基本上是“温饱农业”,农业结构单一,绝大多数农牧区还处于自给或半自给的自然状态;在工业上,西藏地区的基础产业发展十分薄弱,尤其是一些能源工业的发展严重落后,一些“瓶颈”产业的落后严重制约着全区工业化的发展;在服务业方面,西藏地区起步的比较晚,发展的比较慢,一直处于较为落后的水平。经济发展是社会发展的前提和基础,社会发展是经济发展的最终目的。只有明确并实现好这个目标,才能实现“共同团结奋斗,共同繁荣发展”。因此,对于西藏地区来说,发展经济、脱贫致富、赶上全国发展水平是摆在西藏各族人民面前的头等大事,也是我们实现共同富裕的必经之路。 扶持和发展西藏经济,先富带动后富,实现共同富裕是我党一贯的宗旨和要求,中央一直都高度重视西藏地区的经济发展。改革开放以来,我国加大了对西藏地区的扶持力度,中央组织召开多次西藏工作会议,根据不同时期西藏经济社会发展的实际情况制订了一系列促进西藏地区经济发展的特殊政策。中央组织的第五次西藏工作会议明确提出,新形势下西藏经济社会发展的目标是:“努力使西藏建设成为重要的国家安全屏障、重要的生态安全屏障、重要的战略资源储备基地、重要的高原特色农产品基地、重要的中华民族特色文化保护地、重要的世界旅游目的地。这是统筹全国发展大局。”中央也多次强调西藏的发展、稳定和安全,事关西部大开发的实施,事关民族团结和社会稳定,事关祖国统一和安全,也事关我们的国家形象和国际斗争。在中央的高度重视以及西藏地区的努力下,近年来,西藏地区一直保持较高经济发展水平,经济总量稳步提高,经济结构进一步优化,城乡居民的收入水平有了显著提高,居民的生活水平有了较大改善,但我们仍需注意,西藏地区经济虽然取得了较快发展但整体水平仍落后于我国中部和东部地区,因此,我们应更加关注西藏地区的经济发展问题。由此可见,西藏经济发展水平直接关系到中国经济发展水平,关系到我国现代化建设的全局,关系到当地各民族生活水平的提高和生活质量的改善,同时也关系到西藏经济社会的和谐发展。在这样的时代背景下,本文对西藏地区经济发展历程和现状进行研究,建立贝叶斯网络模型,主要研究如下问题:第一、通过文献理论分析以及对西藏区域经济发展的实例研究,定性分析影响西藏区域经济发展的因素;第二、以这套影响因素为基础,充分利用现实数据,构建贝叶斯网络模型,同时需要对模型的在有效性及可行性方面进行分析;第三、需要对模型的结果进行说明,并运用模型推理来分析各影响因素对西藏区域经济发展的影响程度,然后找出制约西藏地区经济发展的主要原因,并提出一些切实可行的合理化建议。本文的研究对西藏地区经济社会的发展具有深远的影响及非常现实的指导意义,也有利于促进我国社会的持续、高速、健康发展。此外,本文以选择西藏自治区作为研究对象,对西藏地区的经济发展数据进行研究,以期通过本文的研究为西藏自治区的经济社会发展建言献策。1.2文献综述贝叶斯网络模型(英语全称Bayesian network)又称之为信念网络模型(英文Belief Network),由Judea Pearl首先提出。贝叶斯网络其实只是一个有向型的无环图(英文全称Directed Acyclic Graph, DAG),而且这个有向型的无环图主要由表示变量的节点以及这些节点的所有有向边组成。而随机变量则主要使用节点来表达,同时对于节点之间的关系(一般指由父节点到其子节点)一般由各个节点之间的有向边表示。其中,使用条件概率来描述这种表达关系的强度,对于没有父节点的节点则首先使用先验概率方法来描述。需要指出的是节点变量一般是任何问题的抽象描述,比如待测试值,观测的现象,意见的征询等。贝叶斯网络一般适合于分析和表示概率性以及不确定性的某系列事件,通常应用于由多条件依赖性及多种可能的控制因素的决策分析,主要从不确定性的、不完全的或不精确的系统知识或信息系统中进行推理。近年来,贝叶斯网络在统计学、决策分析、人工智能等领域已有越来越多的应用。1.2.1国外研究动态贝叶斯统计在国外的研究具有悠久的历史,早在1763年,英国数学家贝叶斯(R. T. Bayes)创立了贝叶斯统计方法,在20世纪30年代形成了贝叶斯学派,这是贝叶斯网络的基础。Pearl在1968年首次在专家系统里引入了贝叶斯网络,而在1988年,Pearl进一步明确了影响图中根本没有决策的节点以及结果的节点其实就是贝叶斯网络。在20世纪的80年代前期,贝叶斯网络主要用于在专家系统里对不确定性的专家系统知识进行编码及描述;20世纪80年代后期,贝叶斯网络得到了迅速发展;20世纪90年代以来,研究集中在贝叶斯网络推理的各种方法和从数据中进行贝叶斯网络学习的各种方法。1968年,C.K. Chow和C.N. Liu1给出了如何通过构造一种树状的网络模型从而对给定的某种联合的概率分布P来分解并进行表示的算法;G. Rebane 和Judea Pearl2在1987年在Chow-Liu算法的基础上进行了改进,将其扩展到多树结构,并提出了利用条件独立性关系来确定边的方向,从而开始了有向图构建的研究。这个阶段属于概率贝叶斯网络阶段。20世纪80年代末,人工智能等领域从构建因果系统模型来对贝叶斯网络进行研究,从而进入了因果贝叶斯阶段。Heckerman等人在1994年的一份微软研究院技术报告3中,对于各种先验信息给定的情况下,如何进行贝叶斯网络结构学习进行了系统的研究,并给出了统一的将先验知识和统计数据相结合的结构学习算法。同时,研究人员也在尝试没有先验信息下贝叶斯网络结构的学习。Wallace4在1996年发表了类似的算法,利用最小信息长度作为衡量标准,也取得了很好的效果。Tian5在2001年提出了通过检测底层数据模型的变化来进行学习的方法。近年来,贝叶斯网络经过近30年的发展,出现了许多扩展模型,包括在结构化数据中的扩展,代表性的模型有面向对象贝叶斯网络和层次贝叶斯网络;在复杂关系数据中的扩展,最具代表性的是概率关系模型;在迭代反馈过程中的扩展,代表模型为有环贝叶斯网络;在时变系统中的扩展动态贝叶斯网络。1.2.2国内研究动态国内关于贝叶斯网络的研究较晚,目前还处于起步阶段,已有的研究成果多为应用研究型。在理论研究中,我国的研究文献多为综述类文献。王军等(1999)6对贝叶斯网络这些最基本的理论研究给出了综述,主要包括了算法的复杂性、系统知识工程、系统知识结构及表达、系统学习及推理的方法等多个方面。贺炜、潘泉、张洪才(2004)7对贝叶斯网络结构学习的整个发展历程进行了完整回顾,并对该领域的相关研究及存在的问题进行了分析。概率推理是贝叶斯网络的内容之一,厉海涛、金光、周经伦等(2008)8对迄今为止的贝叶斯网络推理算法进行综述,从复杂度、适用性、精度等方面对其进行分析对比,为实际应用提供参考。陈新亿、李娟、李斯娜等(2009)9从贝叶斯定理出发,对贝叶斯网络的学习和应用进行了研究综述,并对其发展趋势作了展望。由于理论和实际的需要,贝叶斯网络不断发展,出现了许多扩展模型及方法。在实证研究中,早期的研究主要是将贝叶斯网络用于数据挖掘,随着研究的深入,其应用领域越来越广,包括人工智能、互联网、医学、生物领域等,本文主要对其在经济领域的应用做一个梳理。臧玉卫、王萍等(2003)10将贝叶斯网络应用于股指期货信用风险建模上,从而识别和预测股指期货风险。王世卿、马大为(2004)11年提出了基于贝叶斯网络的实时行情预测算法,该算法为证券、期货等交易领域的行情预测提供了借鉴,在当时具有广阔的应用前景。温树海(2005)12通过构建贝叶斯网络模型克服了商业银行风险管理中历史数据缺乏的问题,并通过情景分析和因果分析对影响操作风险指标的因素进行排序,从而有效控制风险。陆静(2006)13、王惠等(2009)14建立了以贝叶斯网络为基础的操作风险管理模型,对操作风险进行了度量和监控。赵红同等(2008)15在工程项目风险管理中引入贝叶斯网络方法,研究工程项目中关键风险因素,从而进行风险控制。宋力、李尧(2006)16通过对样本上市公司的财务数据进行分析,运用贝叶斯网络分析方法,建立了能发现上市公司财务危机的财务预警模型。宋力、褚桂云(2007)17将贝叶斯网络独有的结合先验知识和后验学习对事物进行预测和诊断的功能应用到财务管理领域,构建了上市公司财务指标真实性模型,从而对财务信息真实性判断提供了新的方法。薛成明、梁世军(2011)18将贝叶斯网络与进化规划算法相结合,构建出上市公司财务预警模型,其结果直观地表现出财务比率与上市公司财务状况的因果关系,为我国上市公司提供了决策支持。1.3研究内容及结构本文的研究框架如图1-1所示:基于贝叶斯网络的西藏区域经济影响因素分析贝叶斯网络理论的学习贝叶斯网络模型构建步骤贝叶斯网络模型构建算法西藏经济现状贝叶斯网络理论影响因素选取贝叶斯网络模型构建定量分析与定性分析总结与展望图1-1:本文的研究框架具体来说,本文的内容主要分为以下五个部分:第一章:绪论。主要介绍了本文的选题背景、问题的提出以及本文所采用的研究方法。第二章:贝叶斯网络模型理论基础。介绍了贝叶斯网络的基本理论、网络模型基础理论的学习、模型的构建步骤以及模型的构建算法与数据预处理等。第三章:西藏地区经济数据影响因素的指标选取。先提出了地区经济影响因素指标选取原则,然后确定指标的选取并对指标含义进行了具体说明。第四章:贝叶斯网络模型的构建与分析。根据贝叶斯网络构建方法构建西藏地区经济贝叶斯网络模型,并对此模型进行结果分析与反向诊断推理,最后根据分析结果对西藏地区经济与社会发展提出切实可行的政策性建议。第五章:总结与展望。主要是对本文所做研究进行系统性的总结,并对下一步工作提出展望。1.4研究方法1.4.1文献研究法本文采用文献研究法,就主题及与之相关的很多学术性的著作、专题性的研究及学位论文或者期刊文章等基础资料来进行系统的归纳和分析,明确指出了研究的课题,从而得到了概括性的基本原理,通过深入的分析和探讨,本文中指出了此研究领域出现的新问题。其优势就在于可以借鉴别人在专业领域研究中得到的经验及教训,避免了前车之鉴的结果,有助于进行问题的定位并了解目前在此领域出现的状况和限制。1.4.2定性分析和定量分析相结合本文在对西藏经济发展的影响因素进行分析的过程中,采取了定性分析与定量分析相结合的方法。首先是定量分析,主要采用贝叶斯网络模型进行分析研究,参考相关文献,结合西藏经济发展实际状况对主要影响因素指标进行了选取及处理,确定目标节点及普通节点,利用BN PowerConstructor软件构建贝叶斯网络模型并作出分析。在定量分析完毕后,采用了定性分析的方法,以对不能进行定量分析和没有考虑到的因素,如政策因素等进行分析。1.4.3实证分析与规范分析相结合本文对西藏地区经济发展的现状及存在的问题进行了评价和分析,为进行下一步的模型分析奠定基础。这是建立在数据搜集与运算的基础上,这属于规范分析;根据指标体系及选取的模型对西藏地区经济发展影响因素进行分析,并根据分析结果提出相关的政策建议的方法属于实证分析;在实证分析的同时,对贝叶斯网络理论及其相关内容的归纳与总结属于规范归纳的范畴。1.5创新点与不足之处研究区域经济发展的影响因素是区域经济研究的重要组成部分。但由于经济发展自身的复杂性等因素,加上研究区域空间尺度不同、分析的时期不同、选择的统计指标不同、研究的计量方法不同,导致现有的区域经济发展的影响因素的研仍处在不断发展完善中。本文的创新之处是将贝叶斯网络模型引入到西藏地区经济发展的影响因素的研究中。贝叶斯网络其实就是某种概率性的网络,它是基于某种概率推理性的可视化图形网络,是能够结合定性的资料和定量研究的数据系统,是处理不完备的数据以及不确定性的信息的重要研究工具。利用贝叶斯网络模型,能够全面地、综合地考虑影响因素,将收集到的数据进行模型的实证分析,分析影响西藏区域经济发展的影响因素。本文研究的不足之处在于在模型构建前的评价体系的构建过程中,需要选取一系列相关的指标,由于受自身研究水平的制约,指标选取可能存在指标评价体系中的个别重要因素只能进行定性描述,这在一定程度上也影响到了模型分析结果的全面性和准确性,如政策支持等不能量化。第二章 贝叶斯系统的网络模型理论基础英国的一位学者贝叶斯(英文名Bayes)首次指出来一种有关基于贝叶斯网络模型的统计理论,而且在该理论中明确的提出了:任意的一个未知的量应该是能够当做是一个随机的变量,此随机的变量的概率分布情况需要通过在抽样之前由某些先验的信息的概率来描述。而在1988年,学者Judea Pearl也提出了关于贝叶斯系统网络的基本理论及思想。基于贝叶斯的网络模型(英文全称Bayesian Network),也可以称之为基于贝叶斯的信念网络模型(英文Bayesian Belief Network),它主要用于表示某个变量集合在连接以后在概率表现方面的图形模型,同时表达了某种因果关系。贝叶斯网络模型结合了样本的数据以及先验的信息,并充分借鉴了专家系统知识及其经验,然后进行了定量的分析以及定性的分析,这就避免了多度拟合数据的情况,同时可以实现主观结合客观,同时又可以避免由于主观因素的存在带来的偏差。贝叶斯网络模型其实是采用了比较简洁的图解模型方法来表示多个变量之间存在潜在的关联特性,效果清晰明显,所以推理的结果在可信度上面应该是很强的,这样方便理解及解释。经过了20多年的发展历程,贝叶斯网络已经发展得相当成熟,形成了相对完整的理论结构体系以及推理算法理论,并逐渐成为处理不确定性的信息方法的主流,同时在工业控制方面、经济分析方面、医疗诊断方面、计算机智能学科等多个领域普及应用。2.1贝叶斯系统网络模型基本原理贝叶斯网络模型(英文Bayesian Network,简称BN),又可以称之为贝叶斯可信度网络(英文Bayesian Belief Network,简称BBN)亦或者是信度网,是描述数据变量之间依赖关系的一种图形模式,是图论与概率论相结合并进行推理验证的统计模型方法。其实贝叶斯网络模型只是某种概率相关的推理分析技术,通过利用概率的相关理论来分析和处理处于不同的知识系统的由于某些条件相关联而带来的不确定性。贝叶斯网络模型可以比较直观的表达成某种比较复杂的赋值了的因果关系结构图,在图中每个节点表达了所讨论的问题其域上的变量(或者事件),而节点间的弧则表达了这些事件间在概率层面的依赖关系。基于贝叶斯的网络基础模型能够给人们带来一种便利的系统框架结构,用来表达因果之间的关系,这就可以让具有不确定性的推理逻辑思路变得清晰起来,而且很容易被人理解。从1981年R.Howard以及J.Matheson推出了基于贝叶斯的网络模型(BN)以后,有关贝叶斯网络的研究及应用早已广泛的引起了人们的兴趣。在20世纪80年代前期,贝叶斯网络在专家系统中实现了对不定性系统知识的描述;而在80年代的后期,贝叶斯推理模型进一步得到发展;在进入了90年代以后,在面临信息爆炸时代的局势面前,很多研究人员逐步尝试直接在数据信息中研究和学习生成基于贝叶斯网络的方法,得到了成功的结果。因为贝叶斯网在问题表达和逻辑推理方面更直观,功能更强大,许多不确定问题的研究都倾向于选择贝叶斯网络。贝叶斯网络在许多领域也都实现了成功的应用。因为面临真实世界的诸多复杂的问题,其中需要参考很多依赖条件,所以这就使得基于贝叶斯网络的系统结构变得日趋复杂化。下面来论述一些和它的基本概念、原理、定理有关的基础。使用数学方面的知识来分析和定义有关贝叶斯网的模型如下:如果给定了某个随机的变量集,其中为一个m维的向量,那么贝叶斯网络给出了下述的定义:,据此可知,一个贝叶斯的网络模型一般包含两个重要的部分,它们分别用于对相应的问题领域进行定量描述以及定性的描述,即代表了贝叶斯网络的参数以及贝叶斯网络的结构。第一个部分是基于贝叶斯网络模型结构()代表了一个有向型的无环图(DAG),它主要由一个节点的集合以及一个有向型的边集构成。而DAG又由若干节点以及连接这些节点间的所有有向边构成,节点则代表了问题领域里的随机性的变量,而每个节点对应了一个变量。变量的定义一般主要是指问题中的感兴趣的组件、现象或者属性等,它们具备一定的理论或者实际的意义。节点间的某种依赖或因果的关系一般主要由连接这些节点间的有向边来描述,而这种依赖或因果的关系直接影响到了其方向性(一般是指由父节指向子节点),一般使用由带有连接边的箭头来描述,假如节点之间并没有连接的边那么着就说明节点所关联的变量间并没有依赖或者某种因果的关系,也即表示条件独立。贝叶斯网络模型虽然可以表达因果的关系,但它们事实上并不会局限应用于表达因果关系。基于贝叶斯的网络模型的另外的重要组成部分主要是针对基于条件参数的概率分布表(英文全称Conditional Probability Table,简称为CPT),在该表中指出了每个节点相比较其父节点的所有可能出现的条件的概率。这反映了这些变量间的关联性在局部的概率分布集合。贝叶斯网络模型一般拟定把节点的父节点当做条件,可以和任意的非子节点对应的条件独立。那么概率值就表达了子节点和其父节点间的置信度亦或者是关联的强度,而没有父节点的节点其概率称之为先验概率。贝叶斯网络模型结构主要通过对数据进行实例抽象化来计算结果,其实是对某问题领域里的某种宏观性的描述。而概率的参数则表达了变量(或者节点)间的关联强度,属于定量的描述。贝叶斯网络模型可以看作是某种表达数据变量之间的可能潜在的定性关系和定量关系的结合的方法,它主要采用图形化的结构来表达一组相关的条件的独立声明,并用条件概率表的数据值刻画变量间的依赖强度。由概率的链规则可得: (2.1)对于任一变量,通常可以找到一个与都不独立的最小子集,使得 (2.2)因此,当网络变量元组赋予具体数据值时,贝叶斯网络的联合概率分布可以由下面公式表示: (2.3)为了在某个应用领域建立贝叶斯网络,通常需要完成以下3个内容: (1)确定领域变量及其所有可能值:在领域专家的指导下,确定应用问题里面任何可能存在的观测值,然后选择其中的可以推荐表的用于建立模型的观测值的子集,最后把这些观测值的子集构建成彼此不相交的变量。 (2)如何来定义基于贝叶斯的网络系统结构:主要是借助于专家学者所提供的关于数据学习以及确定各个变量间的相互依赖关系的方法建议,从而来构建一个表达对于条件独立的基于断言的有向的无环结构图。由于对于任意变量,都可以找到一个最小子集,中的变量与变量之间存在依赖关系,因此,为了决定贝叶斯网络的结构,需要完成:将所有变量按某种次序排序;确定满足式(2.2)的父节点集 (i=1 ,2 , ,n)。(3)需要确认贝叶斯模型的网络相关参数:指定或学习得到局部概率:显而易见,上面提到的第(2)步以及第(3)个步骤是整个贝叶斯网模型结构的核心所在,当然上面提到的各个步骤或许会交替进行,不仅仅是简单的顺序性的处理过程。一般来讲,主要使用下面的几种方式来确定基于贝叶斯的网络的相关结构及参数:对于早期的基于贝叶斯的网络系统构建方式,一般使用根据领域的专家多年的积累经验来定义基于贝叶斯的网络的相关结构及其参数,这种专家确定的方式一般用于解决一些较为简单的问题,对于那些变量很少且关系清晰的领域较为适用;对于一些变量之间依赖关系较大的领域,通常采用专家与机器计算结合的方法确定贝叶斯网络结构及参数。具体方法是由具有经验的专家定义结构后,通过机器学习算法从大量数据中得到参数。对于那些数据量较大的领域,我们一般采用机器学习算法从大量训练数据中学习得出贝叶斯网络的结构、参数。2.2贝叶斯系统网络模型基础理论的学习对于贝叶斯网络模型的学习,结合学习的对象的不同,可以进一步的细分为部分学习以及完整学习。对于完整学习,主要针对给定的某个问题领域及其数据实例,再学习和研究出关于参数及结构模型的某种完整的网络;而部分学习,主要针对是在给定的先验的基础上,结合部分的网络结构和参数,充分的利用数据的实例来完成学习及修正的过程,目的是为了得到更加精确的贝叶斯网络模型。对于贝叶斯网络模型的学习,依据给定的数据实例本身的完备性的不同,又可以细分为不完备的数据层次的学习以及完备数据层次的学习;依据的学习方法的不同,还可以进一步分为基于贝叶斯的方法学习、基于MDL方法的学习等。由于贝叶斯网络模型主要由结构以及参数两个部分构成,所以对于贝叶斯网络模型的学习一般包括对结构的学习以及参数的学习。而对贝叶斯网络模型进行学习的目标就是需要构建一种网络,使之可以依据某种测度与给定的实例数据进行拟合,主要过程是寻找一个有向的无环型的结构和某个有向型的无环结构中所有节点关联的条件型概率表(即CPT)。其中构建有向型的无环结构被称之为网络结构的学习,而获得相关的条件概率表的过程则被称之为网络参数的学习。2.2.1基于贝叶斯的网络模型理论的学习对于基于贝叶斯的网络模型结构而言,使用相关的数据集来定义它的参数,所以对其网络模型结构进行学习方法及其算法的探索,一直以来是建立最好的网络模型结构的关键。贝叶斯网络结构学习主要包括变量的发现及定义、融合先验知识以及确定变量间的依赖关系。2.2.1.1变量的发现及定义变量是贝叶斯网络中的最基本元素,所以首先应该定义为随机的变量。定义了变量以后,仅仅需要定义它的结构,主要包括了变量所有潜在的状态或者取值信息。假如变量具有连续性,那么只需要确认它的边界;由于使用目前的推理方法只能处理和计算离散型的变量,所以同时需要对连续的变量进行离散化的处理。而假如已经是离散的,那么就需要确认这些离散状态的数目,同时需要确定这些状态的符号和相关意义。2.2.1.2融合先验知识应该在下面的几种形式里面考虑并利用先验的知识。第一、对应变量的子集是能够确认的但是其它的变量并不能够确认;第二、当变量构成的状态可能已经完全或部分定义。融合这些先验知识能够有效地减少结构学习方面的盲目,同时也可以尽量避免过度拟合数据及其网络结构。 2.2.1.3需要确定各个变量间具有的依赖性关系确认变量间的某种依赖关系(或者是因果关系)其实就是为了确认变量间的连接弧的方向问题,而网络结构的S表示了有向边的集合,可以表示为: (其中指出V是结合的集点)其中,而对于每一个单独的有向连接来说,X表示了Y的父节点。如此,同时可以使用来表达X与Y间的无向连接关系。通过学习基于贝叶斯的网络结构,就可以发现其中的数据集中状态信息、事件以及属性多个实体间存在的某种内在的特性及其关系描述,并使用有向型的无环图实现直观的表示这些关系。基于贝叶斯的网络结构实质可以看作是构建一个模型的基本过程,而关于结构学习的最终目标主要是以图形化的模型来描述这些给定的数据里面存在的依赖关系或者因果关系。2.2.2基于贝叶斯的网络结构模型的相关参数通过学习数据集来确定已知的网络模型结构的有关参数,事实上主要需要学习网络模型结构中的各个节点的相关的概率分布表格。根据样本数据的观测情况,参数学习可分两种情况:完整数据参数的学习以及基于不完整的数据参数的学习。而完整的数据集中的每个实例都应该是具有其独立完整的观测信息数据,而不完备的数据集则主要是指由于某些实例在观测方面或者信息缺失亦或者是观测出现异常的这些情况。一般来讲,通过学习完整的数据集来获得相关的参数的学习方式当前主要包含了最大的似然估计方法、基于贝叶斯的统计方法。通过对不完整数据的相关参数进行学习,一般只要使用某些采用近似的方法,比如Monte-Carlo法,Gaussian逼近方法,当然还有用梯度下降的方法以及EM算法求ML或MAP等。其中,最大的似然估计方法MLE主要使用了传统意义上的统计学方法理论,它们的主要思想是依据对数据样本和模型的参数在相似性上的似然程度来判定采集到的数据样本和贝叶斯的网络模型的拟和程度,而且似然程度一般使用相关的似然函数进行评估。定义为N个随机样本的似然函数是N个随机样本的联合概率,这个概率可以看成是的函数。具体地说,若是独立地抽自某个分布的样本,那么,似然函数表示为张捷,基于贝叶斯网络的分布式商务数据挖掘模型研究,2007年: (2.4)最大似然估计就是已知一组数据样本,估计该样本集最可能来自于哪个分布函数,即在参数空间中找到一个值(用表示),它能使似然函数或似然函数的对数极大化。基于贝叶斯模型网络的似然相关函数的对数一般表达如下: (2.5) 如果令,则上式中的表示样本数据中以及的实例个数,是的局部分布的参数。显然,当时,上式取得最大值,其中是样本集中的实例个数。2.2.3朴素贝叶斯网络模型所谓朴素的贝叶斯网络模型是一种简单的概率模型,该模型假设:通过设定某个特定实例的相关类值,对于实例中的所有的属性的出现情况都需要和其它的实例中的其它的属性的出现情况类似。基于这样的独立性的假设,就使得基于朴素的贝叶斯方法理论和其他的方法相比的话就具备了一些不同的地方,区别如下:它并不一定要进行搜索,仅仅需要进行简单地计算和训练这些实例的每个不同属性值在其发生概率上的值,那么就能够评估并计算出该模型中的所有属性的相关参数。因

    注意事项

    本文(基于贝叶斯网络的西藏区域经济影响因素分析硕士学位论文.doc)为本站会员(文库蛋蛋多)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开