网络工程毕业设计论文信息、知识、智能的转换和算法分析.doc
《网络工程毕业设计论文信息、知识、智能的转换和算法分析.doc》由会员分享,可在线阅读,更多相关《网络工程毕业设计论文信息、知识、智能的转换和算法分析.doc(23页珍藏版)》请在三一办公上搜索。
1、 毕 业 论 文(设计)论文(设计)题目:信息、知识、智能的转换和算法分析 系 别: 专 业: 学 号: 姓 名: 指导教师: 毕 业 论 文(设 计) 开 题 报 告系别:计算机与信息科学系 专业:网络工程学 号 姓 名论文(设计)题目信息、知识、智能的转换和算法分析命题来源教师命题 学生自主命题 教师课题选题意义(不少于300字): 随着信息技术的高速发展,数据库应用的规模、范围和深度不断扩大,已经从单台机器发展到网络环境。由于各种新型技术与数据库技术的有机结合,使数据库领域中的新内容、新应用、新技术层出不穷,形成了庞大的数据库体系,如商业条码的推广、企业和政府利用计算机管理事务的能力增强
2、,产生了大规模的数据。而简单数据信息查询只是数据库内容的选择性输出,无论是查询、统计还是报表,其处理方式都是对指定的数据进行简单的数字处理,而不是对这些数据所包含的内在信息进行提取,因此它和人们期望的分析预测、决策支持等高级应用仍有很大的距离,人们希望能够提供更高层次的数据分析功能,自动和智能的将待处理的数据信息转化为有用的知识。数据挖掘之所以吸引专家学者的研究和引起商业厂家的广泛关注,主要在于大型数据系统的广泛使用和把数据转换成有用的知识,推动社会进步,为企业提供能带来商业利润的决策信息使企业在市场竞争中立于不败之地。研究综述(前人的研究现状及进展情况,不少于600字):Shannon信息论
3、和人工智能理论分别于20世纪40年代和50年代相继产生,系统的知识理论却长期无人问津,成为一段理论空白。这种状况在信息论和人工智能理论发展的初期似乎并没有造成明显的问题,但是,随着研究的不断的深入,知识理论的空白就逐渐成为一种制约,信息论和智能理论的发展陷入受限的尴尬境地。20世纪70年代,由于研究和建造专家系统的需要而出现了“知识工程”。然而,知识工程主要关注了知识的表示和知识的演绎推理的问题,至于如何获取专家系统所需要的知识,则几乎完全依靠专家系统设计者的手工操作。因此,知识工程没有能够形成完全的知识理论。与此同时,数据库系统的三个主要模式:层次、网络和关系型数据库的研究和开发取得了重要进
4、展。20世纪80年代,关系型数据库及其相关的数据模型工具、数据索引及数据组织技术得到广泛采用,并形成了整个数据库市场的主导。事务数据库、主动数据库、知识库、办公信息库等技术也得到蓬勃发展。从20世纪80年代中期开始,关系型数据库技术和新型技术的结合成为数据库研究和开发的重要标志。20世纪90年代,数据挖掘与知识发现应运而生。数据挖掘是一个多学科交叉研究领域,它融合了数据库技术、人工智能、机器学习、统计学、知识工程、面向对象方法、信息检索、高性能计算以及数据可视化等最新技术的研究成果。基于统计学、人工智能、面向对象方法等在内的理论与技术成果已经被成功的应用到商业处理和分析中,这些应用从某种程度上
5、为数据挖掘技术提出和发展起到了极大的推动作用。然而,作为人工智能系统研究的三大主流学派,结构主义、功能主义、行为主义方法各自在信息智能决策中取得了不少的进展和成果,但却是计算机科学研究中争议最多而又始终保持强大生命力的研究领域。在这样的背景下,我国著名信息学者、全信息创始人钟义信教授提出智能系统智能生成的共性核心机制:信息-知识-智能的转换。 “信息-知识-智能的转换”的研究方法将能够更好地为智能理论研究服务,在社会走向信息化和智能化的时代将为人类做出更大的贡献。研究的目标和主要内容(不少于400字)本选题将数据挖掘与机器知行学相结合,通过关联规则挖掘算法,从事务数据库中挖掘知识,实现信息、知
6、识、智能的转换。本选题研究内容如下:(1)对信息、知识、智能的转换理论体系结构及数据挖掘原理的应用进行探究。(2)关联规则Apriori算法分析,Apriori算法的内容分析如下:1)关联规则挖掘实现的基本思路:关联规则是用来揭示数据之间未知的相关依赖关系,通过设置支持度和置信度,生成所需要的数据信息。2)Apriori算法的实施思想:掌握Apriori算法运算的基本思想,是实施Apriori算法应用实现的基础。3)Apriori算法性能的分析:了解Apriori算法的优点和不足,为算法的改进优化具有重要意义。4)Apriori挖掘算法的实现:根据关联规则Apriori挖掘算法的描述,用Vis
7、ualC+编译器编写Apriori算法代码,并于一例子中实现。5)对具有语义最小支持度的关联规则挖掘方法的探讨:传统的关联规则挖掘算法大都依赖于一个统一的支持度和置信度阈值设置,在此基础上所挖掘出的结果有很多是没有任何意义或是错误的关联规则。如何引入具有语义最小支持度对算法做相应的改进,是舍弃无效的、虚假的、具有误导性的规则起辅助作用,增强了决策功能。拟采用的研究方法查阅相关资料,借助机器知行学的思想和数据挖掘技术对关联规则Apriori算法进行分析。使用VisualC+编译器编写代码,实现Apriori算法。研究工作的进度安排2010年11月24号11月30号与指导老师沟通交流,完成毕业论文
8、选题;2010年12月1号12月31号 搜集资料,查阅文献,完成开题报告;l2011年1月1号1月31号 完成文献综述,定出算法的需求分析案例;l2011年2月1号2月28号 整理相关资料并完成概要和详细设计;l2011年3月1号4月30号 扼写及整理修改初稿;l2011年5月10号5月31号 总结毕业设计的整个过程,完成毕业设计论文初稿;2011年6月1号6月3号 定稿,打印装订,参加答辩;参考文献目录(作者、书名或论文题目、出版社或刊号、出版年月日或出版期号)1毛国君,段立娟,王实,石云.数据挖掘原理与算法M.北京:清华大学出版社,2007.122何宏.关联规则挖掘算法的研究与实现D. 湖
9、南:湘潭大学,2006:47-503纪希禹,韩秋明,李微,李华锋.数据挖掘技术应用实例M. 北京:机械工业出版社,20094陈竞.基于数据挖掘技术的零售业精确营销应用研究J.中国市场,2010,14:16-185张玲玲,李军,石勇,周琳.基于数据挖掘的智能知识管理模型构架研究J.中国管理科学,2009,17(10):620-6246宫铁峰,髙剑平,韩慧君. 基于全信息的智能决策支持系统研究J.上海海运学院学报,1996,17(2):84-897张磊,夏士雄,周勇,牛强.具有语义最小支持度的关联规则挖掘方法J.微电子学与计算机,2008,25(9):14-178谢康林,叶瑾,周瑞凌.在数据仓库中
10、进行基于在语义层次的关联规则挖掘J.小型微型计算机系统2003,24(1):58-609 K.P. Soman, Shyam Diwakar, V. Ajay印度.数据挖掘基础教程M.范明,牛常勇译.北京: 机械工业出版社, 200910钟义信. 机器知行学原理:信息、知识、智能的转换与统一理论M.北京:科学出版社,2007指导教师意见 签名: 年 月 日教研室主任意见 签名: 年 月 日目录摘要1关键字1引言11 信息、知识、智能转换的统一理论21.1信息、知识、智能简要概述21.1.1信息的基本概念21.1.2知识的基本概念21.1.3智能的基本概念21.2信息、知识、智能的转换机制22
11、数据挖掘和知识发现32.1数据挖掘和知识发现的概念32.1.1数据挖掘的基本概念32.1.2知识发现的基本概念42.2数据挖掘的分析方法42.3知识发现的过程步骤及技术42.3.1知识发现过程的步骤42.3.2知识发现技术53 数据挖掘算法分析63.1关联规则挖掘算法基本概述63.2 Apriori算法基本原理与优化分析63.2.1 Apriori算法基本原理63.2.2 Apriori算法优化分析83.3 Apriori算法的实现与应用93.3.1 Apriori算法的实现93.3.2 Apriori算法在购物篮中的应用134 具有语义最小支持度的关联规则挖掘方法145 小结15参考文献16
12、Abstract16Key Word17致谢176 信息、知识、智能的转换和算法分析网络工程专业 指导老师: 摘要 21世纪是信息、知识的世纪,信息成为支撑人类社会发展的三大要素之一。而以知识为主题的许多新研究也层出不穷,推动了以网络为基础的信息技术向着更高层次发展。随着经济全球化进程的日益加快,商家间的竞争也日趋激烈,客户演变为商家竞争的核心,一旦无法为客户提供更高价值或更好地的服务,商家的存在价值必定受到质疑,甚至被淘汰。所以,了解顾客是商家必要的生存之道。本文以超市的“购物篮”为例,结合机器知行学原理,采用数据挖掘技术,帮助商家挖掘客户以往的需求趋势、购买行为及偏好,并预测未来,从而给商
13、家带来巨大的利润。关键字信息、知识、智能;数据挖掘;关联规则挖掘算法引言在全球经济一体化趋势下,面临着来自国内外激烈的双重竞争压力,中国零售企业需要通过各种途径全面提升自身,以保持强劲的竞争力。从目前国内零售企业信息化的现状来看,国内零售商普遍专注于操作层面,而在管理决策层的应用普遍很弱,缺乏战略上的信息化规划与应用。零售是生产与消费之间的供求结合,这种供求的结合其实就是信息整合的过程。努力挖掘信息价值,是现阶段零售企业信息化建设的核心,也是企业提升自身竞争力的重要途径。中国零售企业经历了几十年信息化建设,在企业经营管理、流程及效益上都取得一些成绩。但由于对信息化的利用和作用没有完全了解,信息
14、化可以创造更多更大的价值方面,却被零售企业忽略了。直到今天,我国许多零售企业还仅仅是将POS 机作为一般的收款结账设备来使用。随着交易的不断进行, POS 系统和MIS 系统记录积累的大量销售数据、顾客购买历史记录、货物进出与服务记录等信息却成为了庞大却毫无作用的数据累赘。由此可见,中国零售企业缺乏从数据中寻找知识和思想、挖掘财富、发现决策依据,而这些正是数据挖掘对企业的直接贡献,也是企业信息化的重要体现。1 信息、知识、智能转换的统一理论1.1信息、知识、智能简要概述1.1.1信息的基本概念任何一门科学都有自己的基本概念,传统科学的基本概念是物质和能量,信息科学的基本概念是信息。它既是信息科
15、学的出发点,也是它的归宿,而信息科学的出发点是认识信息的本质和它的运动规律,它的归宿则是利用信息来解决各种各样的实际问题,达到各种具体的目的。全信息的主要特色是全面考虑了信息的形式因素、内容因素和价值因素,是在Shannon信息理论基础上发展出来的信息理论。而把仅仅计及其中的形式因素的信息部分称为“语法信息”,把计及其中的含义因素部分称为“语法信息”,把计及其中效用因素的信息部分称为“语用信息”。当机器被设计者赋予特定的“目的性”之后,机器就可以具有很强的感知能力、一定的理解能力、特定的“目的性”,因此,表现外在形式因素的语法信息、表现内在含义因素的语义信息以及表现效用因素的语用信息就变得非常
16、现实了。1.1.2知识的基本概念知识,是信息加工的规律性产物。它是由经验总结升华出来的,属于认识论范畴的概念,它所表述的事物运动的状态和状态变化的规律,任何知识都由相应的形态性知识、内容性知识、效用性知识构成。然而,形态性知识、内容性知识、效用性知识分别与全信息的语法信息、语义信息、语用信息之间有内在的联系。1.1.3智能的基本概念智能,就是在给定问题、问题的环境约束和求解问题的目标的前提下,有效地获得相关信息、把信息提炼成为相应的知识和解决问题的策略、利用策略来解决问题、从而在满足约束条件下成功地达到目的的能力。智能是具体的概念,而不是玄空的概念,它是一种获得信息、处理信息和利用信息生成知识
17、和策略的能力。1.2信息、知识、智能的转换机制一般而言,智能是一种利用知识和信息来解决问题和达到目的的能力。智能生成机制首先将本体论信息转换为认识论信息,从认识论信息中提炼知识。再次将知识转换成智能策略,在生成求解问题的智能策略之后,把智能策略转换为智能行为,使实际问题得到真正的解决。在给定“问题-约束的知识和信息以及预设目标”之后,一般求解智能策略方法原则上是可行的。但是,由于所利用的知识处于不用的生长阶段,这个一般性的原理将会有不同的具体实现方式。如图1-1所示图1-1信息-知识-智能转换:智能生成的共性核心机制2 数据挖掘和知识发现2.1数据挖掘和知识发现的概念2.1.1数据挖掘的基本概
18、念数据挖掘(Data Mining)是一个多科学交叉研究领域,它融合了数据库技术、人工智能、机器学习、统计学、知识工程、面向对象方法、信息检索、高性能计算以及数据可视化等最新技术的研究成果。关于数据挖掘的定义还没有达成一致,当今对数据挖掘有如下几种定义:(1)G.Piatetsky Shapior,W.J.Frawley等定义数据挖掘为从数据库的大量数据中揭示出隐含的、先前未知的、潜在有用的信息的非平凡过程。(2)有人简单认为数据挖掘视是数据库中知识发现过程的一个基本步骤。(3)有人认为数据挖掘是发现数据中隐藏的模式和关系的过程。(4)有人认为数据挖掘就是从大量数据中提取或挖掘知识。(5)Fa
19、yyad等在“知识发现96国际会议”上认为,知识发现是从数据库中发现知识的全部过程,而数据挖掘则是此全部过程种一个特定的关键一步。这种观点将数据挖掘的对象仅仅局限于数据库。(6)数据挖掘广义的定义为在一些事实或观察数据的集合中寻找模式的决策支持的过程。我们可以从上面的定义中看出,数据挖掘是从大量数据中寻找到有价值有意义有趣事先未知的知识,一种透过数理模式来分析企业内储存的大量资料,以找出不同的客户或市场划分,分析出消费者喜好和行为的方法。2.1.2知识发现的基本概念数据库中的知识发现(Knowledge Discovery in Database简称KDD)是在1989年8月美国底特律市召开的
20、第十一届国际联合人工智能学术会议上正是形成。从1995年开始,每年举行一次知识发现国际学术会议,把对数据挖掘和知识发现的研究推向了高潮。知识发现(即KDD)是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。知识发现将信息变为知识,从数据矿山中找到蕴藏的知识金块,将为知识创新和知识经济的发展作出贡献。2.2数据挖掘的分析方法数据挖掘的分析方法是利用数据来建立一些模仿真实世界的模型,利用这些模型来描述数据中的模式以及关系。提供决策所需要的信息和预测是这些模型的用处。当今先进的数据挖掘工具都提供了许多种可供选择的数据挖掘算法。这是因为每一种算法不可能完成所有不同类型的数
21、据挖掘任务。进行数据挖掘时可以采用不同的算法。数据挖掘技术常见的方法有关联规则、决策树、神经网络、粗糙集方、聚类方法、遗传算法和统计分析方法等。数据挖掘可以建立六种模型:分类(Classification)、回归(Regression)、时间序列(Time Series)、聚类(Clustering)、关联规则(Association)以及顺序规则(Sequence)。分类以及回归主要是用来作预测,而关联规则与顺序规则主要是用来描述行为(例如消费行为)。聚类则是二者都可以用得上的。2.3知识发现的过程步骤及技术2.3.1知识发现过程的步骤知识发现过程有多种描述,然而只是在组织和表达方式上有所不
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网络工程 毕业设计 论文 信息 知识 智能 转换 算法 分析
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-4869562.html