数据与知识工程.ppt
《数据与知识工程.ppt》由会员分享,可在线阅读,更多相关《数据与知识工程.ppt(45页珍藏版)》请在三一办公上搜索。
1、教师:常亮办公室电话:2291071 手机,数据与知识工程,欢迎参加,本课程的开设背景,智能:智能行为依赖于知识知识:是构成智能的基础把有关信息关联在一起形成的信息结构由信息提炼出来的产物,反映了一些基本的规律信息:计算学科:对描述和变换信息的算法过程进行的系统研究。收信人事先不知道的报道(辞海)信息就是信息,不是物质,也不是能量(Norbert Wiener)数据的语义数据:信息的载体和表示对于计算机而言,信息处理就是数据处理,本课程的开设背景,智能:智能行为依赖于知识知识:把有关信息关联在一起形成的信息结构由信息提炼出来的产物,反映了一些基本的规律是构成智能的基础信息:数据的语义收信人事先
2、不知道的报道(辞海)信息就是信息,不是物质,也不是能量(Norbert Wiener)计算学科:对描述和变换信息的算法过程进行的系统研究。数据:信息的载体和表示对于计算机而言,信息处理就是数据处理,本课程的开设背景,信息时代/知识时代农业社会 工业/机械社会:由机械化、电气化和自动化带来的人类体力扩展的结果。机械社会 信息/知识社会:由信息化、网络化和智能化带来的人类智力扩展的结果。一个标志:万维网(Web)的普及信息化和网络化带来的形形色色的海量信息和内容理解问题,向计算机科学和人工智能提出了艰巨的挑战。语义WebWeb技术语义(本体/逻辑),知识表示与知识推理,数据挖掘&知识发现,本课程的
3、目的,了解人工智能领域关于知识表示、知识推理、知识发现的研究历史;掌握典型的知识表示方法(尤其是基于一阶谓词逻辑和基于描述逻辑的知识表示方法);掌握典型的知识推理方法(尤其是基于消解原理的推理方法和基于Tableau的推理方法);掌握典型的知识发现方法;了解语义Web的基本思想、技术现状和发展趋势;了解Web知识表示模型和语言(主要包括RDF、OWL、RIF和SPARQL);了解语义Web背景下关于知识表示、知识推理、和知识发现的研究现状。,本课程的内容,基于一阶谓词逻辑(FOL)的知识表示和推理基于FOL的知识表示基于消解法的知识推理基于tableau算法的知识推理Horn逻辑与产生式系统H
4、orn逻辑逻辑程序设计产生式系统基于描述逻辑(DL)的知识表示和推理基于DL的知识表示基于tableau算法的知识推理非单调知识表示和推理 CWA;限制逻辑;默认逻辑;自认知逻辑对动作的表示、推理以及规划STRIPS系统;情景演算;流演算;PDL,知识表示能力 vs.推理能力 tradeoff,本课程的内容,数据挖掘与知识发现基于证据理论的数据挖掘方法基于神经网络的数据挖掘方法基于遗传算法的数据挖掘方法基于粗糙集的数据挖掘方法其他数据挖掘方法KDD的挖掘模式关联模式分类模式聚类模式回归模式序列模式,本课程的内容,语义Web的研究路线资源描述框架RDFWeb本体语言OWLWeb规则标记语言RIF
5、Web查询语言SPARQL典型应用Web服务软件配置/产品协同制造信息系统知识共享/协同工作语义Web背景下知识表示、知识推理和知识发现,教材Brachman R,Levesque H.Knowledge Representation and Reasoning.Morgan Kaufmann Press,2004.Antoniou G,Harmelen F.A Semantic Web Primer.Second Edition.Cambridge,Mass.:MIT Press,2008.(Antoniou G,Harmelen F.著,陈小平等译.语义网基础教程(第1版).机械工业出版社
6、,2008.)胡运发.数据与知识工程导论.清华大学出版社,2003.参考书1.Baader F,Calvanese D,McGuinness D,Nardi D,and Patel-Schneider P.F.The Description Logic Handbook:Theory,Implementation and Applications.Cambridge University Press,2003.2.Bell J.L.,Machover M.A Course in Mathematical Logic.North-Holland Publishing Company,1977.3
7、.Jiawei Han,Micheline Kamber.Data Mining:Concepts and Techinques.Second Edition.机械工业出版社,2007.,教材及参考书,作者介绍,Ron BrachmanPh.D,1977 HarvardACM FellowPresident of AAAI(2003)雅虎全球研究运营副总裁Hector LevesquePh.D 1981,University of TorontoConference Chair of IJCAI(2001)founder farthers of DLFranz BaaderChair for
8、Automata Theory of the Institute for Theoretical Computer Science Faculty of Computer Science at TU Dresden,课程要求,按时到课,重视课堂学习;对布置的思考题和讨论题进行认真准备;按进度完成平时作业。评分方式:总评成绩=平时成绩20 期末考试成绩80平时成绩=课堂主题报告 课堂讨论重视课堂讨论使自己的疑问得到及时解答可以帮助有相似疑问的同学可以使教师及时了解教学效果在讨论中产生有价值的学术火花多动笔;到证明的第一现场去,第1部分 概述,主要内容:人工智能及其三个学派符号主义本领域的杰出人物
9、本领域的顶级国际会议知识表示与知识推理数据挖掘与知识发现,图灵和图灵测试,阿兰麦席森图灵(Alan Mathison Turing)英国数学家、逻辑学家1936年:On Computable Numbers,with an Application to the Entscheidungs problem(论可计算数及其在判定问题上的应用)图灵机(Turing Machine)停机问题 vs.FOL的不可判定问题1950年:Computing Machinery and Intelligence(计算机器与智能)图灵测试(Turing Test)人工智能之父,人工智能的诞生,Dartmouth会
10、议:1956年,美国的Dartmouth College,一个长达2个月的暑期研讨班。与会者有包括C.Shannon在内的数学家、逻辑学家、认知学家、心理学家、神经生理学家、计算机科学家等10人。Marvin Minsky的神经网络模拟器、John McCarthy的搜索法、以及Herbert Simon和Allen Newell的“逻辑理论家”成为会上的3个亮点,分别讨论如何穿过迷宫、如何搜索推理、以及如何证明数学定理。在会议上,John McCarthy正式提出“人工智能”(Artificial Intelligence)这一术语。人工智能是相对人的自然智能而言,即用人工的方法和技术,模仿
11、、延伸和扩展人的智能,研制具有感知、推理、学习、联想、决策等思维活动的计算系统,解决需要人类专家才能处理的复杂问题。,人工智能的发展,1958年,Newell和Simon的四个预测十年内,计算机将成为世界象棋冠军十年内,计算机将发现或证明有意义的数学定理十年内,计算机将能谱写优美的乐曲十年内,计算机将能实现大多数的心理学理论1959年,MIT AI Lab正式成立(Minsky和McCarthy)在专家系统、机器人、自然语言处理、知识工程等领域取得了长足的发展。1981年,日本政府宣布日本五代机(first-generation computer)计划(即智能计算机)。1992年,日本政府宣布
12、五代机计划失败。人工智能进入一个低谷。随着信息/知识社会的到来,人工智能领域再次兴旺起来。,Gartner 技术成熟度曲线,“深蓝”与卡斯帕罗夫之战,1997年5月初,IBM公司研制的并行计算机“深蓝”与国际象棋冠军卡斯帕罗夫交战,以两胜一负三平获胜。“深蓝”:由256个专为国际象棋比赛设计的微处理器组成,每秒可计算2亿步棋。,另一场人机大战,1997年,“深蓝”在棋盘上击败国际象棋大师卡斯帕罗夫,本质是使用穷举战略:每秒计算2亿次可能的“招数”,在相同的时间内,卡斯帕罗夫只能粗略地计划两步。在其后的10年里,计算能力猛增:到2007年,那台1.4吨的巨型计算机的处理能力已经可以放进一个大拇指
13、盖大小的“细胞(Cell)”微处理器中。在这十年内,晶体管数量已经从英特尔奔腾上的750万个跳跃到“细胞”上的2.34亿个。但是要让计算机理解人类语言、像人类一样思考比下棋难多了。更高级别的挑战?,“沃森”参战“危险边缘(Jeopardy!)”,“危险边缘(Jeopardy!)”:美国家喻户晓的电视智力竞赛节目。1964年创立,竞赛问题涉及地理、政治、历史、体育、娱乐等。2011年2月1416日,IBM 沃森参加了“危险边缘”电视节目的竞赛,战胜了该节目有史以来最优秀的两位人类冠军Ken Jennings和Brad Rutter。,IBM“沃森”系统,以IBM创始人托马斯J沃森的名字命名。20
14、06年开始设计。是由90台IBM 750服务器组成的群集系统,每台服务器采用Power 7处理器(8核芯片,每核4个线程),相当于有2880个核在运行。内存是16TB的RAM。采用的软件有SUSE Linux Enterprise Server 11操作系统、IBM DeepQA软件、Apache UIMA(非结构化信息管理体系结构)框架等。,IBM“沃森”系统,使用了上百种的技术来分析自然语言、识别资源、寻找并产生假设、寻找证据并评分、对假设进行聚集和分级,因此它是专门设计的、具有学习能力的机器。能储存大量信息,相当于100万本书籍和2亿页资料。还可以从经验中学习如何提高性能;能使用自然语言
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 知识工程
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-6296174.html