《演绎数据库》PPT课件.ppt
《《演绎数据库》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《演绎数据库》PPT课件.ppt(32页珍藏版)》请在三一办公上搜索。
1、,第4部分 其它高级主题第14章 演绎数据库,高级数据库系统及其应用,2023/7/19,2,第14章 演绎数据库,递归查询,14.1,演绎数据库理论基础,14.2,含否定的递归查询,14.3,有效赋值递归查询,14.4,2023/7/19,3,14.1 递归查询,一种包含递归的复杂数据结构关系示例三轮车零配件库存关系表Assembly有三个字段:part(配件)/subpart(子配件)/qty(数量)。关系的每个元组表示一配件中含某类子配件的数量。,显然,SQL-92对表达类似:“一个strike(三轮车)总共有哪些配件?”这样的查询无能为力。【注】若Assembly关系中只有几个固定元组
2、,或许可通过写多个自连接并将这些自连接用union组合起来的方式勉强处理,但这种特定、非通用查询表达并不是我们感兴趣的。,2023/7/19,4,Datalog基本知识(1),Datalog是一个特别构造的专业名词它是一个专业构造词,表达数据data、逻辑logic的含义。它是一种受著名逻辑编程语言Prolog启发而发展起来的关系语言,并基本遵循Prolog的标记法。由多条Datalog规则有机组合可形成逻辑程序例如,为查询每个配件的构成组件(即子配件),可能会先定义一个名为Components的中间结果关系,并构造如下包含两条Datalog规则的逻辑程序:Components(Part,Su
3、bPart):-Assembly(Part,Subpart,Qty).Components(Part,SubPart):-Assembly(Part,Part2,Qty),Components(Part2,SubPart),r1:,r2:,2023/7/19,5,Datalog基本知识(2),Datalog规则Components(Part,SubPart):-Assembly(Part,Subpart,Qty).Components(Part,SubPart):-Assembly(Part,Part2,Qty),Components(Part2,SubPart)符号“:-”表示逻辑蕴含,其右
4、边部分称为规则体(body)、左边部分称为规则头(head)。如果“规则体中提及的元组存在于DB关系中”,则蕴含着“规则头中的元组也必定在提及它DB关系中”。,r1:,r2:,因为,基于Componenets和Assembly关系中已有的元组,通过应用这两条规则,我们就能推理(infer/deduct)出一些属于Components的新元组。所以,支持Datalog规则的DBMS常被称为演绎数据库,2023/7/19,6,Datalog基本知识(3),Datalog规则与关系代数应用Datalog规则也可由关系代数的有关概念来理解。(r1)相当于简单对Assembly关系运用投影投影结果加到最
5、初为空的Components关系中。(r2)连接Assembly关系和Components,并执行一次含part,subpart字段的投影。投影结果以union方式加入到Components关系中。唯一的、不能用关系代数解释的一个Datalog操作,是反复应用规则来定义Components,直到没有新元组产生为止。重复应用一规则集操作,称为不动点(fixpoint)操作。Datalog与一阶谓词逻辑关系一阶谓词逻辑(First Order Logic,FOL),2023/7/19,7,Datalog基本知识(4),Datalog规则与关系代数Datalog与一阶谓词逻辑(FOL)关系本质上,D
6、atalog是FOL中Horn子句表示法的子集,是通过对FOL的Horn子句进一步限定而发展起来的,并主要用于演绎数据库的一种简单知识表达语言。Datalog规则的一般形式为:,2023/7/19,8,利用Datalog规则进行推理,示例:以图14.1(a)中的Assembly实例为输入,利用由规则r1/r2构成的逻辑程序进行推理,具体推理步如下:1)应用规则(r1),将获得图14.2(a)所示的Components元组集。2)应用规则(r2)后,将产生如图14.2(b)所示的一组Components新元组。新元组由粗矩形框特别标识,共有6个元组。3)再次应用(r2)后,除了会重复产生(发现)
7、首次应用规则(r2)所产生的那6个元组外,还将额外产生如图14.2(c)中粗矩形框内标识的两个新元组。4)第三次应用(r2),将不会再产生任何新元组。这说明,推理工作已完成。,2023/7/19,9,利用规则(r1-r2)进行推理的结果示例(图14.2),有了这个推理结果,仅通过使用一个极简单的SQL语句,就可获得strike的所有配件:SELECT*FROM Components C2 WHERE C2.part=trike,Components基于Datalog定义的SQL99扩展表达:WITH RECURSIVE Components(part,Subpart)AS(SELECT A1.
8、Part,A1,Subpart FROM Assembly A1)UNION(SELECT A2.Part,C1,Subpart FROM Assembly A2,Components C1 WHERE A2.Subpart=C1.Part).,2023/7/19,10,14.2 演绎数据库理论基础,14.4.1 最小模型语义,14.2.2 安全Datalog程序,14.2.3 不动点操作,14.2.4 最小模型与不动点模型关系,2023/7/19,11,Datalog程序语义,可将Datalog程序中的关系分为输入关系和输出关系两类。当我们理解了已有输入关系实例如何通过Datalog程序与输
9、出关系关联后,一个查询的含义(语义)就会清晰起来。输出关系指由规则定义的关系,故也被称为计算关系,如规则(r1-r2)中的Components。输入关系一般对应DB中已有的实关系表,也称为外部关系。给定所有输入关系的一个实例,我们必须计算出输出关系的实例。可通过独立理解每条规则的含义来理解一个Datalog程序。每条规则的语义是:如果规则体为真,则规则头也必为真。如果给定了所有出现在规则体中关系的元组,则在规则头提及的关系必包含特定元组集。,2023/7/19,12,最小模型语义(least model semantics),模型(model)定义一个模型是通过一个程序关联的一组关系实例集合。
10、当对程序中的每个规则,用一组常数替换规则中的变量时,以下断言为真:“如果(通过用常数替换规则变量)得到的规则体表示元组属于相应关系的实例,则由规则头产生的元组也应出现在提及它的对应关系实例中。”在给定了所有输入关系的实例后,一个模型定义实质上限制了输出关系实例。最小模型定义一个程序的最小模型是这样一个模型M,对同样程序的任何其它模型M2,以及对程序中的每个关系R,R在M中的实例将属于R在M2中的实例。,最小模型定义给用户提供了一种不需要了解程序如何执行就可理解程序的方式。它是一种声明性的语义,就象关系演算一样不需要了解任何具体的关系操作或操作实现。这一点非常重要,由于递归规则的存在,以赋值策略
11、概念来理解程序有时往往会非常困难。,2023/7/19,13,14.2.2 安全Datalog程序,如果一个程序的最小模型不是有限的,就称该程序是不安全的(unsafed)。DB系统不允许不安全的程序。如果所有输入关系是有限的,且每个出现在规则头中的每个变量,都至少在规则体中出现过,则程Datalog程序是范围限制的。每个范围限制的肯定都有一个有限的最小模型。示例一个安全的Datalog程序:Complex_Parts(Part):-Assembly(Part,Subpart,Qty),Qty2 一个不安全的Datalog程序:Price_Parts(Part,Price):-Assembly
12、(Part,Subpart,Qty),Qty2,(r3):,(r4):,2023/7/19,14,14.2.3 不动点(least fixpoint)操作,函数f的最小不动点(least fixpoint)是f的一个不动点,且该不动点小于f的任何其它不动点。通常一个函数并不能保证总有最小不动点。举例double(v1,v2,vn)=2*v1,2*v2,2*vn。double+(v1,v2,vn)=double(v1,v2,vn)v1,v2,vn。例如,double(1,2,5)=2,4,10;double+(1,2,5)=1,2,4,5,10。显然,所有偶整数集(even_ints)和所有整数
13、集(all_ints)都是double+函数的一个不动点,且有even_ints all_ints模型的最小不动点,2023/7/19,15,14.2.3 不动点(least fixpoint)操作,函数f的最小不动点(least fixpoint)模型的最小不动点以元组集作为值集、用关系代数表达作为函数,对应到函数的最小不动点定义,不难得到关于模型的最小不动点定义。例如,对前面Components关系,也可按如下来定义:Components=1,5(Assembly 2=1Components)1,2(Assembly)=f(Components,Assembly)这个函数不动点是一个满足以
14、上等式的Components实例。如果不断应用规则(r1-r2),总能不断产生新的、不在原Components实例中的元组,则当前Components实例就不是不动点。,2023/7/19,16,14.2.4 最小模型与不动点模型关系,结论:每个基于关系代数表达定义的、不包含集合差(或not)操作符的函数都可确保有一个最小不动点,且最小不动点可通过反复赋值函数来求解。更进一步结论:每个不含否定的Datalog程序可确保有一个最小模型,且最小模型等于该程序的最小不动点。这些结论为我们提供了Datalog查询处理的理论基础。基于最小模型理论,用户可用“如果规则体为true,则规则头亦为true”的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 演绎数据库 演绎 数据库 PPT 课件
链接地址:https://www.31ppt.com/p-5548855.html