择运算&外部排.ppt
《择运算&外部排.ppt》由会员分享,可在线阅读,更多相关《择运算&外部排.ppt(31页珍藏版)》请在三一办公上搜索。
1、选择运算&外部排序,选择运算概述,选择运算,外部排序,选择运算&外部排序,1,2,3,查询实例SELECT*FROM students WHERE;条件表达式的几种情况C1:无条件C2:Sno=2011003;C3:Sage 20;C4:Sdept=CS ANDSage 20;,选择运算概述选择运算的查询处理,查询实例SELECT*FROM students;全表顺序扫描优点:简单有效,选择运算概述选择运算的查询处理C1,2011001,2011002,2011003,2011004,2011005,Students,查询实例SELECT*FROM studentsWHERE Sno=2011
2、003;选择条件的属性上有索引索引/散列扫描,选择运算概述选择运算的查询处理C2,2011001,2011002,2011003,2011004,2011005,Students,Sno是主码,内存中,磁盘上,选择运算概述选择运算的查询处理C3,查询实例SELECT*FROM studentsWHERE Sage20;选择条件是范围查询或非等值查询,或非主属性等值的查询查询结果数目不明确估算查询结果的元组数量如果查询结果的元组数量10%,且选择列上有索引使用索引扫描否则,使用全表顺序扫描,选择运算概述选择运算的查询处理C4,查询实例SELECT*FROM studentsWHERE Sdept
3、=CS AND Sage20;,选择运算概述选择运算的查询处理C4,查询实例SELECT*FROM studentsWHERE Sdept=CS AND Sage20;合取选择查询分别找到符合各个条件的元组指针,取指针的交集;或者找到符合第一个条件的元组指针,在此范围内检查另一条件是否满足析取选择查询:使用全表顺序扫描,选择运算处理的代价可以通过该查询对各种资源的使用情况进行度量,主要包括磁盘存取时间、执行一个查询所用的CPU时间、以及在并行/分布式数据库系统中的通信开销等。对于大型数据库系统而言,在磁盘上存取数据的代价通常是最重要的代价,可以通过传输磁盘块数以及搜索磁盘次数来度量。例如,一个
4、传输b块并作s次磁盘搜索的操作将耗时b*tT+s*tS 毫秒(ms),其中,tT表示传输一块数据的平均耗时,tS表示搜索一次磁盘的平均定位时间(包括搜索时间加旋转时间)。,选择运算概述代价度量,线性搜索算法A1 线性搜索中,系统扫描每一个磁盘块,对所有记录进行测试,看它们是否满足选择条件。开始时需作一次磁盘搜索来定位文件的第一个磁盘块。线性搜索的代价为EA1=tS+br*tT,码属性等值比较平均代价EA1=tS+(br/2)*tT,其中br代表文件中的磁盘块数。优点:可用于任何文件,不管该文件是否有序,是否有索引,也不管何种类型的选择操作;缺点:线性搜索比其他实现选择操作的算法速度慢。,选择运
5、算文件扫描,二分搜索算法A1 搜索过程是针对磁盘的数据块进行,而不是针对记录进行最坏情况下,找到包含所需记录的磁盘块所需访问和检查的磁盘块数目为log2(br),而且每一个这样的磁盘块都需要一次磁盘搜索定位,因此算法A1的时间代价为 EA1=log2(br)*(tT+tS)。,选择运算文件扫描,主索引码属性上的等值比较算法A2 具有主索引的码属性上的等值比较算法,可以通过主索引检索到指向满足相应等值条件的唯一记录的指针,再根据该指针到数据文件中访问磁盘块。若使用B+树索引,则访问索引块的数量等于树高度HTi,访问文件块的数量为1;而且每一次I/O操作都需要一次磁盘搜索定位和一次磁盘块传输。因此
6、,算法A2的时间代价为:EA2=(hi+1)*(tT+tS)。,选择运算索引扫描,主索引非码属性上的等值比较算法A3 具有主索引的非码属性上的等值比较算法,通过主索引检索到指向满足相应等值条件的第一条记录(可能有多条记录,但它们在物理上顺序存放)的指针,再根据该指针到数据文件中访问磁盘块。算法A3的时间代价为 EA3=hi*(tT+tS)+b*tT,选择运算索引扫描,辅助索引的等值比较算法A4 如果是码属性上的等值条件,算法A5的时间代价与算法A2相同,EA4=(hi+1)*(tT+tS)。如果是非码属性上的等值条件,每条记录可能存在于不同的磁盘块中:B+树索引检索每条记录都需要一次I/0操作
7、,以及读取每条记录都需要一次I/0操作,最坏情况开销甚至会比线性搜索更差。最坏情况下,算法A4的时间代价为:EA4=(hi+n)*(tT+tS),选择运算索引扫描,主索引上的范围比较算法A5 对于形如Av或Av的比较条件,首先通过主索引(如B+树索引)搜索,定位在满足Av或Av条件的第一个索引项,该索引项中的指针指向满足查询条件的所有记录中的第一条,然后通过该指针到文件中搜索磁盘块,并从该磁盘块开始顺序访问所有的磁盘块,直到文件结束。其时间代价可估算为 EA5=hi*(tT+tS)+b*tT 对于形如Av或Av的比较条件,没有必要查找索引,时间代价为:EA5=tS+b*tT,选择运算范围比较,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运算 外部
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5736152.html