多维数据索引方法综述杨凤召.ppt
《多维数据索引方法综述杨凤召.ppt》由会员分享,可在线阅读,更多相关《多维数据索引方法综述杨凤召.ppt(30页珍藏版)》请在三一办公上搜索。
1、多维数据索引方法综述,杨 风 召,为什么要研究多维数据索引?,空间数据库多媒体对象图象、文本、视频等特征向量 相似性查询数据挖掘聚类、异常检测等空间数据挖掘多媒体数据挖掘CAD、分子生物学等,传统的索引方法,哈希表 数值的精确匹配 不能进行范围查询 B-Trees ISAM 键值的一维排序 不能搜索多维空间,处理多维(multi-dimension)点数据的索引结构的比较,Cell 方法 K-d Trees Quad TreesK-D-B Trees(J T Robinson SIGMOD1981)Corner Stitching Grid files,处理多维(multi-dimension
2、)点数据的索引结构,处理矩形的方法,将矩形转变成更高维区间上的点(二维空间上的矩形可以看作四维空间上的点)。用空间充填曲线(space filling curve)将k-d空间映射为1-d空间。这种方法适用于分页环境。它用z变换将k-d对象转变为线段 将原始空间划分为合适的子空间(重叠或分离的)划分为分离子空间 用处理多维点的空间划分方法,只是若一个矩形被分到多个区域,可将该矩形分成几个部分,每一部分都加上标签,表示他们同属于一个矩形。划分为有重叠子空间,R-tree(A.Guttman SIGMOD1984),R-tree的特点,R-tree是B-Tree对多维对象(点和区域)的扩展 R-t
3、ree是一棵平衡树 一个多维对象只能被分到一个子空间中去 若用动态插入算法构建R-tree,在树的结点中会引起过多的空间重叠和死区(dead-space),使算法性能降低,R-tree的典型算法,查找插入选择叶子结点分裂结点(有多种算法)调整树必要时增加树的高度删除找到包含要删除记录的叶子结点删除压缩树必要时减小树的高度更新先删除老的记录索引,在插入新的记录索引,R+-tree(T.Sellis VLDB1987),R+-tree 的特点,R+-tree是K-D-B-tree对非0面积对象(不仅可以处理点,也可以处理矩形)的扩展 不需要覆盖整个初始空间 R+-tree比R-tree表现出更好的
4、搜索性能(特别对点的查询),但要占据较多的存储空间,R*-Tree(N.Beckmann SIGMOD1990),R*-Tree通过修改插入、分裂算法,并通过引入强制重插机制对R-Tree的性能进行改进。R*-Tree和R-Tree一样允许矩形的重叠,R*-Tree在选择插入路径时同时考虑矩形的面积、空白区域和重叠的大小,而R-Tree只考虑面积的大小。,SS-Tree(D.A.White ICDE1996),SS-Tree的特点,SS-Tree对R*-Tree进行了改进,通过以下措施提高了最邻近查询的性能:用最小边界园代替最小边界矩形表示区域的形状;增强了最邻近查询的性能;减少将近一半的存储
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多维 数据 索引 方法 综述 杨凤召
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-6456721.html