数据仓库和OLAP系统中的安全问题.ppt
《数据仓库和OLAP系统中的安全问题.ppt》由会员分享,可在线阅读,更多相关《数据仓库和OLAP系统中的安全问题.ppt(41页珍藏版)》请在三一办公上搜索。
1、数据仓库和OLAP系统中的安全问题,陈越,1.数据仓库和OLAP系统,1.1 数据仓库和OLAP系统的概念数据仓库:“面向主题的、集成的、与时间相关的、稳定的、用于支持决策管理的数据集合”(Inmon,1996)“主题”是指用户使用数据仓库进行决策时所关心的重点方面,如:收入、客户、销售渠道等,“面向主题”,是指数据仓库内的信息是按主题进行组织的,而不是像业务处理系统那样是按照业务功能进行组织的;“集成”是指数据仓库中的信息不是从各个业务系统中简单抽取出来的,而是经过一系列加工、净化、整理和汇总的过程,因此数据仓库中的信息是关于整个企业的一致的全局信息;“与时间相关”是指数据仓库内的信息并不只
2、是反映企业的当前状态,而是记录了从过去各个历史阶段的聚集型(如和、平均值等)信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测;“稳定”是指对数据装载由数据仓库系统周期性地刷新操作完成,以聚集新的历史时段的数据,一旦数据进入数据仓库后,一般用户不允许进行实时更新,仅可对信息进行查询操作。,1.数据仓库和OLAP系统,1.1 数据仓库和OLAP系统的概念 用户在使用数据仓库时,主要利用两类应用工具联机分析处理(On-Line Analvtical Processing),主要用于分析历史发展变化;数据挖掘(Date Mining),主要用于预测未来趋势走向。OLAP是为满足决策
3、支持或多维环境特定的查询和报表需求,供分析人员、管理人员或执行人员从多种角度对数据仓库中的数据进行快速分析和展现的工具。数据仓库侧重于存储和管理面向决策主题的数据;而OLAP侧重于数据仓库的数据分析,并将其转换成辅助决策信息。OLAP的一个主要特点是多维数据分析,这与数据仓库的多维数据组织正好形成相互结合、相互补充的关系。,1.数据仓库和OLAP系统,1.2数据仓库的数据模型数据仓库中数据的逻辑组织形式是一种多维数据模型,包括两种物理结构:,该立方体包含三个维:时间(Time)维、地点(Location)维和产品(Product)维。各维的这些属性之间是从属性偏序关系(),属性及其偏序关系组成
4、了对应该维的格。对于每个维Hd均一个特定的ALLHd,All表示该维的最高层次的聚集属性。三个维对应的格的乘积构成了立方体格。对于立方体格中的一个三元组(其中T是Time维的某个属性,L是Location维的某个属性,P是Product维的某个属性),对应一个称为cuboid(立方体)的三维阵列。立方体的每个单元(cell)也是一个三元组(其中t是属性T的属性值,l是属性L的属性值,p是属性L的属性值)。维属性的依赖关系也扩展到了属性值上,例如,单元的值将是、的值的总和。因此,这些单元也组成了一个依赖性格。,在该立方体中,粒度最细的聚集型数据存放于cuboid 中,它反映了某天、某个商店、某个
5、产品的度量属性Revenue(销售收入)和Unit(销售数量)的取值情况。该cuboid中的度量属性的数据值从数据源(一般是关系数据库的基表)中的数据聚集(本例为求和)得到,如果在数据源处Revenue(销售收入)和Unit(销售数量)数据不存在,则的相应单元为空(或取NULL)。采用相同的聚集函数,下层(聚集粒度较细的)cuboid中的数据聚集到上层(聚集粒度较粗的)cuboid中,这样,所有的cuboid中的数据就生成了,该数据立方体也就形成了。本例中,在进行数据聚集(求和)操作时,空的单元的值将以0值对待。,2.系统安全需求与安全策略,1.隐藏整个立方体(cuboid)是最直接的安全需求
6、。例如,数据仓库中存在“年报销售分析”立方体、“月报销售分析”和“季报销售分析”立方体数据,指定用户只能查看“年报销售分析”立方体的数据,不能查看“月报销售分析”和“季报分析”立方体中的数据。2.隐藏立方体中的某些度量值。如规定某用户只能查看销售收入(Revenue)情况,而不允许该用户查询销售数量(Unit)情况。3.隐藏立方体中的某些切片。如果不允许部分用户查看某些特定的维成员上的数据,对这些用户就需要隐藏立方体的某些切片。例如,仅允许某用户查看2003年、2005年销售情况,而其他年份的相关情况则不允许该用户查看。4.隐藏立方体中的某些切块。与隐藏切片类似,隐藏切片是指仅允许用户查看某一
7、区间维成员的数据。例如,仅允许某用户查看2008年以来的数据。5.隐藏立方体的维层次。不同粒度的数据安全级别不同,通常粒度越细,安全级别越高,所以有时限制对低于某个维层次的数据的访问,即隐藏维层次。例如,如不允许某用户访问在时间维上比“月”更细粒度的数据,即不能访问每天的数据。,6.隐藏某些切片上的度量值。需求2、3的组合,例如仅允许某用户查看2003年、2005年销售收入(Revenue)情况。7.隐藏某些切片上的维层次。需求3、5的组合,例如仅允许某用户查看2003年、2005年销售情况,并且不允许访问比“月”更细粒度的数据。8.隐藏某些切块上的度量值。需求2、4的组合,例如仅允许某用户查
8、看2008年以来的销售收入(Revenue)情况。9.隐藏某些切块上的维层次。需求4、5的组合,例如仅允许某用户查看2008年以来的销售情况,并且不允许访问比“月”更细粒度的数据。10.动态/数据驱动策略。特殊环境下需要动态的、数据驱动的安全策略,访问请求是否许可依赖于维成员或度量的取值等。例如,如果某个单元(cell)的销售数量(Unit)取值小于2,则不公开该单元对应的销售收入情况。11.推理控制。由于数据仓库和OLAP系统中存放了大量汇总型数据。具有相关访问权限的使用者可能通过分析多次查询的结果,推导出一些其不应得到的敏感数据。推理控制就是要避免用户通过智能查询推断出其权限之外的敏感信息
9、。,2.系统安全需求与安全策略,3.数据仓库访问控制,3.1 数据仓库访问控制模型目前,按照建立方法的不同,数据仓库安全模型大致分为以下几类。1.基于角色的访问控制模型 该方法按照OLAP多维数据的语义,对(S,O,A)模型进行扩展,定义角色能够访问到的多维数据,并将角色赋予用户来达到间接访问控制的目的。2.基于元数据的访问控制模型元数据是数据仓库中的数据字典,它包含了数据仓库中数据模型的标识、结构和位置等信息。该方法根据用户的访问需求,为不同的用户组构造不同的元数据,然后将这些元数据分别赋予相应用户组访问的权限。因为只有有限内容的元数据,用户也就只能访问允许访问的数据。,3.基于数据源的访问
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 OLAP 系统 中的 安全问题
链接地址:https://www.31ppt.com/p-6578341.html