数据仓库在综合管理系统中概要.doc
《数据仓库在综合管理系统中概要.doc》由会员分享,可在线阅读,更多相关《数据仓库在综合管理系统中概要.doc(8页珍藏版)》请在三一办公上搜索。
1、成绩 南京航空航天大学工 程 硕 士 课 程 论 文题 目 数据仓库在社区综合管理系统中的应用 学生姓名 史苏明 学 号 SF1316016 专 业 计算机应用技术 班 级 SF1316 课程名称 数据仓库技术 二一三年八月数据仓库在社区综合管理系统中的应用史苏明(南京航空航天大学 信息科学与技术学院,江苏 南京 210016)Application of Data Warehouse in the Community Integrated Management SystemSumming Shi(College of Information Science and Technology, N
2、anjing University of Aeronautics and Astronautics, Nanjing 210016, China)摘 要:社区是社会的基本单元,是社会生活的共同体和人居的基本平台。社区管理工作涉及面广,工作流程复杂,同时,不同的部门通过垂直系统分别在社区建立了信息化系统,给社区工作带来大量重复劳动。通过建立数据仓库,对不同来源的数据进行抽取、清洗、比对和重载,形成统一的面向对象的数据仓库,对建立社区综合管理系统具有重要意义。关键词:数据仓库;社区管理;信息系统Abstract: Community is the basic unit of society, is
3、 the basic platform of social life of the community and habitat. Community management involves many aspects, the work process is complicated, at the same time, different departments through the vertical system respectively in the community to establish the information system for community work, brin
4、g a lot of repeated work. Through the establishment of data warehouse, extraction, cleaning, alignment and heavy load of different sources of data, data warehouse to form uniform object, is of great significance to the establishment of community integrated management system.Key words: Data Warehouse
5、; Community Management; Information System1 引言1.1 数据仓库慨念的由来和意义未来的世界是一个数据大爆炸的世界,同时也是一个需要从海量数据中快速获取知识和财富的世界。无论是精度和分辨率都越来越高的遥感影像数据,还是获取和使用都越来越便利的视频监控数据,亦或是越来越多的企业管理系统、政务管理系统、SNS平台等沉淀和积累下来的数以TB计算的结构化和非结构化的数据,这些都是使得未来世界更智能、便利、快捷的基础和源泉,但首先面对的技术问题是,这些数据该如何的获取、存储、高效查询和管理。数据仓库的概念在20世纪90年代初,有美国数据仓库之父比尔恩门(Bill
6、 Inmon)提出,在他1991年出版的“Building the Data Warehouse”一书中所提出的关于数据仓库的定义被科研界认可并广泛接受,比尔恩门(Bill Inmon)认为,数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。 经过40多年的研究和发展,科研界和业界对数据仓库的概念及其内涵有了更深层次的理解和认识,现有一般认为,数据仓库不仅仅是一项技术或是一个可以一次性完成的项目,它也不是一件可以打包封装的产品,而是一个环境、一
7、种数据管理的思路和数据分析利用的模式及研究方向。数据仓库提供用户用于决策支持的当前和历史数据,这些数据在传统的操作型数据库中很难或不能得到。数据仓库技术是为了有效的把操作形数据集成到统一的环境中以提供决策型数据访问,的各种技术和模块的总称。所做的一切都是为了让用户更快更方便查询和使用所需要的信息,提供决策支持。1.2 数据仓库技术的特点1.2.1 数据仓库的数据是面向主题的与传统数据库面向应用进行数据组织的特点相对应,数据仓库中的数据是面向主题进行组织的。面向主题的数据组织方式,就是在较高层次上对分析对象的数据的一个完整、一致的描述,能完整、统一地刻划各个分析对象所涉及的企业的各项数据,以及数
8、据之间的联系。所谓较高层次是相对面向应用的数据组织方式而言的,是指按照主题进行数据组织的方式具有 更高的数据抽象级别。 1.2.2 数据仓库的数据是集成的 数据仓库的数据是从原有的分散的数据库数据抽取来的。通过首先对不同源数据中字段的同名异义、异名同义、单位不统一、字长不一致等所有矛盾之处的清洗、比对和处理;然后进行数据综合和计算;最终进入数据仓库的数据就是进行综合集成后的数据集。 1.2.3 数据仓库的数据是不可更新的数据仓库的数据主要供管理者决策分析之用,所涉及的数据操作主要是数据查询,一般情况下并不进行修改操作。数据库中进行联机处理的数据经过集成输入到数据仓库中,一旦数据仓库存放的数据已
9、经超过数据仓库的数据存储期限,这些数据将从当前的数据仓库中删去。因为数据仓库只进行数据查询操作,所以数据仓库管理系统相比数据库管理系统而言要简单得多。1.2.4 数据仓库的数据是随时间不断变化的数据仓库中的数据不可更新是针对应用来说的,也就是说,数据仓库的用户进行分析处理时是不进行数据更新操作的。但并不是所有的数据仓库数据都是永远不变的。事实上数据仓库的数据是随时间的变化而不断变化的,数据仓库随时间变化不断增加新的数据内容;同时,数据仓库随时间变化不断删去旧的数据内容,对于数据仓库中包含的大量综合数据,这些综合数据中很多跟时间有关,如数据经常按照时间段进行综合,或隔一定的时间片进行抽样等等,这
10、些数据要随着时间的变化不断地进行重新综合。1.3 数据仓库与数据库的区别移动从本质上讲,数据仓库的出现,并不是要取代数据库。目前,大部分数据仓库还是用关系数据库管理系统来管理的,其区别主要表现在以下几个方面:数据库是面向事务的设计,数据仓库是面向主题设计的。数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。数据库设计是尽量避免冗余,数据仓库在设计是有意引入冗余。数据库是为捕获数据而设计,数据仓库是为分析数据而设计。集团数据仓库为移动公司总的数据中心,省级数据仓库则为省级数据中心,二者可根据需要可互相抽取、交互数据。总公司的数据仓库的数据源有两方面,除部分数据通过数据加载ETL模块加载数
11、据外,主要是通过分布式的网络结构,从各省公司级的各数据仓库抽取数据。图 1 传统数据库与数据仓库的区别Fig. 1 The Difference Between Traditional Database And Data Warehouse1.4 数据仓库技术的相关概念分析使用和全面理解数据仓库技术需要对相关的概念和技术有清晰的认识,才能够利用数据仓库技术与相关应用很好的结合,数据仓库技术相关概念主要包括以下几个方面: 元数据:关于数据的数据,指在数据仓库建设过程中所产生的有关数据源定义,目标定义,转换规则等相关的关键数据。同时元数据还包含关于数据含义的商业信息。 粒度:数据仓库的数据单位中保
12、存数据的细化或综合程度的级别。细化程度越高,粒度级别就越小;相反,细化程度越低,粒度级别就越大。 分割:结构相同的数据被分成多个数据物理单元。任何给定的数据单元属于且仅属于一个分割。 ETL:ETL(Extract/Transformation/Load)用户从数据源抽取出所需的数据,经过数据清洗、转换,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。 数据集市:小型的,面向部门或工作组级数据仓库。 操作数据存储 (ODS):能支持企业日常的全局应用的数据集合,是不同于DB的一种新的数据环境, 是DW 扩展后得到的一个混合形式。四个基本特点:面向主题的、集成的、可变的、 当前或接近
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 综合 管理 系统 概要
链接地址:https://www.31ppt.com/p-4264337.html