环保局统一污染源数据库方案书.doc
《环保局统一污染源数据库方案书.doc》由会员分享,可在线阅读,更多相关《环保局统一污染源数据库方案书.doc(53页珍藏版)》请在三一办公上搜索。
1、环保局统一污染源数据库方案书第一章.公司介绍7第二章.环保局信息系统分析82.1 环保局信息系统现状82.1.1产生的问题82.1.2 问题产生的原因92.1.3结论102.2 需求分析102.2.1“统一污染源数据库”定义102.2.2统一污染源数据库的数据102.2.3处室-系统-数据对应关系112.2.4各处室与统一污染源数据的关系122.2.5数据整合和集成需求122.3 统一污染源数据库实质上是一个部门级数据仓库.142.4 统一污染源数据库是环保局信息门户的先锋.152.5 需求的总结16统一数据16统一操作界面16统一认证17统一接口.17第三章.系统解决方案183.1 系统解决
2、方案原则183.1.1可扩充性183.1.2易维护性183.1.3安全性183.1.4合理性183.1.5开放性183.2 技术路线183.3业务体系结构193.3.1污染源数据内容233.3.2基础数据库243.3.3数据仓库243.3.4地理信息系统243.3.5信息门户综合发布系统253.3.6综合办公系统253.4技术体系结构25第四章 污染源统一数据库274.1 数据库设计274.1.1 数据库设计主线274.1.2 数据库规范化设计304.1.3 粒度设计324.1.4 元数据管理。324.1.5 性能优化344.2 ETL(抽取.转换.装载)354.2.1 抽取374.2.2 转
3、换和清洗384.2.3 装载384.2.4 自动调度394.3 OLAP(联机在线分析)394.4 表现层404.4.1 表现层结构404.4.2 表现层功能41第五章 信息门户设计435.1 信息门户的概念435.2 Athene信息门户系统.435.2.1底层数据信息存储445.2.2内容管理整合445.3 Athene信息门户特点.45第六章 其他功能设计476.1 外围接口设计476.1.2 接口分类.486.2 备份设计486.2.1日常备份486.2.2 计划内下线496.2.3 数据恢复49第七章 系统特点49第八章 项目的组织和实施508.1 组织机构及职责508.1.1项目经
4、理508.1.2专家顾问组508.1.3项目执行组508.1.4业务组508.1.5软件开发组518.1.6测试验收组518.1.7 文档组518.1.8支持组518.2 实施方法528.3 项目实施计划538.4培训计划538.4.1培训对象与目标:538.4.2培训内容54第九章 技术支持和服务55共同制订明确的服务和支持计划55系统维护的承诺55热线服务系统55客户档案管理55常规性维护服务55应用软件服务的承诺56技术转移56技术文档移交56第一章.公司介绍第二章.环保局信息系统分析2.1 环保局信息系统现状随着数据库技术的广泛运用,环保局信息系统的运营环境逐渐转化为以数据库为中心的运
5、营环境。同时因为环保局内部对数据的需求是多方面的,所以根据工作职能的不同而建立了部门级的数据库。比如监督处关注环保局环境监督管理,许可证的管理,因此建立了环保业务系统;监理所关注排污收费,现场检查,接受投诉纠纷等内容,因此建立了排污收费系统,监控中心系统;监测站关注监测数据所以有了监测系统;而由于根据不同环保局不同部门管理的现状,在监督处、监理所,各区分局内部都是用了同一套排污申报系统.随着环保局信息化建设的深入以及各部门的业务联系的需求,部门与部门之间的数据交互日益增多,比如在监理所的业务流程中需要监测站的监测数据,需要监督处的许可证数据;监督处需要察看监理所监测到的环保局违规数据;信息中心
6、需要将各部门的排污申报数据进行汇总,以供上层领导参考。于是环保局内部系统也都做出了数据抽取的努力和尝试,例如监理所系统中增加监测数据的接口、审批资料接口;结合gis系统建立了污染源信息汇总的一套查询系统以供内部使用等等。2.1.1产生的问题可以看出,随着数据的交互抽取,很可能会形成“蜘蛛网”现象,使得数据的抽取和访问显得错综复杂。这种演变不是人为制造的,而是自然演变的结果,如果不在体系结构上进行调整,“蜘蛛网”问题将会越来越严重。因为错综复杂的抽取与访问将会产生很多问题:2.1.1.1、数据分析的结果缺乏可靠性例如在环保局内部存在着多套排污申报系统,不同部门各自进行汇总的信息与统一汇总的信息经
7、常会不一致,这样在领导面前就会出现不一致,缺乏可靠性的数据。2.1.1.2、数据处理的效率低下在错综复杂的体系结构中,不同级别的数据库可能使用不同类型的数据库系统,环保局内部就存在了sqlserver,sybase,foxpro等等数据库,根据各种不同数据库的开发工具的不同,抽取程序应用的技术不同,因而难以集成。2.1.1.3、数据共享困难对于大量的数据不能提供一个统一的数据接口,不能采用一种通用的标准和规范(如使用不同的指标代码体系和编码体系),共享通用的数据源。随着业务的增加,管理人员的操作越来越复杂,操作越来越多,用户分散,相互联系程度低,信息相对封闭,共享程度低2.1.1.4、难以将数
8、据转化为信息此外,“蜘蛛网”式的结构还难以将数据转化为决策信息。因为每个数据库由于其数据量和业务处理的需求不同,同时对历史数据的存储时间也不同,因此以现有的数据库系统难以提供完整的历史数据。鉴于这样的原因,用户根本不可能从这些数据中提取出完整的信息。例如污染源执法系统所提供的数据就不能够满足统一污染源的需求。2.1.2 问题产生的原因最根本的原因是由于各业务系统建设和实施数据管理系统的阶段性、技术性以及其它经济和人为因素等因素影响,导致在发展过程中积累了大量采用不同存储方式的业务数据,包括采用的数据管理系统也大不相同,从简单的文件数据库到复杂的网络数据库,它们构成了环保局的异构数据源。这些分散
9、的不同业务的数据管理系统虽然能够满足业务数据存储和管理要求,但在许多情况下,为作出一个决策,可能需要访问分布在网络不同位置上的多个业务数据管理系统中的数据。环保局数据源异构性主要表现在两方面:2.1.2.1、系统异构即数据源所依赖的业务应用系统、数据库管理系统乃至操作系统之间的不同构成了系统异构。2.1.2.2、模式异构即数据源在存储模式上的不同。存储模式主要包括关系模式、对象模式、对象关系模式和文档嵌套模式等几种,其中关系模式(关系数据库)为主流存储模式。同时,即便是同一类存储模式,它们的模式结构可能也存在着差异。例如不同的关系数据管理系统的数据类型等方面并不是完全一致的,如DB2、Orac
10、le、Sybase、Informix、SQLServer、Foxpro等。2.1.2.3、来源异构即环保局内部数据源和外部数据源之间的异构。2.1.3结论异构数据源的整和、集成是环保局信息化建设过程经常遇到的一个现实问题。也是制约环保局各种应用信息系统建设和数据共享程度,以及信息化建设投资重复或负担重的一个重要因素。由此可知,解决好现阶段环保局信息系统整合的问题,必须要建立一套基于整体、集成各个业务异构数据源的综合信息仓库,包括信息基础数据库和一个强大的分布式应用系统。2.2 需求分析针对环保局现有整体系统结构比较复杂,业务系统多的情况,建立环境基础数据库及在该基础数据库上开展的分布式应用系统
11、需要对现有业务系统需求进行详细地分析。2.2.1“统一污染源数据库”定义“统一污染源数据库”可以从两方面来理解。首先,该系统是一“数据库”,其存储的数据包括了污染源的所有相关信息。将原有各个系统的数据进行收集和格式转化,实现数据的统一集中管理,以改善目前环境信息存在的利用率低、共享程度差等问题。其次,该系统注重的是“统一”,因为现有污染源相关的数据来源比较多,多处存在数据不一致的情况,因此有必要通过数据的抽取、过滤、转换成为统一的,标准的数据,并把原来面向事务的数据结构转化为面向分析和决策的结构,这样才能够使得数据共享变得有意义,同时也便于利用统一后的数据进行分析,统计,决策。从这一立场来看,
12、“统一污染源数据库”可以看成是面向“污染源”主题的数据仓库的建立。2.2.2统一污染源数据库的数据统一污染源数据库的数据是原有业务系统中涉及到污染源信息的主要业务流程产生的数据,换句话说就是确定哪些信息内容需要纳入到统一污染源数据库,也就是在统一污染源数据库上集中管理的内容。通过对环保局内部系统的详细了解,我们初步确定了以下业务流程数据:从上图中可以看到统一污染源数据库应该包括的信息数据,这些数据分散在各个处室,不同处室不仅使用不同的系统,也有可能使用相同的系统单机版(比如排污申报软件)。2.2.3处室-系统-数据对应关系下图表明了上述污染源相关数据与环保局内各处室、业务系统的对应关系:上图每
13、一纵列中的绿色模块表示处室部门,黄色模块表示该部门该部门使用的业务系统,白色模块表示该业务系统中包含的与污染源相关的信息数据。由上面两张图可以大致归纳出统一污染源数据库需要集中管理的内容包括:1、污染源审批信息(审批清单、环保设施、产品原材料、验收信息)2、排污申报(水气声渣申报、水气声渣统计)3、排污许可证(排放量、年审信息)4、排污收费(每月每年排污费统计)5、现场检查(统计信息、投诉信息)6、污染源监测信息(监测报告)7、环境统计信息8、固体废物处理信息9、环境执法信息(限期整改、整治、罚款、停业 立案-审议-处罚决定)2.2.4各处室与统一污染源数据的关系当统一污染源数据库之后,各处室
14、可以:向统一污染源数据库提供其自身拥有的相关数据从统一数据库中得到更为一致性,全面的业务数据从统一数据库中得到其他处室提供的业务数据因此,从信息共享的角度来看,各处室对上述不同信息的关注程度是不一样的。下图中大致表明了各处室关注统一污染源数据库中的那些数据:2.2.5数据整合和集成需求对各处室的异构数据源数据进行整合、集成成为统一污染源数据库的目的是为环保局提供综合的、统一的、安全的、快捷的信息查询、数据挖掘和决策支持服务。为了满足这个需求条件,各处室整合、集成后的数据必须保证一定的集成性、完整性、一致性和访问安全性。2.2.5.1、集成性各种原先孤立的业务信息系统数据经过整合、集成后,应该达
15、到查询一个综合信息不必再到各个处室业务系统中进行分别查询和人工处理,只要在整合、集成后的数据信息仓库中就可以直接访问到,即整合、集成后的综合信息仓库的数据是各异构业务数据的有机集成和关联存储(整合、发掘出各业务数据间的内在关联关系),而不是简单、孤立的堆放在一个数据库系统里。2.2.5.2、完整性包括数据完整性和约束完整性两方面。数据完整性是指完整提取数据本身,约束完整性,约束是指数据与数据之间的关联关系,是唯一表征数据间逻辑的特征。保证约束的完整性是良好的数据发布和交换的前提,可以方便数据处理过程,提高效率。2.2.5.3、一致性不同业务信息资源之间存在着语义上的区别。这些语义上的不同会引起
16、各种不完整甚至错误信息的产生,从简单的名字语义冲突(不同的名字代表相同的概念),到复杂的结构语义冲突(不同的模型表达同样的信息)。语义冲突会带来数据集成结果的冗余,干扰数据处理、发布和交换。整合、集成后的数据应该根据一定的数据转换模式和商业规则进行统一数据结构和字段语义编码转换。2.2.5.4、访问安全性由于数据库资源可能归属不同的单位,各业务数据系统有着各自的用户权限管理模式,访问和安全管理很不方便,不能集中、统一管理,所以保证在访问异构数据源数据基础上保障原有数据库的权限不被侵犯,实现对原有数据源访问权限的隔离和控制,就需要设计基于整合、集成后的综合信息仓库的统一的用户安全管理模式来解决此
17、问题。 综上所述,异构数据源的整合与集成如下图所示:2.3 统一污染源数据库实质上是一个部门级数据仓库.在分析过程中,我们发现污染源统一数据库有以下的特点.1 面向决策分析的.2 污染源信息的集成性.3 面向污染源主题的4 相对稳定5 反映历史变化同时,我们注意到美国著名信息工程学家W.H.Inmon在建立数据仓库一书中对数据仓库做了如下定义:“数据仓库(Data Warehouse)是一个面向主题的、集成的、稳定的、包含历史数据的数据集合,它用于支持管理中的决策制定过程。”所谓主题,它是数据归类的标准,每个主题对应一个客观分析领域,如销售状况、人事状况、整个企业的利润状况等。它可以辅助决策集
18、成多个部门不同系统的大量数据。所谓面向主题,是指数据仓库内的信息是按主题进行组织的,为按主题进行决策的过程提供信息。 所谓集成,是指数据仓库中的信息不是从各个业务处理系统中简单抽取出来的,而是经过系统加工、汇总和整理,以确保数据仓库内的信息是关于整个企业的一致的全局信息。 所谓稳定,是指一旦某个数据进入数据仓库,一般情况下将被长期保留,也就是数据仓库中一般有大量的插入和查询操作,但修改和删除操作很少。 所谓包含历史数据,是指数据仓库内的信息并不只是关于企业当时或某一时点的信息,而是系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程
19、和未来趋势做出定量分析和预测。这样,我们有理由认为,统一污染源数据库在应用的实质意义上就是基于污染源管理的部门级数据仓库.污染源数据仓库的建立主要是针对污染源的管理进行一系列的分析,以便于局领导作出有效的决策.将统一污染源数据库上升为污染源数据仓库的概念,有利于指导统一污染源数据库在整体上的规划,同时,利用数据仓库现有的开发技术,可以有效的确定用户需求,快速的开发出高效,稳定的产品.第一, 数据仓库有效集成了企业的业务数据,提供了标准的报表和图表的功能。数据仓库的报表和图表是关于整个企业集成信息的报表和图表,其中的数据可来源于不同的多个事务处理系统。从而为企业提供了按照主题的多方位的决策支持。
20、 第二, 数据仓库可以对分布在不同系统的业务数据进行清洗和加工。数据仓库的源数据可能来自许多异构的事务处理系统,它们具有不同的数据格式和数据存储管理组织,数据仓库可以按照面向主题的原则对这些数据进行清洗和加工,使它们成为统一格式的易于使用的支持决策的数据。 第三, 数据仓库支持多维分析。多维分析是通过把一个实体的多项重要的属性定义为多个维度,使得用户能方便地汇总数据集,简化了数据的分析处理逻辑,并能对不同维度值的数据进行比较,而维度则表示了对信息的不同理解角度,例如,时间和地理区域是经常采用的维度。应用多维分析可以在一个查询中对不同阶段的数据进行纵向或横向比较,这在决策过程中非常有用。 第四,
21、 数据仓库技术可以帮助企业决策者对企业未来状况作出预测。数据挖掘技术是数据仓库表现的关键技术。数据挖掘技术可以在已有数据中识别数据的模式,以帮助用户理解现有的信息,并在已有信息的基础上,对未来的状况作出预测。在数据仓库的基础上进行数据挖掘,就可以针对整个企业的状况和未来发展作出比较完整、合理、准确的分析和预测。 第五, 成功的数据仓库系统可以为企业带来高的投资回报。结合企业业务现状,数据仓库可以建立在原有运行系统之上,企业可以在以分主题方式对原来运行数据重组的基础之上,为了某种支持特定决策的需要,再跨主题进行数据重组,这就需要数据集市(Data Marts)了。数据集市是聚集的、面向主题的数据
22、仓库,它简单、灵活,并且建立速度更快,花费也更低廉。通常情况下,企业将建立一系列数据集市,用来处理一定范畴的问题,快速决策意味着企业可以对市场机会做出快速反应,这将为企业带来巨大的商业利益。2.4 统一污染源数据库是环保局信息门户的先锋.为了将污染源数据及其分析决策信息能够方便的让环保局内部所有相关人员访问使用,必须要一种大家都易于接受的方式来表现这些数据,在这点上,信息中心建议采用B/S结构,用浏览器作为系统的统一表达方式。同时,将来建设的系统在表现层上也都准备采用同样的表现形式,所以,一个综合的门户发布系统对于整体环境信息系统而言是必备的。而在统一污染源项目中将门户的概念提出是有利于整体系
23、统规划的,可以说污染源的门户发布系统就是整体环境信息系统的先锋。这样,我们可以知道,其实, 统一污染源数据库是环保局信息门户的先锋.环保局信息门户(Enterprise Information Portal),就是采用标准浏览器,如Internet Explorer,提供对环保局的Intranet和Extranet的单点访问,使每个人能通过统一界面访问经授权的环保局内部和外部信息,从而提高决策水平。环保局信息门户为环保局的各种使用者提供了一个统一的应用界面,使环保局的使用者可以根据自己的需要获得想要的信息,它是通过提供全面的信息和应用来支持决策和客户选择的,主要作用体现在: 第一, 环保局信息
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 环保局 统一 污染源 数据库 方案

链接地址:https://www.31ppt.com/p-2827508.html