CTGMBOSS EDAODS技术规范.doc
《CTGMBOSS EDAODS技术规范.doc》由会员分享,可在线阅读,更多相关《CTGMBOSS EDAODS技术规范.doc(78页珍藏版)》请在三一办公上搜索。
1、EDA-ODS :技术规范 版本V1.0 2007年7月目 录1文档说明11.1编制说明11.2适用范围21.3起草单位21.4解释权21.5版权22系统技术架构32.1系统技术架构32.2系统技术特点42.2.1批量数据加载和实时数据更新并存42.2.2三范式模型、星型模型、宽表模型并存42.2.3细粒度数据和汇总数据并存42.2.4事务查询和统计查询的并存52.2.5数据保存周期介于生产系统和EDW之间52.3系统总体技术要求53系统功能框架73.1概述73.2数据整合域83.2.1ETL整合83.2.2数据更新配置113.3数据质量管理域123.3.1数据质量检查123.3.2数据质量执
2、行153.4数据共享域183.4.1共享配置管理183.4.2数据/服务提供183.4.3共享权限控制193.5数据应用域193.5.1数据查询193.5.2固定报表203.5.3计算应用203.5.4动态报表203.6公共管理域213.6.1系统管理213.6.2系统监控293.6.3元数据管理324系统技术要求344.1数据整合344.1.1技术要求354.1.2技术建议364.2数据存储364.2.1技术要求364.2.2技术建议384.3数据应用394.3.1技术要求394.3.2技术建议404.4数据共享404.4.1技术要求404.4.2技术建议414.5元数据管理414.5.1技
3、术要求414.5.2技术建议425系统实施425.1实施原则425.2实施建议445.2.1主要系统改造建议445.2.2流程和岗位调整建议465.2.3IT管控支撑建议465.3实施步骤465.3.1实施进度465.3.2实施步骤486系统部署506.1系统部署的参考因素506.2ODS系统部署模式506.2.1模式一:集团ODS省集中ODS516.2.2模式二:集团ODS省集中ODS本地运营数据平台536.3模式演进557附录557.1编制人员557.2ODS系统物理架构、硬件配置估算及硬件配置示例567.2.1系统物理架构图示例567.2.2系统硬件配置估算方法577.2.3系统存储规划
4、587.2.4硬件配置示例607.3第三方工具评价标准及产品比较627.3.1ETL工具627.3.2报表工具677.3.3元数据管理工具741 文档说明1.1 编制说明中国电信集团明确提出了客户品牌统领市场经营工作的要求,在市场经营的各项具体工作中细化和逐步落实客户化经营思路,适应以“产品”为中心向以“客户”为中心的转变,要求在市场经营的各项具体工作中细化和逐步落实客户化经营思路。市场的转型对于IT系统固化以客户为中心的市场计划、营销策划、销售、服务、统计分析等工作提出了更高的要求,需要相关流程的变更和优化,需要建立和应用360度客户统一视图信息,在各环节中应用客户统一视图信息,同时实现信息
5、在各渠道和前后端的进一步共享。在客户化流程的设计中我们发现客户服务和营销过程越来越依赖于频繁地查询集成的客户信息,这些都需要跨系统运营数据的支撑;同时,由于各系统数据标准不一致,存在同样信息在不同系统中取值不同的现象,带来了信息的不一致,无法取得一致的统计分析数据,不利于企业的精确化管理,给业务发展带来一定影响。中国电信ITSP1.0和CTG-MBOSS规范中提出的ODS(运营数据仓储)对于解决以上问题是及时和有效的。ODS是中国电信IT架构中的重要组成部分,在ITSP1.0和CTG-MBOSS中已经明确了其在企业信息化系统中的定位:即数据整合(承载客户统一视图)、数据共享、跨系统数据应用和数
6、据质量检查。随着CRM、计费、服务开通、资源等核心IT系统建设的逐步开展,尤其是CRM、计费省集中系统的逐步到位以及客户品牌统领市场经营工作对IT固化生产流程的迫切要求,使得ODS成为承载企业数据模型及数据标准,并据此整合各系统数据以实现企业跨系统数据共享,提供跨系统数据应用,提升数据质量的最好承载平台。因此,作为对中国电信CTG-MBOSS系列规范的必要补充,统一各省和系统集成商的认识,解决以上问题,我们制定了中国电信运营数据仓储(简称ODS)相关规范,主要包含CTG-MBOSS EDA-ODS:总体规范V1.0(以下简称ODS总体规范)和CTG-MBOSS EDA-ODS:技术规范V1.0
7、(以下简称ODS技术规范)。ODS总体规范主要介绍了ODS系统建设驱动力、业务目标、系统目标、系统架构、系统边界及系统演进等方面的内容,明确指出了中国电信ODS系统的定位、功能及与其它周边系统的边界划分原则。ODS总体规范从定位和系统边界上指导各省ODS的建设。ODS技术规范主要介绍了ODS系统技术架构、功能框架、系统总体及各功能域各自的技术特点和技术要求以及ODS系统实施与系统部署等方面的内容。ODS技术规范从技术和实施角度指导各省ODS的建设。与此规范配套下发的还有中国电信EDM模型3.0,其中BSS部分设计了细化到具有物理模型特征的逻辑模型,此部分作为ODS规范的重要组成部分,直接作为O
8、DS整合层数据模型的实施要求。1.2 适用范围本规范适用的范围为中国电信集团公司。1.3 起草单位本规范起草单位为中国电信集团公司。(参加编写ODS技术规范的人员名单见附录一。)1.4 解释权本规范的解释权属于中国电信集团公司。1.5 版权本规范的版权属于中国电信集团公司。2 系统技术架构2.1 系统技术架构遵照CTG-MBOSS EDA-ODS:总体规范V1.0中对ODS的定位,ODS整合生产系统的运营数据,形成统一的企业运营数据。ODS系统一方面承担提供跨系统运营数据的共享职能,另一方面承担基于运营数据的查询、统计报表和批量计算功能,同时作为数据仓库的主要数据来源。ODS系统需实现的功能需
9、要由相应的技术架构实现支撑。ODS从周边的各生产系统包括CRM、计费、网上客服中心、10000号等系统通过ETL或EAI等技术将源数据抽取加载到系统中,通过对源数据的清洗、转换在ODS中形成遵循企业数据模型的统一基础数据,根据应用需要,ODS通过数据处理组件形成各类汇总数据。基于系统中整合与汇总好的数据,ODS系统上以B/S架构直接部署查询、报表等数据应用,ODS系统还可通过数据服务组件以文件、数据视图、数据服务等形式向外围的生产系统提供共享数据,与生产系统配合完成跨域应用支撑。ODS系统的技术架构如图2-1所示:图2-1 ODS技术架构图2.2 系统技术特点依照ODS系统的定位,ODS系统不
10、同于以事务处理为主的生产系统,也不同于以统计分析为主的数据仓库系统。系统需要支撑跨域数据查询功能,还需要支撑生产系统对一定周期内运营数据数据统计与计算功能。系统的定位决定了ODS系统具有与生产系统与数据仓库不同的技术特点:2.2.1 批量数据加载和实时数据更新并存ODS系统需要从源系统抽取加载计费清单等大批量运营数据,也需要从生产系统准实时同步客户、产品实例、账户等数据,并对ODS系统的数据同步更新。2.2.2 三范式模型、星型模型、宽表模型并存ODS系统抽取源系统数据到接口层,接口层数据和源系统数据采用相同的基于3NF的数据模型设计方法。ODS系统将来自各个业务系统的接口层数据进行数据整合处
11、理后进入整合数据层,为了加快外系统查询性能,整合数据层数据需要做部分反范式处理。整合层数据经过汇总和整理后,进入汇总数据层。汇总数据层主要面向报表应用,需要部分采用星型模型设计方法,对于部分复杂查询应用可以采用宽表设计模型。2.2.3 细粒度数据和汇总数据并存ODS系统主要为电信运营提供支撑,需要提供面向单个客户的查询和统计功能,因此需要保存单个客户、清单、帐单等细粒度数据;同时,ODS系统需要提供面向运营的报表型应用,也需要保存部分运营汇总数据。2.2.4 事务查询和统计查询的并存ODS系统需要提供对客户统一视图等个体数据的查询能力,同时需要提供基于渠道经理、地域等维度的汇总数据的统计查询应
12、用。2.2.5 数据保存周期介于生产系统和EDW之间生产系统不需要支撑大量的分析应用,所以只需要保存当前最新的业务数据;数据仓库需要提供经营决策分析功能,所以需要存储较长周期的业务数据。ODS系统结合了两者的特点,既需要提供准实时的运营数据的查询,也需要提供基于一定周期运营数据的统计报表和批量计算应用。因此,ODS系统的数据保存周期将介于生产系统和EDW之间。2.3 系统总体技术要求ODS系统是中国电信EDA架构中的重要组成部分,是生产系统和EDW系统中间的数据缓冲层,担负着客户统一视图、跨域数据共享、运营报表展示和查询统计等功能。从上节“系统总体技术特点”描述可以看出ODS系统兼有OLTP系
13、统和OLAP系统的双重特征,因此系统配置的软硬件需要兼顾到在线处理的性能和批量数据更新、汇总与查询的效率。另外作为中国电信IT支撑系统之一,系统的实现应参考国际标准NGOSS、国内ITSP、CTG-MBOSS等规范,并结合中国电信IT现状,采用先进可靠的设备和技术,确保系统的先进性和成熟性,保证投资的有效性和延续性。ODS总体技术需要注意以下几个方面:网络与硬件方面:1. 采用安全可靠的高速磁盘阵列设备,支持多机高可用群集系统,磁盘阵列与主机系统采用SAN方式连接;2. 采用高速可靠的网络设备,提供高速的I/O能力;3. 主机支持多机群集或海量并行处理技术,支持分区技术;4. 主机采用高可用性
14、(HA)和负载均衡的方式,防止单点故障,提高系统可用性和系统资源的使用率。软件方面:1. 选择对OLTP和OLAP应用都具备稳定处理性能的数据库引擎;2. 选择能对数据整合过程进行有效监控和管理的数据整合工具或技术;3. 数据质量管理是ODS系统承担的重要任务,ODS选择的数据质量管理工具或者自行开发的数据质量管理功能需要对进入ODS系统的数据实施全程闭环的数据质量审核和修正,提高中国电信运营数据质量;4. 选择提供各种接入方式的报表查询和统计分析功能的报表工具;5. 选择为业务处理、技术实现等环节提供清晰的系统导航功能的元数据管理工具,; 6. 采用能对系统内的软硬件节点进行监控和自动预警的
15、系统监控软件;7. 制定完善的备份与恢复策略,采用成熟的备份软硬件,提供快速备份与恢复功能;8. 由于ODS需同时满足前端应用的快速响应和后端数据的实时及批量更新,因此ODS的模型应该采用分层设计方法,兼容两类特征,其中ODS的整合层也会做适度的反范式处理来满足系统的建设要求;9. 为了满足数据的高速加载,系统需进行相关优化操作,优化数据抽取调度策略,避免CPU、Memory、IO等资源的争抢,设计良好的数据文件/表空间/数据表存储规划,保证数据在磁盘的优化分布;10. 对于数据共享层的访问应采用独立接口的原则,将ODS的数据封装为独立接口层提供外部访问,避免ODS系统数据模型直接暴露给外部系
16、统,提高数据安全性。3 系统功能框架3.1 概述为了在业务和IT之间形成统一完整的功能视图,基于中国电信ITSP应用系统目标架构的基础架构部分,继承中国电信CTGMBOSS的功能架构成果,以ODS系统三阶段业务支撑能力为目标,制定此功能框架,以明确界定ODS系统功能范围和层次,并作为ODS设计和规划系统的基础。本框架遵循CTG-MBOSS功能层次的划分标准,从系统服务对象和支撑对象的角度,将ODS划分为五大功能域:数据整合域、数据共享域、数据应用域、数据质量管理域、公共管理域,如图3-1所示:图3-1 ODS系统功能框架3.2 数据整合域数据整合域是ODS系统的关键部分,ODS通过多种技术准实
17、时或实时地从源系统中抽取数据,抽取过来的数据首先到达ODS的接口数据层进行预处理,然后经过转换等工作到达整合数据层,形成ODS的核心数据。整合层的数据通过整合、计算、汇总形成汇总层的数据。数据整合域功能主要包括ETL和数据更新配置两大部分。3.2.1 ETL整合3.2.1.1 数据抽取ODS从数据源系统获取数据,在实施时需要综合考虑业务需求、抽取效率、源系统代价等因素确定抽取策略,抽取策略包括抽取方式(增量、全量)、抽取时机、抽取周期等。 功能要求1. 支持增量、全量、异步和同步抽取方式;2. 支持多种不同系统平台和数据类型的数据抽取。包括各种关系型数据库系统、各种文件格式的源数据等。3.2.
18、1.2 数据映射源系统数据通过整合从源系统进入到ODS,ODS再提供给外部系统使用时,数据的格式和定义都有不同程度的变化,因此需要在数据整合过程中通过数据映射方式进行转换,数据映射主要定义数据结构、数据定义方面的映射关系。功能要求1. 提供图形化可操作数据映射界面;2. 提供多种关系的数据映射方式,如一对一、一对多、多对一、多对多。3.2.1.3 数据转换数据转换包括格式和类型转换、数据翻译、数据匹配、数据聚合以及其他复杂计算等。多数情况下,数据源到ODS之间主要的转换是格式转换、数据翻译、数据匹配,而数据聚合以及其他复杂计算主要在数据汇总时出现。功能要求1. 支持在不同业务系统之间数据转换。
19、2. 支持不同的数据源系统平台。3. 支持数据的定义、数据结构和错误数据的转换处理。3.2.1.4 数据检查对于文件接口的数据的检查,主要从接口数据的完整性、及时性和正确性三个方面进行检查,系统根据接收文件的时间、入库是否异常等角度进行分析;对于业务应用系统的数据库接口,系统主要从接口的及时性和一致性方面进行检查,通过比较源系统的相关指标,分析数据的可信度。功能要求1. 支持接口文件检查,包括文件名、记录数、实体完整性检查等;2. 支持接口数据检查,包括数据类型、实体完整性等。3.2.1.5 数据加载数据加载是指将抽取转换后的数据加载到ODS中,包括数据行加载和数据块加载。在综合考虑效率和业务
20、实现等因素基础上确定数据加载周期和数据追加策略。功能要求1. 支持批量数据的数据库直接加载;2. 支持多个数据库连接,能够进行大量数据的并行加载;3. 支持自动与手工预加载的流程。当日常数据加载出错,一般采用人工干预的方式来进行,这时需提供一个数据重新接收、加载的操作界面;4. 支持多种加载数据的方式,如直接追加、全部覆盖、更新追加。3.2.1.6 异常控制主要通过计数统计数平衡、拒绝数据量等方便评估数据复制、ETL的具体运行情况,以发现数据整合过程中有关数据的问题,并进行必要的处理。功能要求1. 支持校验点。当外部数据记录特别庞大时,如果因为某种原因发生故障中断后,可以从最近的校验点开始处恢
21、复处理;2. 支持外部数据记录的错误限制定义,同时将发生错误的数据记录输出。3.2.1.7 作业管理ETL作业管理主要包括初始化作业、日常ETL作业、日常复制作业、异常处理作业等,同时要求对并发作业、高负载作业有良好的管理。对于基于ODS的某些特定应用,如数据质量检查和稽核,应该考虑采用统一的作业控制工具进行作业调度和管理。 功能要求1. 提供图形化可操作任务调度与管理配置界面;2. 支持任务属性配置,可以对各项任务的属性进行配置,并保存在后台配置文件中,以备任务调度按序执行;3. 支持总任务的调度,使其按照设置条件自动按序执行任务;4. 支持分任务的调度,可按照任务类型、时间、区域等按照各自
22、设置好的条件进行任务的调度;5. 支持任务的回退,需要对某几项任务进行重新调度时,可以将任务回退到需要重新调度的周期。3.2.2 数据更新配置需要整合的源系统比较多,其中系统架构、数据提供能力、以及提供的源数据使用要求各有不同,因此在数据更新功能方面需要提供灵活的配置能力,提高数据整合的效率和便利。3.2.2.1 更新规则配置提供多种数据更新规则,根据规则特点和业务需要,进行更新规则的配置。功能要求1. 提供图形化的操作配置界面;2. 支持按照源数据的生产特性进行有针对性地规则配置。3.2.2.2 更新方式配置提供多种数据更新实现方式,并且针对不同的数据源系统和不同的数据需要,进行更新方式的配
23、置。功能要求1. 提供图形化的操作配置界面;2. 支持直接追加方式;3. 支持全部覆盖方式;4. 支持更新追加方式。3.2.2.3 更新频度配置在确定更新方式之后,同样需要提供更新方式的频度配置能力,需要从数据源系统的生产压力、系统架构等方面来考虑频度。功能要求1. 提供图形化的操作配置界面;2. 提供不同级别的数据更新频度,如秒级、分钟级、小时级、天或更长时间(包括周和月)。3.3 数据质量管理域数据质量管理域的功能是为了解决目前普遍的数据质量顽疾,通过建立数据质量管理组织机构,制定质量管理规范,确定相应的工作流程方法,并在系统中实现质量检查、修正、考核功能,形成数据质量修正闭环的机制,确保
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CTGMBOSS EDAODS技术规范 EDAODS 技术规范

链接地址:https://www.31ppt.com/p-4153055.html