一体化智能化公共数据平台项目建设方案.docx
一体化智能化公共数据平台项目建设方案一、项目背景4二、建设目标41.统筹建设,集约管理42.汇集数据,加强管控53创新应用,发挥职能54.安全规范,全面保障5三、平台架构53.1. 总体架构53.2. 平台建设逻辑架构6四、系统设计8五、建设要求105.1. 数据目录115.2. 数据归集115. 3.数据治理114frr111z*XX5. 5.数据开放1156专建设126. 7.安全保障12六、建设内容1361目录编制服务137. 1.1.数据编目136.1.2. 数据目录更新维护136.1.3. 数据供需对接136.2.数据归集服务146. 2.1.搭建数据标准规范体系147. 2.2.数据归集系统148. 2.3.数据归集服务156.3.建立数据治理服务体系156.3.1.元数据管理156.3.2,元数据应用156.3.3.数据质量管理166.3.4.数据生命周期管理196.3.5.数据标准管理206.4.搭建数据共享平台206.4.1.接口共享206.4.2.批量共享236.4.3.在线查询236.5.搭建数据资源管理开放门户246.5.1.数据资源管理246.5.2.统一数据服务246.5.3.组件超市246.5.4.数据接入管理246.6.搭建数据仓及专题库256.6.1.搭建数据仓及专题库模型256.6.2.搭建县级数据仓266.6.3.搭建乡镇数据仓266.6.4.特色专题库建设276.7.构建安全体系276. 7.1.网络基础安全277. 7.2.数据内控安全288. 7.3.数据开放安全309. 7.4.数据共享安全3110. 7.5.等保测评3211. 7.6.安全服务32七、附件32附件一:数据库审计系统33附件二:数据运维内控系统38附件三:数据静态脱敏系统43附件四:数字水印系统48附件五:终端加密软件50一、项目背景一体化智能化公共数据平台是打破信息孤岛、实现数据共享的重要抓手,是全方位、系统性推进数字化改革的强大动力和重要支撑。浙江省一体化智能化公共数据平台的架构是“四横四纵两门户”O数据资源体系是一体化智能化公共数据平台的重要组成部分,由省市县三级体系组成。县级平台是省市两级平台向县(市、区)的拓展和延伸,是提升县(市、区)数据资源管理能力的基础,是赋能县域治理、推动基层数字化改革的保障。县级平台应按照县级公共数据平台建设导则建设本地数据的目录、归集、治理、共享和安全管理能力,构建安全可控、分级维护、协同共享的县级数据资源体系,完善全省一体化智能化公共数据平台。二、建设目标根据浙江省数字化改革总体方案要求,加快建设一体化智能化公共数据平台,进一步完善全省数据资源体系。结合本导则按照“互联互通、以用促建、经济适用、共建共享”的原则统筹县级平台建设。加快建设一体化智能化公共数据平台,进一步完善数据资源体系,推进数据编目、数据归集、数据治理、数据共享、数据开放、数据安全等工作。1 ,统筹建设,集约管理从全县的角度,考虑用户权限、信息系统安全、数据安全、标准规范统一管理,按照“完整、正确、统一、及时、安全”的总要求,统筹考虑信息化建设工作,进行一体化智能化公共数据平台的整体规划与顶层设计,为全县将来的信息系统建设提供数据支撑和管理保障。2 .汇集数据,加强管控充分考虑省、市、区各级数源与一体化智能化公共数据平台的关系,按照“统一架构、统一规范、集约建设、分级管理、协同运维”原则,建设一体化智能化公共数据平台。通过建设数据交换中间件系统打破数据烟囱,实现政务信息资源的统一汇聚,并将治理后的数据向杭州市进行数据归集,总体推动信息共享和业务协同,整体强化系统应用绩效。3 .创新应用,发挥职能结合数据资源情况与各部门实际应用需求,建设用于服务各部门的数据资源管理开放门户,为各部门提供基于其业务场景的数据服务。4 .安全规范,全面保障建立系统、科学、高效的数据安全管理制度,健全审批流程体系和评价体系,促进安全工作标准化、流程化、规范化开展。三、平台架构3.L总体架构一体化智能化公共数据平台的架构按照省市建设规范“四横四纵两门户”进行建设。围绕“四横四纵”八大体系,推进一体化智能化公共数据平台的建设。县级平台在构建数据编目、归集、治理、共享、开放和安全管理能力时,充分利用市级政务云资源和省市两级应用支撑体系中的各类智能组件。县级平台通过数据交换或数据高铁等方式,离线或实时归集本地自建业务系统数据。县级平台通过构建数据治理能力,完成本地数据的清洗比对,提高本地数据归集的准确性、完整性和及时性。县级平台可通过接口封装、批量授权等方式为本级业务部门提供数据共享。县级平台通过打造数据全生命周期管理能力,实现数据采集、传输、存储、处理、共享交换、销毁等数据全生命周期安全管理。县级平台通过承接市级下发数据,融合本地数据,建设特色专题库,按需建设乡镇(街道)数据仓,支撑县域数字化改革。县级公共数据平台建设框架应用系统数席楷口3.2.平台建设逻辑架构按照数据库层、平台层、应用层三个核心层进行架构设计,建成一个开放的、构件化、面向对象、可灵活扩展的多层架构体系的系统。整个架构体系中的基础层是整个系统运行的基础环境层,用户层为系统的操作和访问层。平台逻辑架构图如下:淳安国数据中心数据协同平台源数据层:主要针对需要采集对接或者迁移至大数据中心的数据资源,包括结构化数据、半结构化数据和非结构化数据。数据采集层:面向源数据层开展数据资源的采集和交换,提供实时数据采集服务和离线数据采集服务。数据存储层:搭建大数据中心分布式存储体系,实现全量数据的统一存储和管理,针对结构化数据、半结构化数据、非结构化数据提供针对性的存储解决方案,为全县各数据分析和计算提供稳定可靠的底层数据存储服务。数据处理层:针对业务数据实际,提供数据治理服务,实现数据清洗、数据校验、数据聚合等服务,为县大数据中心的数据质量提供保障。计算服务层:根据县内各应用场景的实际需求,提供数据分析和计算服务,实现大数据场景下的实时计算和离线计算服务。数据服务层:针对不同应用及场景,提供可视化的数据查询、数据交换、数据共享、数据分析等具体服务。数据安全保障:针对海量据资源的存储和使用,通过搭建数据安全管控平台,对数据进行安全管理,同时提供数据加密、脱敏、权限管理和容灾备份等服务。数据管理:面向数据资源的全生命周期,搭建数据资产管理平台,实现元数据管理、数据采集管理、数据共享管理、数据开放、数据质量管理、数据模型管理等业务功能模块。应用层:搭建面向数据源管理和服务的工作门户,为县内各应用及业务场景提供数据协同和数据计算服务。四、系统设计进一步整合县级各单位数据资源管理和共享水平,有效落实主体责任,充分利用杭州城市大脑服务资源,结合省市公共数据平台数据资源实际,汇聚县域数据资源,提高数据共享和数字赋能能力,为数据协同和业务协同提供有力支撑,提升城市治理效能,为实现数字治理提供有效支撑和服务。在项目的建设过程中贯彻整体性、先进性、易用性,安全性,渐进性、标准化和可持续建设原则。 整体性杭州市一体化智能化公共数据平台是综合性的系统工程,不仅涉及日常工作的方方面面,还涉及全县各级单位的的各种通用平台等复杂环境,因此在系统设计建设过程中,必须对业务需求进行充分调研、深入探讨、全面考虑,从而确保系统建设的完整性。 先进性应采用当今主流技术以及符合未来发展的趋势,既要实现应用平台和工具的先进性,更要考虑系统结构和应用设计的先进性和扩展性,以适应宏观上业务管理、发展规划和微观上事务办理的需求。 易用性杭州市一体化智能化公共数据平台的建设本着“精简、统一、效能”的原则,要求建立起行为规范、运转协调、公正透明的数据管理体制,在网络设置上要充分考虑现有的网络平台,实实在在为部门提供便捷服务。同时也要从各部门相关业务人员使用上的方便快捷,易学易用,客观直观的角度去设计。 安全性系统建设要符合用户对信息安全管理的要求,建立完善可靠的安全保障体系,对非法入侵、非法攻击和网络计算机病毒应具有很强的防范能力,确保系统具有严格的身份认证功能,并有相应的技术手段对数据安全和操作安全加以保护。 规范性提高效率和依法行政都必须规范程序。电子化的最大特点和优点就是它重复劳动的能力极强,流程越规范,计算机模拟起来就越迅速;同时能利用技术,通过信息化的方式把一些规则固化下来,通过程序的不可逆性,达到政务流程的改善和改造,并通过这种方式进行联合监管。在实施电子政务的过程中,一方面应该提高政务流程的并行化程度。传统政务的流程更多的是串行方式,一环接一环地走,现在提倡的是并行方式,同时运行几个或多个环节。这要求把流程编制得更合理,让能够并行的环节尽量去并行,使整个政务流程中并行的环节多,串行的环节少。另一方面,要加强处室间的协作,并通过规范电子程序,实现“业务分工责任化”、“业务流程规范化”、“信息处理精细化”,而不是为了“电子政务”而电子政务。 渐进性、标准化和可持续原则信息化是一个过程,任何企业、机关的信息化,都不可能一步到位,必须按照“统一规划、分步实施、急用先搞、务求实效”的原则,逐步建设完成。渐进信息化并不等于没有总体规划,不能像以前那样哪里需要哪里做,最后形成一个个信息“孤岛”。信息化必须在整体规划的基础之上,按照国家有关电子政务标准化规范逐步推进。现在搞信息化,一定要考虑到未来的长远发展。当前开发、建设的信息系统必须是可扩充、可持续发展的。功能可以不断增加或改进,网络建设要考虑到未来的需求,应用软件必须是可升级、可集成的,尽量避免在一定时期内因为技术升级而废弃原来的软件。五、建设要求一体化智能化公共数据平台按照省市建设规范要求,建设数据交换、治理、接口共享和安全管理等组件,承接市级下发数据,建设县级专题库和乡镇数据仓。所有自建系统应按标准完成与市平台对接,纳入省市县一体化数据资源体系管理,支撑县域数字化改革。5.L数据目录数据资源目录体系采用省市两级建设模式,省市两级目录系统,实现目录共享、流程互通、一体化建设管理。基于全省一体化目录架构,依托市级公共数据目录系统编制本级数据目录。县级平台目录系统应实现与省级平台目录系统动态连接,并完成区县目录专区建设。5.2.数据归集建设数据归集系统,建立本地数据归集能力,实现县域数据归集。县级平台数据归集系统可分为两种技术模式:数据交换模式和数据高铁模式,数据交换模式通过库表桥接方式实现数据归集,数据高铁模式通过日志同步实现数据实时归集。5. 3.数据治理围绕提升数据准确性、完整性和及时性,让数据可用、好用、易用的核心目标,通过建立数据清洗规则、数据质量评估标准、数据问题反馈机制、数据使用标准等相关规范,对本地数据进行治理,形成数据治理闭环,提升数据质量。6. 4.数据共享县级平台需具备接口方式共享数据的能力,支持本地数据接口的注册发布和省市平台接口的向下封装。原则上,县级平台共享系统只封装市级平台数据接口。县级平台通过共享系统,实现本地接口数据的统一共享和统一管理,并完成与市级共享平台对接,为县域范围内各应用的数据共享提供支撑。7. 5.数据开放县级平台不单独建设数据开放网站,由市级数据开放网站设立县级开放专区,各县依托市级数据开放网站实现数据开放。县级平台应持续做好本地个性化数据的管理和监测工作,不断提升本地数据开放比例,跟踪数据开放利用效果,为数据开放应用提供高质量数据,推动优秀数据开放应用落地孵化。结合公共数据目录编制工作,基于市公共数据开放目录,增加本县特色开放数据,明确数据项名称、数据格式、更新周期、开放属性、开放单位等,汇总形成市级数据开放目录。与民生密切相关、社会迫切需求、经济增值潜力显著的公共数据,应当优先纳入开放重点。5. 6.数据仓及专题库建设县数据仓是省市公共数据平台将数据按照所属地域进行分域管理后形成的数据集,是实现全省数据分域管理的基础。县数据仓应按照“需求导向、以用促建”的原则进行建设。专题数据库由县级各业务部门按需建设,可面向生态环境、交通出行、教育文化、医疗卫生、社保就业、城建住房、社会救助、法律服务等领域构建专题库。6. 7.安全保障县级公共数据主管部门是县级平台的安全责任主体,按照“谁主管谁负责、谁建设谁负责、谁使用谁负责”的原则,建立健全涵盖数据采集、传输、存储、处理、共享交换、销毁等数据全生命周期的公共数据安全管理体系、技术体系、运营体系,有效防范数据篡改、数据泄漏和数据滥用。六、建设内容按照县级公共数据平台建设导则搭建一体化智能化公共数据平台,县级平台是省市两级平台向县的拓展和延伸,是提升县数据资源管理能力的基础,是赋能县域治理、推动基层数字化改革的保障,通过开展数据目录的普查,搭建数据归集、存储、治理、共享和安全管理能力,构建安全可控、分级维护、协同共享的县级数据资源体系,实现全省一体化智能化公共数据平台向区县的延伸。7. 本项目建设包含目录编制、数据归集服、数据治理、数据共享、数据开放、数据仓、专题库。8. 1.数据目录编制服务6.LL数据编目全面普查梳理本地自建、在用的信息系统,以及对应的组件目录和数据目录,依托公共数据平台目录系统,持续补充完善信息系统情况,做到目录普查全面、准确、无遗漏。6.1.2.数据目录更新维护根据本地信息系统情况,按照公共数据资源目录编制指南,在公共数据平台目录系统上进行公共数据的目录新增、删除、修改、查询等操作,针对已编目的公共数据及数据项进行动态管理。6.L3.数据供需对接对于仍未归集的数据,县级部门可依托市级平台目录系统,在线填报数据需求部门、联系人、联系方式、应用场景、申请理由、需求数据项、数源单位等要素,提出数据需求。对于涉及全市或者全省范围的需求,县级平台可自动转发至市级、省级平台,由省市公共数据管理部门处理。对于规范合理的数据需求,县级平台根据数据需求自动形成数据需求清单与责任清单,基于数据责任清单形成数据归集任务,下发给同级数源部门并完成数据归集,实现数据供需的统一化、动态化、智能化管理。6.2.数据归集服务建设数据归集系统,建立本地数据归集能力,实现县域数据归集。按照浙江省公共数据交换平台管理办法和浙江省公共数据交换技术规范,做好县级归集系统与市级归集系统的对接工作,实现市县两级数据互联互通。基于县级主题数据仓、生态环保专题库、“两山银行”专题库、智慧文旅专题库、大下姜专题库的建设,以及县内重点应用系统进行数据归集工作。6.2.1.搭建数据标准规范体系按照浙江省公共数据交换平台管理办法和浙江省公共数据交换技术规范,基于GB/T21063政务信息资源目录体系基础,结合我县政务信息资源的特点,制定我县政务信息资源目录相关管理规范。从总体框架、技术要求、数据标准、资源分类、编码规则等方面规定资源目录体系建设所应遵循的原则和方法,同时建立元数据管理和维护的长效机制,为数据资源的动态管理提供支撑。6.2.2.数据归集系统搭建数据归集系统,按照浙江省公共数据交换技术规范和浙江省公共数据交换平台管理办法相关要求进行建设和管理。包含数据交换前置节点、交换中心、数据传输工具、交换监控等模块,应支持数据库、接口、文件的归集方式。建立本地数据归集清单化常态管理机制,加强数据归集系统的运维保障,实现跨层级、跨部门、跨系统的数据归集和共享交换。6.2.3.数据归集服务按照省市“政府数字化改革”任务要求,基于GB/T21063政务信息资源目录体系基础,根据信息项目管理办法,结合县内各单位信息化项目建设实际,基于县级人口主题数据仓、法人主题数据仓、生态环保专题库、“两山银行”专题库、智慧文旅专题库的建设,对县内相关的信息系统及重点应用进行第一批数据归集工作。6.3.建立数据治理服务体系将采集到的数据进行质量评估、清洗、比对和分析处理,为系统功能应用提供完整的数据支撑,以应用和场景需求为导向,开展数据清洗和数据治理服务,提升数据质量,保障数据安全。6.3.1,元数据管理元数据驱动智能化。我们在源头对每个元数据进行了规范定义,尽可能实现数据的原子化和结构化,并将其全部存储在元数据中心。正是这些元数据对数据计算、调度、存储等有着重要意义,以此能达到实现从人工到自动化,甚至进化而实现智能化。6.3.2,元数据应用元数据是数据管理的基石,数据管理中的质量管理、标准管理、安全管理、接口管理等,均依赖于元数据的管理。ETL自动化管理:使用元数据信息自动生成物理模型,ETL程序脚本,任务依赖关系和调度程序。数据质量管理:使用数据质量规则元数据进行数据质量测量。数据安全管理:使用元数据信息进行报表权限控制。数据接口管理:使用元数据信息进行接口统一管理。6.3.3,数据质量管理数据质量的高低代表了该数据满足数据消费者期望的程度,这种程度基于他们对数据的使用预期。数据质量必须是可测量的,把测量的结果转化为可以理解的和可重复的数字,使我们能够在不同对象之间和跨越不同时间进行比较。数据质量管理是通过计划、实施和控制活动,运用质量管理技术度量、评估、改进和保证数据的恰当使用。6.3.3.1.识别数据质量维度识别已采集数据的数据质量问题所属维度,以便针对不对问题进行不同方式的处理。可以从下面6个维度进行识别,从而形成数据质量报告。准确性:数据不正确或描述对象过期合规性:数据是否以非标准格式存储完备性:数据不存在及时性:关键数据是否能够及时传递到目标位置一致性:数据冲突重复性:记录了重复数据6.3.3.2.脏数据处理数据质量分析的主要任务就是检查数据中是否存在脏数据,脏数据一般是指不符合要求以及不能直接进行相关分析的数据。脏数据包括以下内容:(1)缺省值分析产生原因:有些信息暂时无法获取,或者获取信息的代价太大;有些信息是被遗漏的,人为或者信息采集机器故障;属性值不存在,比如一个未婚者配偶的姓名、一个儿童的固定收入。影响:会丢失大量的有用信息;数据额挖掘模型表现出的不确定性更加显著,模型中蕴含的规律更加难以把握;包含空值的数据回事建模过程陷入混乱,导致不可靠输出。解决办法:通过简单的统计分析,可以得到含有缺失值的属性个数,以及每个属性的未缺失数、缺失数和缺失率。删除含有缺失值的记录、对可能值进行插补和不处理三种情况。(2)异常值分析产生原因:业务系统检查不充分,导致异常数据输入数据库;影响:不对异常值进行处理会导致整个分析过程的结果出现很大偏差;解决办法:可以先对变量做一个描述性统计,进而查看哪些数据是不合理的。最常用的统计量是最大值和最小值,用来判断这个变量是否超出了合理的范围。如果数据是符合正态分布,在原则下,异常值被定义为一组测定值中与平均值的偏差超过3倍标准差的值,如果不符合正态分布,也可以用原来平均值的多少倍标准差来描述。(3)不一致值分析产生原因:不一致的数据产生主要发生在数据集成过程中,这可能是由于被挖掘的数据是来自不同的数据源、对于重复性存放的数据未能进行一致性更新造成。例如,两张表中都存储了用户的电话号码,但在用户的号码发生改变时只更新了一张表中的数据,那么两张表中就有了不一致的数据。影响:直接对不一致的数据进行数据挖掘,可能会产生与实际相悖的数据挖掘结果。解决办法:注意数据抽取的规则,对于业务系统数据变动的控制应该保证数据仓库中数据抽取最新数据。(4)重复数据及特殊数据产生原因产生原因:业务系统中未进行检查,用户在录入数据时多次保存。或者因为年度数据清理导致。特殊字符主要在输入时携带进入数据库系统。影响:统计结果不准确,造成数据仓库中无法统计数据解决办法:在ETL过程中过滤这一部分数据,特殊数据进行数据转换。6.3.3.3.数据质量管理在对数据质量进行评估后,形成数据质量评估报告,报告描述内容包括:数据结构、内容、规则、和关系的概况。通过应用统计方法返回一组关于数据的标准特征,包括数据类型、字段长度、列基数、粒度、值、格式、模式、规则、跨列和跨表的数据关系,以及这些关系的基数。评估报告可增加对数据和环境的了解,及对数据的状况进行描述。6.3.4,数据生命周期管理数据生命周期管理(datalifecyclemanagement,DLM)是一b种基于策略的方法,用于管理信息系统的数据在整个生命周期内的流动:从创建和初始存储,到它过时被删除。DLM产品将涉及的过程自动化,通常根据指定的策略将数据组织成各个不同的层,并基于那些关键条件自动地将数据从一个层移动到另一个层。数据生命周期管理的总体原则:在数据的整个生命周期中,不同阶段的数据其性能、可用性、保存等要求也不一样。通常情况下,在其生命周期初期,数据的使用频率较高,需要使用高速存储,确保数据的高可用性。随着时间的推移,数据重要性会逐渐降低,使用频率会随之下降,应将数据进行不同级别的存储,为其提供适当的可用性、适度的存储空间,以降低管理成本和资源开销。最终大部分数据将不再会被使用,可以将数据清理后归档保存,以备临时需要时使用。在创建数据表时,即设置表的有效期限,该表相关的数据开发脚本、调度过程的生命周期也会自动控制在这个有效期内;在运行过程中,通过智能监测,定期检测出已无调用、调用量过少的数据对象,可供运维人员参考,以判断是否将这些数据对象及时下线。6.3.5.数据标准管理数据标准是为了规范系统建设时对业务的统一理解,增加业务部门、技术部门对数据的定义与使用的一致性。数据标准适用于对各部门数据描述,用作数据的规范化定义和统一解释。数据标准制定原则:遵循“循序渐进、不断完善”原则。制定顺序为公共代码数据标准、通用数据标准、共享数据标准、特定数据标准。开发数据标准的同时,建立数据标准管制架构和维护流程。制定数据标准编制成果,通过“树型结构”信息化处理各项执行标准,实现数据标准代码集和数据集的导入、维护、变更与发布,支持数据标准综合查询,指导系统数据表建立,主要包括数据标准组织、数据标准导入、数据标准导出、约束规则配置、数据标准映射、标准应用监控等。6.4.搭建数据共享平台建设统一数据共享服务平台,整合省、市数据资源,为全县提供统一的接口申请、审核、发布服务,并对接口日常访问进行安全控制和监督,实现各类数据资源的多样化共享服务。6.4.L接口共享县级平台共享子系统需具备接口数据的共享能力,通过省市平台接口的向下封装和本县内接口的统一共享和统一管理,实现对区域范围内各应用的数据共享支持。平台的共享子系统接口共享模块具备接口注册、接口列表、接口管理、接口审批、应用管理、密钥管理、安全管理、接口网关、接口服务监测、调用日志分析、日志统计汇总、存档和上报等功能。主管部门负责对本市接口注册与使用的管理与审核,并做好接口使用情况上报,实现与市级数据共享系统无缝对接。6.4.1.L接口申请提供县级部门省、市、县级接口统一查询平台,按分类进行集中展示。可提供如下分类展示。按来源分类:可按省级、市级、县级三级来源进行分类展示。按信息类别:可按接口信息来源所属分类进行展示,例如:按个人、企业进行分类展示。已申请接口:集中展示已申请的接口。6.4.1.2.接口审核数据资源管理单位和数源单位可以通过系统平台对本单位的共享数据接口进行共享接口申请的审核,保障数据的按需使用和共享。6.4.L3.接口集成封装系统可以注册和集成省市公共数据平台及城市大脑相关的数据接口,也可以集成县自有数据资源接口,同时针对不同的使用场景,提供不同的接口协议,满足各类型的数据接口服务需求。6.6Ll接口安全平台通过身份认证、权限管理、密钥认证、数据加密、白名单机制、HTTPS协议、SSL证书等技术措施,保障数据共享系统在数据使用与传输过程中的网络安全与数据安全。在接口的使用管理中,需要加强接口监控和日常巡检,杜绝数据接口的违规使用。6.4.1.5.接口性能共享接口调用响应时间应低于1500毫秒。高频调用接口可支撑每秒500次并发量;低频调用接口可支撑每秒100次并发量。省市两级数据共享系统对接过程中不应出现性能短板,需实现接口的平稳对接。6.4.1.6.数据监控访问日志:实现县级用户接口访问情况进行日志记录,记录用户访问具体接口及返回数据明细。包括调用哪个API、调用者身份、调用参数、调用结果、调用返回值等信息。这些信息用于最后的统计。在调用过程中如果发生了不可知的错误,需要进行异常捕获。捕获的信息需要记录到异常日志表中。访问监控:进行实时监控单个接口的访问情况,可进行分时间区域分析接口被访问的情况,并且可分析接口的压力情况,如最高访问时间段。6.4.1.7.统计分析系统支持按县级部门进行统计接口申请、应用情况;可按县级部门统计各单位访问情况及具体接口访问情况;可统计各个接口访问情况。6.4.2.批量共享平台具备数据批量共享的能力,通过库表授权与库表交换方式,实现批量数据共享。同时数据主管部门建立健全批量数据共享管理与数据安全制度流程规范,平台数据批量共享服务依托市于市级公共数据平台现有的能力设施。6.4.2.1.批量数据申请县级各单位各部门可以通过数据资源目录系统,查看当前的数据资源情况,根据部门的实际使用需求,可以通过系统平台进行批量数据资源的申请,申请需要共享的数据资源的数据字段,填写联系人,应用场景,前置库信息等。6.4.2.2.批量数据审核数据资源管理单位对于需求单位提交的批量数据申请,进行在线的审核,保障数据共享流程的规范性,若共享的数据为共享数据,数据资源管理部门审核后,通过配置目标库和共享频率,实现数据的批量交换。6.4.2.3.受限共享数据针对共享属性为受限共享的数据,在通过数据资源管理部门的审核后还要通过数源单位的审核,经数源单位审核同意后方可进行数据的批量共享。针对无信息系统支撑的单位,提供在线的数据查询服务,数据需求单位,可以通过在线查询模块,查询本单位已获取数据共享权限的数据资源,实现数据资源的在线查询服务。6.5.搭建数据资源管理开放门户面向各部门各系统,提供数据资源在线管理、维护和服务的统一工作门户,针对各类用户提供数据目录的管理、信息系统接入管理、数据服务资源在线申请和管理等服务功能,帮助用户实现数据服务资源的一站式申请和管理,从而简化用户的数据管理工作,持续满足政务服务信息化应用需求。6.5.1,数据资源管理提供和整合数据资源目录管理、数据服务接口管理、批量数据管理、信息系统基础信息管理等数据管理功能,为数据管理者提供统一的管理平台。6.5.2.统一数据服务数据需求单位可以通过平台查看数据资源目录、获取批量交换数据、申请数据接口服务、申请页面查询服务等数据服务内容,为数据使用者提供一站式的数据服务获取途径。6.5.3.组件超市建立公共组件超市,集成县内现有智能组件以及省市组件目录共享的公共应用支撑组件。县内新建系统开发过程中可以充分利用组件超市中的公共应用支撑组件,提高组件利用率,降低开发成本。6.5.4,数据接入管理针对第三方的接入应用及接入服务,进行统一管理,实现第三方系统的接入管理,所有业务系统需在平台进行注册,注册成功之后提供统一的数据访问机制。6.6.搭建数据仓及专题库依托省市公共数据平台,通过数据高铁和数据交换模式,充分承接省市回流基础数据,结合本地归集的基础数据,搭建形成及各个乡镇数据仓。面向特色应用场景,搭建专题数据库,支撑应用场景建设。6.6.1,搭建数据仓及专题库模型按照数据仓四层结构,搭建数据仓和专题库,实现数据资源从原始数据层到应用层的搭建。6.6.1.1.原始数据层搭建搭建原始数据层,用来存放原始数据,直接加载抽取原始的数据,数据保持原貌不做处理。原始数据层作为一个临时缓冲区,屏蔽对业务系统的干扰,其表结构和数据定义一般与业务系统保持一致。原始层的数据可以每次全量接入也可以每次增量接入,根据业务实际建立数据老化的机制,其数据不会对外部开放。6.6.1.2.明细层搭建搭建明细数据层,提供数据清洗服务,在数据结构和粒度与原始数据层保持一致,同时对原始数据进行清洗,比如去除空值、脏数据、超过极限范围的数据、非法数据等等,实现原始数据的清洗过滤,保障数据质量。6.6.1.3.服务层搭建搭建服务数据层,以明细层为基础,根据数据业务规则对数据进行合成。服务层主要提供查询服务,需要查询能够及时响应,其数据具备唯一性、权威性、准确性的特点,数据只允许增加不允许删除和修改。在这一层通常会以某一个维度为线索,比如以人的信息为例,有三张原始表A、B、C以id相关联,我们需要通过这三张表组成人的基础信息,如:id,姓名,年龄,性别;而A、B、C表中分别拥有人的姓名、年龄、性别,我们就需要从三种表中抽取数据结合形成服务数据层基础信息表,在一般的业务场景中,我们可能以天为维度,例如统计一个人的当日签到数、收藏数、评论数、抽奖数,这样聚合形成的一张新表。6.6.1.4.应用层搭建搭建数据应用层,面向实际的数据需求,以服务层或者明细层的数据为基础,通过大数据分析和计算,实现各类应用场景分析计算数据计算结果的汇集,同时组成各种数据分析统计的报表。6.6.2.搭建县级数据仓通过承接获取省市下放的数据资源,结合归集的县级自建系统的数据资源,通过数据的清洗、汇聚、分析后形成区县级的数据仓。6.6.3.搭建乡镇数据仓将县级数据仓按照属地乡镇进行切分,建成各乡镇数据仓,为基层乡镇提供数据资源共享服务。6.6.4.特色专题库建设充分利用市公共数据平台支撑能力和相关智能组件,结合省市公共数据平台数据资源和我县各业务部门自有数据,完成生态环保专题库、“两山银行”专题库、智慧文旅专题库、大下姜专题库等数据整合和专题库建设工作,所需的数据资源均通过平台实现统一归集。平台缺少的数据,可通过省市目录系统,提交数据需求清单,实现数据应归尽归。业务部门应对专题库数据资源进行分类分级管理,所有数据资源应纳入本县公共数据目录体系,按照公共数据编目范围、统一目录编制规范和元数据规范,做到一数一源、同步更新。6. 7.构建安全体系通过搭建整体安全体系,满足基础等保2.0三级的网络安全标准,确保数据在采集、传输、存储、处理、共享交换等各个环节的数据安全性。分别从网络基础安全、数据内控安全、数据开放安全、数据共享安全、等保测评、网络安全服务六个维度,建立常态化数据安全体制机制。6. 7.1,网络基础安全7. 7.1.1.云web应用防火墙(WAF)通过对所有Web流量进行深度检测,防御SQL注入,跨站脚本等应用攻击,对WEB站点的实时防护。8. 7.1.2.云堡垒机系统通过双因子认证来弥补网络中各系统的单一登陆方式,实现统一实名帐户管理与单点登录等。9. 7.1.3.云综合日志审计系统通过全面收集网络设备、安全设备、主机、应用及数据库的日志信息,帮助单位建立信息资产的综合性管理平台。10. .1.4.终端防恶意代码系统终端安全防护,支持大病毒文件的扫描,实时病毒连接阻断,病毒事件记录。11. 7.2.数据内控安全12. 7.2.1.敏感数据发现通过敏感数据发现功能,对政务数据进行一键式敏感数据扫描分析,将扫描分析到的敏感资产按照政务数据敏感等级进行进行快速的分级分类,达到保护资产的快速梳理,对于已发现的敏感资产进行自动整理,将敏感信息快速分级分类,同步到敏感数据安全防护资产集合。13. 7.2.2.数据访问身份鉴别数据安全平台部署在大数据局的数据资源池前面,起到防护核心数据库作用,提供用户身份鉴别处理机制,运维人员、开发人员、运维工具、开发工具、业务程序等访问数据资源库的过程中,必须经过失败鉴别处理和多维度身份认证处理。6.7.2.3.数据库访问控制在对数据资源库进行敏感数据发现、数据分级分类后,根据数据安全平台的身份鉴别功能允许合法的用户或者身份接入数据资源库后,需要对数据资源库具体操作过程进行访问控制管理,主要从特权账号权限访问控制、行数返回控制、访问频次控制、高危操作控制等方面入手,全方位保障访问控制体系的安全性。6.7.2.4.危险操作规范除了访问过程中的权限控制以外,还有一部分的危险性操作如DropTable,TruncateTable等操作是数据库面临的巨大安全风险。数据安全平台充分考虑实际应用的灵活性,支持当运维人员必须进行某些危险性操作或者需要访问敏感数据时,可提交临时授权工单,由安全管理员进行逐级审批后方可进行操作。合法的用户在合法的操作过程中,不可避免会产生误操作行为,数据安全平台支持对误删除的表格数据进行恢复,用户一旦发生误操作行为,安全管理员可在管理端页面进行语句追踪,找回误删除的数据。6.7.2.5.数据管理工单日常运维中经常会出现未授权访问,或临时需要访问,为保证除授权账户以外,其他操作可临时授权访问,数据安全平台提供工作流功能,未授权用户操作数据库前,需要通过工作流提交工单,将需要进行的操作一并提交,审批获得权限即可进行后续操作。6.7.2.6.终端加密软件基于PKl体系,透明的、强制的、自动的加密文件。使这些文件,在特定的环境下才可以使用。如组织机构内部(私自带离办公环境无法打开),部门内部(私自拿到其他部门或组织外部无法打开)。同时可以设定这些文件的使用权限,包括限定终端、访问次数、时间、只读、禁止打印等,阻止文件的二次传播或被恶意盗用。终端加密软件在授权管理方面采用数字证书的方式可为不同的组织机构、部门、角色灵活授权,支持配置自动加解密服务器,将指定格式文档上传至服务器时自动完成加密或者解密操作。6.7.3.数据开放安全6.7.3.1.敏感数据分级分类对于归集的政务数据,从数据安全和运维安全角度来讲真正需要进行安全防护的数据属于其中l%10%左右的敏感数据,因此在实施安全防护手段之前必须把敏感数据从普通业务数据中脱离出来进行独立管理,敏感数据分类是数据和运维安全的基础性工作。因此利用敏感数据发现分析出敏感数据后,再按照政务数据类型进行敏感数据分级分类,从敏感数据分类出发,选择敏感表格组成敏感数据集合,在保障安全的基础之上实现方便管理。6.7.3.2.数据库审计按照等保2.O和网络安全法的要求,数据库审计作为数据库所有访问操作的日志记录载体,提