雄安新区数据资源目录设计规范.docx
雄安新区数据资源目录设计规范一、概述278()目的278(二)适用范围278(三)规范性引用文件278(四)术语定义279二、数据资源目录280(一)数据资源目录分类280(二)数据资源目录编码281(三)数据资源目录管理283三、元数据要求287()业务元数据要求287(二)技术元数据要求289(三)管理元数据要求292一、概述(一)目的河北雄安新区规划纲要明确提出要“建立健全大数据资产管理体系,打造具有深度学习能力、全球领先的数字城市”。为推动新区构建多层级的数据资源管理体系,探索数据共享授权机制,实现政务数据、位置数据和城市生产、生活、运行数据的底层融合和授权共享使用,制定本导则。(一)适用范围本数据目录通用要求规定了数据资源目录的分类、管理模式、运行模式和总体框架,以及目录建设的元数据要求、功能要求、技术要求和安全要求,适用于雄安新区全区范围内数据资源目录建设的行为及过程。(三)规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注H期的引用文件,仅注H期的版本适用于本文件。凡是不注H期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T21063.12007政务信息资源目录体系第1部分:总体框架GB/T21063.22007政务信息资源目录体系第2部分:技术要求GB/T21063.32007政务信息资源目录体系第3部分:核心元数据GB/T21063.42007政务信息资源目录体系第4部分:政务信息资源分类GB/T21063.62007政务信息资源目录体系第6部分:技术管理要求政务信息资源共享管理暂行办法政务信息系统整合共享实施方案政务信息资源目录编制指南(试行)加快推进落实政务信息系统整合共享实施方案工作方案河北省政务信息资源目录编制指南(试行)(四)术语定义GB/T21063.12007界定的以及下列术语和定义适用了本文件。数据资源:以一定形式记录、保存的文件、资料、图表和数据等各类数据的集合。元数据:描述数据资源属性的数据飞业务元数据:从业务角度描述数据资源各种属性的数据。技术元数据:从技术角度描述数据资源各种属性的数据。管理元数据:从管理协调角度描述数据资源各种属性的数据。数据资源目录:以元数据形式记录、按照一定的分类方法进行排序和编码的一组数据,用以描述各个数据资源的特征,以便于对数据资源的检索、定位与获取。共享库:用于共享和开放数据资源的数据库。标签:用于揭示数据资源内容和特征的标志体。数据挂接:将数据资源与数据资源目录对接的过程。任务调度:将数据使用方的数据获取需求转化为数据交换或数据治理能够识别的数据内容。二、数据资源目录(一)数据资源目录分类1.资源属性分类按资源属性不同,数据资源目录分为部门目录、主题目录、基础目录。(1)部门目录按照资源目录标准,根据资源提供方职能职责梳理形成的资源目录。(2)主题目录是针对某个特定对象或某一业务领域而专门梳理形成的资源目录,如精准扶贫资源目录等。(3)基础目录基础目录是广泛应用的国家基础政务数据,具有基础性、基准性、标识性等特征,主要包括人口基础目录、法人基础目录、空间地理基础目录等。2 .功能分类按流程环节中功能不同,数据资源目录可分为业务目录、数据目录和管理目录。(1)业务目录以资源提供方履行职责过程中的应用视角梳理形成的数据资源目录。(2)数据目录根据业务目录建设共享数据库,并对该共享数据库依据元数据标准进行描述而形成的数据资源目录。(3)管理目录依据数据共享要求形成数据服务调度任务,提供具体数据服务的数据资源目录。3 .层级属性分类按目录所属的层级属性可划分为三类:(1)上级目录指河北省面向全省或者雄安新区提供的数据资源目录。(2)本级目录指雄安新区独立建设的数据资源目录。(3)下级目录指雄安新区下辖行政区划建设的数据资源目录。(二)数据资源目录编码数据资源标识符由前段码(6位数字)、中段码(10位数字和字母)和后段码(5位数字)三部分组成,中段码和后段码之间用字符“广隔开,其形式如图1所示。后段宿分隔符中段码图I数据资源标识符构成前用码1.前段码按照政务信息资源目录编制指南(试行)(发改高技(2017)1272号)中关于政务信息资源代码结构规则的要求,隶属于河北省的政务信息资源的前段码统为330003。雄安新区数据资源的前段码可参照设置,以确保与国家政务信息资源目录的对接。2 .中段码中段码由行政区划代码(6位数字)、部门类别码(1位字母)和部门编码(3位数字)组成。其中,雄安新区行政区划代码为139900,部门类别参考表1(其中A-K对照河北省政府资源目录部门类别),部门编码中参考政府部门代码和企业登记号设置。表1部门类别码表序号部门类别码部门类别名称1A党委2B人大3C政府4D政协5E民主党派6F群众团体7G法院8Ii检察院9J中央驻地单位10K其他政务部门I1.1.公共事业单位12M企业3 .后段码后段码,即数据资源顺序码,是数据资源标识符中对单位所管理或拥有的数据资源进行的唯一标识。后段码共5位,由阿拉伯数字(0-9)组合而成。(三)数据资源目录管理1.参与方数据资源目录全生命周期主要涉及提供方、使用方、运营方和监管方4类参与方。(1)提供方一负责对资源进行目录编制、注册、更新。建立并维护共享信息库。审批数据服务申请。(2)使用方在协议范围内对数据进行使用,并保证数据不扩散泄露。(3)运营方与上级平台级联。对提供方提交的目录进行审核、发布。-审批数据服务申请。一核查目录更新、数据更新。调度服务任务。(4)监管方一查看平台的目录、共享开放等各事项指标结果。2.本级目录本级目录管理与服务流程如图2所示。授供方技术人员运Ir方业务人员提供方业务人员使用评估发布f1.*统计拉接奉仪由触-fU最发布任务调Jr森的。谪*履京人员使用方图2本级目录管理与服务整体流程(1)参与角色本级目录管理与服务整体流程涉及4类参与方的6种角色,具体如下:1)提供方一提供方业务人员提供方技术人员2)运营方运营方业务人员一运营方技术人员一使用方一监管方(2)主要活动本级目录管理与服务整体流程涉及3个环节8项活动,具体描述如下:1)数据准备一编目:数据资源提供方业务人员,以业务视角对资源进行梳理,通过编目工具或编目系统形成业务目录内容:资源提供方技术人员,依据业务目录建立对应的共享信息库,并提取技术特征形成技术目录。注册/维护:数据资源提供方业务人员将目录内容注册至目录链节点,维护共享库数据及目录内容。数据挂接:数据资源提供方技术人员将共享信息库与对应的资源目录进行挂接。一审核:运营方业务人员对注册的资源目录内容进行审核,审核通过可进行发布上架;平分技术人员对数据挂接的技术信息进行审核,审核通过后与资源目录一并待发布上架:发布上架的目录内容变更,需经过审核后重新发布上架。2)数据使用发布:运营方审核通过的资源目录进行发布上架。一服务:使用方通过浏览器等客户端查询目录内容,提交数据获取中请。一任务调度:数据获取申请审批通过后,由平台技术人员调度交换或治理任务,使用方通过任务获取实时或定时的数据服务。3)数据评估统计:对流程中各环节从不同维度定制统计报表,监管方用于数据共享监督考核。3 .上级目录本级目录需与上级目录级联,以获取上级平台数据资源。(1)参与角色上级目录管理与服务流程涉及3类参与方的4种角色,具体如下:I)运营方一运营方业务人员运营方技术人员2)使用方3)监管方(2)主要活动本级目录管理与服务整体流程3个环节7项活动,具体描述如下:1)数据准备一编目:平台技术人员通过级联系统获取资源目录,并通过编目系统提取数据资源的技术特征,形成技术目录,并依据上级平台已经发布的目录编制形成本级业务目录。一注册/维护:平台技术人员将目录内容注册至目录链节点,依据上级平台目录内容的变化维护本级目录内容。一审核:运营方业务人员对注册的资源目录内容进行审核,审核通过可进行发布上架。2)数据使用一发布:运营方审核通过的资源目录进行发布上架。一服务:使用方通过浏览器等客户端查询目录内容,提交数据获取申请。任务调度:数据获取申请审批通过后,由平台技术人员调度交换或治理任务,使用方通过任务获取实时或定时的数据服务。3)数据评估统计:对流程中各环节从不同维度定制统计报表,监管方用于数据共享监督考核。4 .下级目录雄安新区下级目录主要涉及下辖区县,考虑到区县目录可直接放在雄安新区目录下,无需专门建设目录平台,因此下级目录管理与服务流程与本级目录相同。三、元数据要求(一)业务元数据要求业务元数据应包括以下元数据:1 .数据资源名称(数据资源内容的标题名称)2 .内容摘要(对资源内容进行概要说明的文字)3 .注册H期(提供方注册数据费源的H期)4 .提供方一提供方部门/单位:资源提供方部门/单位全称,不可使用简称。提供方部门/单位联系人:资源提供方部门/单位联系人姓名。一提供方部门/单位联系人电话:资源提供方部门/单位联系人电话。5 .提供方代码(资源提供方部门/单位代码)6 .资源标识符(数据资源唯一不变的标识编码)7 .资源技术支持一资源技术支持部门/单位:资源技术支持部门/单位名称。资源技术支持联系人:资源技术支持联系人姓名。一资源技术支持联系人电话:资源技术支持联系人电话。8 .资源分类分类方式:资源所采用的分类方式。一分类类目:分类方式中的类目名称。9,共享类型(数据资源共享类型包括无条件共享、有条件共享和不予共享三类)。10.开放类型(数据资源开放类型包括无条件开放、有条件开放和不予开放三类)。I1.数据项-数据项名称(数据资源中具体数据项的标题)。一数据项共享类型(数据资源中数据项共享类型包括无条件共享、有条件共享和不予共享三类)。数据项开放类型(数据资源中数据项共享类型包括无条件开放、有条件开放和不予开放三类)。12 .共享方式:数据采用的共享方式,包括数据交换、接口服务、文件下载。13 .数据更新周期(实时、每天、每周、每月、每季度、每半年、每年)。14 .标签(用于标识资源内容的通用词、形式化词或短语)。(一)技术元数据要求技术元数据应包括以下元数据:1 .技术资源名称(技术资源内容的名称,可以是系统名称、表名称、文件名称、文件夹名称,也可以根据资源内容提取)。2 .数据格式类型(资源数据的格式分类,包括数据库、电子文件、电子表格、数据接口、图形图像、视频媒体、自描述格式)。数据库.数据库类型:可用于共享的数据库类型。.数据库地址:可用于共享的数据库地址。.数据库用户名:可用于共享的数据库用户名。.数据库密码:可用于共享的数据库密码。.表中文名称:可用于共享的数据库表中文名称。.表英文名称:可用于共享的数据库表英文名称。.字段中文名称:可用于共享的数据库字段中文名称。.字段英文名称:可用于共享的数据库字段英文名称。.字段类型:可用于共享的数据库字段类型。.字段长度:可用于共享的数据库字段长度。电子文件.文件名称:电子文件名称(资源为一个文件使用此项元数据)。.文件夹名称:文件夹名称(资源包括多个文件使用此项元数据,统一存放在指定文件夹中)。.文件格式:电子文件存储格式,如doc、docx、pdfhtm1.>WPs、txt、ppt等格式。.存储地址:电子文件存储地址。电子表格.文件名称:电子文件名称。.文件夹名称:文件夹名称(资源包括多个文件使用此项元数据,统一存放在指定文件夹中)。.文件格式:电子表格存储格式,如x1.s、x1.sx、csv、e等格式。.存储地址:电子文件存储地址。一数据接口.接口名称:数据接口中文描述。.接口类型:数据接口类型,包括rest、soapo.接口地址:数据接口服务地址。.服务编码:接口服务编码,如UTF-8、GBK等。.接口参数:数据接口服务参数信息。参数名称:接口调用时所需参数名称。参数注释:接口调用时所需参数注释或描述。请求位置:接口调用时参数的请求位置,defau1.t.headero参数类型:接口调用时参数的类型,siring、number、boo1.ean。是否必须:接口调用时参数是否必须项。.接口返回值:数据接口服务返回值信息。返回数据名称:接口调用返回数据中单项名称。返回数据注释:接口调用返回数据中单项注释或描述。返回数据类型:接口调用返回数据中单项数据类型。.接口使用说明:接口使用手册地址或描述说明。图形图像.文件名称:图形图像文件名称(资源为个文件使用此项元数据)。.文件夹名称:文件夹名称(资源包括多个文件使用此项元数据,统一存放在指定文件夹中)。.文件格式:图形图像文件的格式。.存储地址:电子文件存储地址。视频媒体.文件名称:视频文件名称(资源为一个文件使用此项元数据)。.文件夹名称:文件夹名称(资源包括多个文件使用此项元数据,统一存放在指定文件夹中)。.文件格式:视频文件的格式。.存储地址:电子文件存储地址。(三)管理元数据要求管理元数据应包括以下元数据:1 .审核日期(资源审核通过的日期)2 .发布日期(资源发布上线的日期)3 .更新日期(资源发生变更的日期)4 .目录版本(目录的版本号)5 .使用方资源使用方部门/单位:资源使用方部门/单位全称,不可使用简称。一资源使用方部门/单位联系人:资源使用方部门/单位联系人姓名。-资源使用方部门/单位联系人电话:资源使用方部门/单位联系人电话。附录(资料性附录)核心元数据描述表元数据说明1.数据资源名称定义r堀略描述数据资源内容的标题,数据类型:字符型.注解:必选项:破大出现次数为1.说明:缩略描述对应数据里源具体内容的标题.2.内容摘要定义:对数据费源内容(或关键字段的裁要描述.数据类型I字符型.注解:必选项;城大出现次数为I.说明:对数据资源内容进行摄耍说明(或关悔字段的描述。3一注册日期定义;提供方注册数据货源的H期,数据类型:日期型,格式为CCYY-MM-DD.注解;必选项:Ai大出现次数为1.说明:按定义要求迸行描述.4.提供方定义r提供数据货源的政务部门。数据类型:字符型,注解:必选项:破大出现次数为I.说明:具体提供信息资源的部门和单位,原则上中央政务部门细化到司局或所国行政事业以位,地方坟务部门细化到内设机构和所辖政务部门,企业细化的H小法人实体.5.资源标识符定义:数据资源的唯一不变的标识代码.数抠类型:字符型.注解;必选项;最大出现次数为1,6.共享类型定义:数擀资源的共享类型包括:无条件共享、有条件共享、不予共享三类.值域范困对应共享类型排序分别为1、2、3.数据类型I数值型.注解:必选项:破大出现次数为1.说明;对知个数据资源按不同共享类长进行描述,7.开放类型定义:数抠资源而向社会开放的屈性,包括“足”和“否对应取值分别为1和OO数据类型I数值型.注解:必选项;Ift大出现次数为1.说明:按定义耍求进行描述.元数据说明8.提供方代码定义:提供数抠资源的部门和侬位代码.数据类型I字符型.注解;必选项:最大出现次数为1.说明:政务部门代码采用国务院关于批转发展改革委等部门法人和其他组织统一社会侑用代码制度建设总体方案的通知3中双定的法人和其他组织统一社会信用代码.提供方代码采用资卸分类“项”中的政务部门代码.而非部门内设机构和直属版位代码.企业单位代码采用全国扭织机构统一社会信用代码.9.数据格式类型定义:数据晓源的存在方式(可多选,包括数据库、电子文件、电子表格、数据接】、图形图像、视频媒体、自描述格式等多种类型.数抠类型:字符型.注解:必选项:金大出现次数为1,说明:按定义的多种格式选择确定.10.数据项名称定义:描述结构化信息资诃中具体数据项的标题.适用于格式为数据库.电子我格类等的信息资源.数据类型:字符型,注解:可选项:最大出现次数为1.说明:描述电子表格、数据库,以及具有结构化数据内容资源中的各数据项(字段标题,采用中文衣示.11.共享方式定义:不同共享类型的政务信息资源的共享条件.数据类型I字符型.注解:必选项:足大出现次数为1.说明:无条件共享类和村条件共享类的政务信息资源,应标明使用要求,包括作为行政依据、1:作参考用于数抠校核、业务协同等:右条件共享类的政务信息费源,还应注明共享条件和共享范出:对于不予共享类的政务信息费源,应注明相关的法律、行政法规或党中央、国务院政策依据,