智慧民生健康管理系统项目采购需求.docx
智慧民生健康管理系统项目采购需求一、项目概况采购主要工作和内容:序号项目名称项目内容功能说明1区域健康数据中心数据采集采用ETL技术,采集全民健康信息管理平台等数据来源的数据。2统一编码建设编码系统(COdeSyStenI)进行编码管理和发布应用,通过ICDl0、SNOMEDCT和LOINC,对医学诊断、医学概念(术语)和临床检验进行标准化描述,对卫生健康相关编码的应用统一编码标准。3数据管理通过主索引管理、数据同步管理、数据开发管理、数据质量管理功能,实现区域健康数据中心的数据统一管理。4主数据建设实现系统间共享数据的统一构建,保证系统的参照完整性。5健康数据集市建立数据集市,统一数据交换标准,对医疗数据、体检数据和健康行为数据进行标准化整合,基于面向健康医疗行业的互操作性标准,对医疗资源、行为、数据、流程进行描述。采用ICDl0、SNOMEDCT和LOINC编码系统分别对临床诊断、症状体征描述和检验结果进行标准化。6专题主题库建立覆盖居民、疾病、医疗服务、公共卫生服务、专病管理、高危管理的主题库。对相关数据的粒度和维度进行专题管理。7数据共享数据共享服务提供对平台数据资源的自定义快速接口封装流程与共享服务目录管理、审核、监控等全流程贯穿。8区域智能健康对个人全生命周期的基础信息、健康体检信息、健康行健康管理系统画像为信息、健康干预信息和诊疗信息,进行标准化健康资源模型存储和分析,输出个人全生命周期时序图和健康画像等多维度健康风险信息和健康干预总览,以及按系统、层次展现个人健康信息。9管理工作台根据不同的角色,提供任务快速一览。10智慧健康管理基于健康管理模型功能,提供知情同意、分级分类入组、健康监测、危急值管理、智能预警、个人健康报告等功能,便于医护人员及健康运营人员更方便关注居民健康。11智慧健康干预根据个人全生命周期健康档案,结合问卷调查、互动信息,持续了解居民的健康行为方式,制定个性化和区域化健康干预方案,对居民与群体健康干预效果进行追踪分析。12个人健康服务系统注册用户通过区智慧惠民服务统一门户,查询自身健康档案和健康建议。根据自身需求填写自测问卷,问卷填写内容自动保存到相应健康档案中。支持在线体检报告解读和健康咨询,支持体检机构及体检项目智能推荐。13健康宣教系统通过区智慧惠民服务统一门户,采用大众喜闻乐见的图文和短视频方式,根据人群特点分类准确投放。及时收集传播效果和反馈信息,不断提升健康宣教效果。14人工智能辅助系统AI处理服务采用NLP技术,对体检报告内容通过关键词识别,抽取相关指标信息,并利用SNOMEDCT编码系统进行映射和标准化存储,形成主体与属性的集合,提供标准化精准分析。15多发疾病风险预测模型基于区域健康数据中心,居民历年的生活习惯、疾病史、体检报告等信息,构建多重疾病风险预测模型,得出多疾病风险预测结果,在早期识别潜在患病人群,个体化的健康干预措施,可有效地为患病高风险人群进行早期监测、指导。16智慧健康管理模型利用人群分类、分层模型,以及居民健康指数模型、健康预警模型辅助健康管理,帮助快速定位健康异常的居民。同时利用健康趋势分析模型,分析居民的健康变化情况。17健康知识库提供与居民健康相关的疾病知识、药品知识、检验知识、检查知识内容,供全系统使用。18业务引擎可独立与应用系统之外的规则编制、规则匹配判断和结果输出。19问卷引擎采用权威的评估问卷,包括生活方式、心理、疾病风险等问卷,有效采集个人的健康行为数据,为健康干预方案制定提供依据,支持问卷的编辑、审核、发布,支持前后问题的相关逻辑判断,支持自动计分和结果判断,根据问卷填写内容输出相应建议。20流程引擎可视化流程订制和表单订制。21区域健康大数据分析系统大数据分析模型设计处理大规模数据的数学模型,通过数据挖掘和分析技术,找出数据中的规律、趋势和模式。利用多类分析模型,便于进一步分析挖掘转化,分析模型设计包括回归分析模型、聚类分析模型、分类器模型、关联分析模型、神经网络模型以及时间序列模型。22大数据可视化应用开发提供图形报表、报表下载、应用开发、多图形展示等功能,更好展示大数据分析结果。23个人健康大数据分析通过构建关键指征数据模型、个人各期检查结果分析、健康档案管理分析、健康画像管理等分析维度,从全视角掌握居民的健康情况。24群体健康大数据分析从群体健康画像、疾病管理群体画像、群体数据分析报告等维度,掌握各类群体的健康情况。25科研队列基于区域健康数据中心,面向科研人员提供大数据科研分析队列检索功能、科研数据管理功能、科研数据分析功能。26区域健康大数据地图根据健康分析结果建立全区健康地图,及时全面展现区内人群健康状况,包括生理、心理和社会适应等状况,以及健康干预的落实情况和效果反馈,辅助区内健康管理策略制定。27平台基础管理系统身份信息安全管理对居民身份信息进行脱敏处理。28应用安全管理通过登录认证、机构管理、机构人员管理、个人用户注册、系统管理等方式,进行访问权限控制,实现应用安全管理。29消息平台在各系统和应用间进行信息交流。30数据治理服务数据资源目录服务梳理各业务条线相关业务系统,按业务事项涉及的卫生健康信息资源进行调查和整理,编制数据资源目录清单。31数据归一化从多个异构数据源整合数据时,存在定义不同,数据不一致问题。为了提高数据挖掘的准确性,需要对抽取的数据进行归一化,消除数据不一致的问题。32数据映射给定两个数据模型,在模型之间建立起数据元素的对应关系。在完成数据映射之后,将数据从原有的数据模型加载到全新的数据模型的过程。33数据结构化通过文本提取技术与文本结构化技术,为健康管理业务从非结构化医疗文本数据中提取结构化数据,将以自然语言方式录入的医疗数据根据医学语境转化为可用于存储、查询、统计、分析和挖掘的数据结构。34数据标签化数据标签化包括数据来源加工、标签分类、标签权限设定、标签使用功能,并支持将标签作为人工智能建模的变量,大大减少建模时间。35数据核查服务根据预先配置的规则、算法和质量检查度量,对数据的准确性、合理性等开展多角度的检查,及时发现问题,解决问题。对于稽核结果,进行统计分析,形成结果报告。36数据支持服务根据各业务需求部门提出的数据使用申请,提供问题咨询、技术上实施的可行性评估、工单任务进度跟踪等的服务支撑工作37常态化运营服务从数据管理视角,围绕业务部门应用需求驱动、数据共享业务流程优化、数据共享合规审核相关的各个方面,构建业务运营管理机制和管理体系,形成常态化运营管理服务。38信息化基础设施建设人工智能与大数据分析算力单元1台:CPU:16核、内存:128G、硬盘:500GB>GPU:2块32G卡二、项目背景中国共产党第二十次全国代表大会报告提出,推进健康中国建设,把保障人民生命健康放在优先发展的战略位置。国家以健康促进和健康管理为手段,提升全民健康素质、降低高危人群发病风险、提高患者生存质量,减少可预防的慢性病发病、死亡和残疾,实现由以治病为中心向以健康为中心转变。XX省卫生健康事业发展“十四五”规划提出,建立“推动将健康融入所有政策”的促进体系。大力宣传“将健康融入所有政策”理念的目的意义,推动社会形成“健康优先”的发展理念,协调推进健康与经济社会同步发展,自觉坚持健康规划前置、健康政策统筹、健康信息共享、健康发展优先。建立健康融入所有政策工作机制,实行政府主导、部门协作、社会参与的工作模式,明确党委、政府“将健康融入所有政策”的主体责任,落实相关职能部门健康维护和促进职责,构建“将健康融入所有政策”工作网络,把全生命周期健康管理理念贯穿城市规划、建设、管理全过程各环节。XX省医疗卫生服务体系“十四五”规划提出,优化全方位全周期健康服务体系。围绕生命全周期和健康全过程服务,以“一老一小”为重点,加快完善妇幼健康、普惠托育、老年健康服务体系,突出职业健康、心理健康和精神卫生、健康教育等薄弱领域,加快补齐全方位全周期健康服务体系短板。健康XX行动(2020-2030年)提出,专注以“健康”为中心。聚焦每个人关心、关注的生活行为方式、生产生活环境和卫生健康服务问题,针对每个人在不同生命周期所面临的突出健康问题,系统提出防控策略。在新时代“大卫生、大健康”格局下,XX区全面推进“共建共享、全民健康”健康中国战略。随科技不断进步,居民的工作、生活节奏越来越快,工作和生活的压力也越来越大,尤其是公职人员、企业管理人员、专业人才等重点群体,健康状况面临重大挑战。近些年来,XX区委区政府不断探索“多元化”的健康管理模式,并逐步形成“未病早预防、小病就近看、大病专家治、慢病有管理、转诊帮对接”的健康管理体系,努力为辖区群众提供高质量的卫生健康服务,持续满足群众多样化的健康需求,增进人民健康福祉,让群众在机构改革中获得实实在在的获得感。三、建设目标通过全民健康信息管理平台对全区医疗机构健康相关数据进行整合,经平台交换技术,进一步对医疗健康业务相关术语进行标准化,以个人为中心建立全生命周期的标准化并面向应用的可视化健康画像。同时,利用智慧民生健康管理系统的健康大数据和人工智能工具,及时跟踪判别个人和团体的健康动态和风险趋势,有针对性地制定健康干预方案,并通过互联网技术加以实施和反馈,提高居民自我健康识别和管理能力,实现个人和人群的精准健康管理,促进全民健康素养的提高,降低医疗费用开资,助力以诊疗为中心向健康为中心转变。四、标准规范项目遵循的标准规范:(1) GB/T8567计算机软件文档编制规范;(2) GB/T9385计算机软件需求规格说明规范(3) GB/T9386计算机软件测试文档编制规范(4) GB/T15532计算机软件测试规范(5) GB/T28035软件系统验收规范(6) SJ/T10367计算机过程控制软件开发规程(7) SJ20822信息技术软件维护(8) GB/T36344-2018信息技术数据质量评价指标(9) WS/T448-2014基于居民健康档窠的区域卫生信息平台技术规范(10) GB/T40423-2021健康信息学健康体检基本内容与格式规范(11) GB50174-2017数据中心设计规范(12) WS/T502-2016电子健康档案与区域卫生信息平台标准符合性测试规范(13) WS/T483.1-2016健康档案共享文档规范第1部分:个人基本健康信息登记(14) WS/T3702022卫生健康信息基本数据集编制标准(15) WS365-2011城乡居民健康档案基本数据集(16) )其他计算机软件相关标准(17) XX市政务信息化项目验收管理细则(穗政数(2023)20号)五、技术实现方法和路线(一)系统开发环境:服务器及存储等云资源(现有)、国产操作系统、国产中间件、国产数据库、人工智能与大数据分析算力单元;(二)采用国产化数据库、中间件等满足国产化要求进行软件开发和实施;(三)系统结构:B/S;(四)系统部署环境要求本项目采用国产化技术,系统规划部署在国产化环境,对国产化环境做好适配工作,包括CPU、数据库、中间件、操作系统等,从而确保系统功能能完整正常使用,安全可靠计算机和浏览器能正常访问和使用系统。(1)适配主流国产芯片服务器环境,集成兼容各服务器环境下的文件转换服务。(2)适配国产化数据库结构初始化。(3)实现各类国产化中间件的适配工作。六、系统功能要求(一)区域健康数据中心X.数据采集投标人承诺与XX区全民健康信息平台、XX区医疗云平台,或与采购人约定的其他数据来源进行数据采集和交换,获取项目所需健康数据,并配合区大数据治理平台、X好办开展数据交换工作。并根据项目建设内容及XX区数据情况提出需交换的数据信息(提供承诺函)。 本项目通过XX区全民健康信息平台、XX区医疗云平台进行数据交换,获取项目所需的数据。 与区大数据治理平台开展交换工作:按照全区统一的标准和规范编制项目采集、产生的公共数据目录,交换到XX区大数据治理平台。 与X好办对接工作:根据要求系统对接与X好办,满足对接要求。采购人将协助对以上相关系统数据交换的协调工作,中标单位负责技术对接和实现功能,涉及的数据交换所需的全部费用已经包括在本项目总体内,费用由中标人承担。(2)数据抽取支持4种及以上交换方式,包括但不限于数据库接口抽取、系统服务接口抽取、FTP文件抽取、实时数据接口抽取等数据抽取方式。投标人提供以上功能的完整截图。 适配各种数据源,通过统一的数据集成能力进行数据采集,支持数据库接入、系统服务接口、文件导入等接入方式,支持结构化数据、非结构化数据的混合结构数据接入,同时提供实时数据接口采集方式满足数据中心关键数据应具备实时性的需求,在对业务数据库不产生任何影响的情况下,数据实时同步入数据中心。 数据库接口抽取:采取基于快照法,基于触发器法、基于日志法、基于影子表法、基于时间戳法,区域健康数据中心支持定时读取相关的主流数据库采集,把新增数据通过数据库接口方式写入前置交换库。可根据实际建设的安全保障需要等,避免采集过程中,数据库压力抬升,造成计算和网络拥堵,提供从速率、批次、等待时间、超时时间等维度上的配置化,通过灵活调配做到低损耗,甚至O损害的数据高效采集能力。 系统服务接口的数据抽取:系统服务接口数据采集方法通过直接调用数据提供方提供的Web服务或API接口执行相关业务逻辑;即在大部分应用程序和数据库之间引入一类中间件,提供一系列API,这些中间件在完成应用程序对数据库修改的同时,也把复制对象的变化序列记录下来,从而达到捕获的目的。它不需要改变现有的数据库,也不依赖具体的数据库。系统服务接口的数据抽取支持基于快照法、基于触发器法、基于日志法、基于APl法方式。 FTP文件抽取:数据提供方将数据按照要求的格式(如:EXCEL.TXT、CSV等)离线汇总到中区域健康数据中心,提供支持的文件格式接入包括文本文件输入、CSV文件输入、固定宽度、非结构化数据。 实时数据接口抽取:区域健康数据中心关键数据具备实时性,在对业务数据库不产生任何影响的情况下,数据进行实时同步。区域健康数据中心对关键数据提供实时数据接口采集,在实时数据接入引擎提供流式数据的接入,将各类关系型、非关系型的分布式数据进行同步服务,将业务系统的数据分发到指定的数据存储并对相关的数据进行汇聚处理入湖。通过可视化数据抽取方式配置数据消息对接任务,支持数据源和目标源的动态适配和添加进行服务订阅,能在业务数据库不产生任何影响的情况下,实现数据实时同步。(3)数据处理 数据清洗:数据清洗服务目的在于删除重复信息、纠正存在的错误,并提供数据一致性,其原理是利用有关技术如数理统计、数据挖掘或预定义的清理规则将不合格数据转化为满足数据质量要求的数据。数据清理主要从数据的准确性、完整性、一致性、惟一性、适时性、有效性几个方面来处理数据的丢失值、越界值、不一致代码、重复数据等问题。 数据转换:数据转换对抽取的源数据根据区域健康数据中心的要求,进行数据的转换、清洗、拆分、汇总等,保证来自不同系统、不同格式的数据和信息模型具有一致性和完整性,并按要求装入数据中心。(4)任务管控 来源监控:支持区域健康数据中心基于日志、CDC、时间戳等监控数据来源。 数据交换审计:提供任务实例查看、运行日志查看、任务的启停等功能,保证多源异构数据的批量同步,同时支持任务的暂停、中止等操作,支持数据交换审计服务,包括任务日志查看、错误提示、数据日志下载等。 调度监控:实现对数据抽取节点及采集作业、抽取任务的监控,及时跟踪数据抽取工作正常运行,保证平台数据持续稳定生产。交换监控具备节点监控、执行质量监控、作业监控、任务监控功能。同时支持作业实例的执行情况和子任务的日志查看及异常作业与任务的监控预警。2.统一编码投标人承诺构建不少于30个编码标准,实现医学诊断、医学概念(术语)和临床检验术语统一。并提供编码标准构建说明以及编码维护、发布与管理功能截图(提供承诺函)。(1)编码体系建设建设编码系统(COdeSyStCin)进行编码管理和发布应用,重点针对是健康相关编码标准的应用,对医学诊断、医学概念(术语)和临床检验进行标准化描述。采用标准化健康资源模型,开放编码系统调用。建立统一的行业标准库,涵盖ICDl0、SNOMEDCT中英文版、LolNC标准、药品ATC标准及各类常规的行业标准字典,为数据归一化建立基础。(2)编码维护、发布与管理编码管理基于专门制度进行数据标准体系的维护和管理,提供标准维护、标准查询等增加、修改和更新服务,有助于保障和评估编码的标准化程度。 标准管理:提供标准文档的名称、标准号、类别、版本、上传时间的编辑功能以及文档上传功能。 术语管理:通过术语管理功能对使用的术语字典进行统一管理,包括对术语字典分类、标识符、值域等信息的配置管理,构建准确、完整、一致的术语体系,实现数据值域的标准化管理。 数据元管理:主要针对可重复使用的高价值、低变更的基础数据元,通过数据元管理功能对平台中使用的数据元进行统一管理,定义数据元属性、类型、分类等基本信息。提供标准定义数据元对数据采集过程面向数据质量定义的一组校验规则实现界面化维护,为后续通过数据质量管理实现采集过程监管,全流程数据治理的PDCA闭环改进实现提供标准规范。 审核管理:在标准管理系统中修改标准需对发布的标准文档及目录标准进行审核,只有审核通过的标准数据元、编码、标准术语和标准文档才能最终发布到平台上使用。 数据编码映射:创建数据表时,支持通过标准数据元及数据集进行数据编码建模,在构建数据模型和对数据质量检查过程中实现数据资源的标准化编码映射,用于后续的数据质量检查过程中实现数据资源标准化检查的依据。 .数据管理(1)主索引管理主索引管理将散落在各个信息系统中的就诊、体检等信息进行整合。通过构建平台的主索引,将居民信息进行关联整合,构造健康画像,为大数据分析行为提供数据资源基础。其主要功能包括:主索引注册、主索引数据合并管理、主索引数据拆分管理、相似匹配规则管理等。(2)数据同步管理管理将外部系统来源的数据迁移到平台的过程,通过配置相应数据表的数据同步任务完成。包括对数据同步任务的增删改查、上线/下线等功能。通过数据同步任务可配置进行数据同步的数据来源类型、来源信息、数据去向类型、去向信息、创建人、引用情况等。(3)数据开发管理数据开发是完成平台对数据的采集以及对原始数据的质量提升,完成从原始数据到平台元数据的映射,形成平台数据资产。数据开发平台包括数据采集流程的项目配置、作业配置、任务配置、采集监控以及资源管理5个功能。(4)数据质量管理投标人承诺提供不少于50条数据质量校验规则,保障数据质量。并提供数据质控平台总览、数据质量校验模型、数据质量分析报告、配置管理功能截图(提供承诺函)。1)数据质量管理架构设计:提供数据质量管理架构设计,用于检查并报告平台中的数据质量问题。2)数据质量流程设计:提供数据质量流程设计,实现自定义质量规则,并通过自定义规则校验、标准化数据,为后续的数据治理工作提供质量规则,以及提供数据质量报告。3)数据质量管理流程和方法:提出数据质量管理流程和方法,助于管理人员更好的作出决策、减少过程中的冲突和摩擦。规范员工和管理人员采用一致的数据访问,建立标准的、可重复的流程、保证流程的透明性等,是实现数据共享、业务支撑和价值提升的重要保障。4)数据质量管理:对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的数据质量问题,进行识别、度量、监控、预警,并通过相关技术与管理措施使得数据质量获得进一步提高。面向区域健康数据中心所有使用单位提供数据质量评价指标制定、数据质量检测、数据质量分析报告及数据质量评价分析四大项服务。 数据质量评价指标制定参考国家标准GB/T36344-2018信息技术数据质量评价指标制定数据质量的评价标准,主要包括规范性、完整性、准确性、一致性、时效性、可访问性六大维度。 数据质量检测通过预定义的评估规则对平台数据资产进行质量评估,基于所制定的数据质量评价指标,将评价转变为可量化的检测规则,并对全量数据进行质量检测。提供单项数据质量检测、全表数据质量检测及数据关联度检测服务,两种服务根据需求选择表级别或字段级别进行检测服务。支持多源异构数据源,包括关系型数据库、大数据存储等。配置检测任务时,支持自定义评分规则,设置规则的合格分数线、告警分数线。当检测到数据质量不符合预收规则时,即触发预警,系统将预警信息推送给相关成员。同时依据数据质量评价指标,设定数据质量检测时的预警策略,对于数据质量严重不符合标准的进行及时的预警,并及时反馈给数据提供方进行处理后再进行入库处理,以减少对数据处理的重复工作量及影响后期数据价值的开发利用。 数据质量分析报告数据质量校验模型完成校验后需根据执行情况自动生成日志记录和结果详情;数据质量检查结果支持查看字段的合格率,查看规则的不通过情况,问题数据统计,支持质检样本下载。基于此基本数据,区域健康数据中心提供年、月、日、季度四种类型的数据质量报告编辑,支持从模板中拷贝快速生成质控报告;支持即刻发布、定时发布数据质量报告,设置是否重复发布及间隔周期,并通知相关人员;支持查看历史数据质量报告记录。报告内容维度包括但不限于数据提供方、数据提供时间、数据提供量、数据检测标准、数据质量情况分析、数据检测时间等报告项,此类报告可支持在线进行查看。 数据质量评价分析支持自动出具数据质量分析报告,整合数据交换的数据生命周期全部流程节点的数据质量情况,识别数据出现问题的链路和数源方,通过对宏观以及微观视角判定数据质量情况,在宏观数据质量分析层面,识别数据质量变化的趋势判定,通过人工智能等辅助方法,判定数据质量的可能走势及可能异常等带来的风险。通过微观数据质量分析,分析错综复杂的数据质量关系网,识别到关键影响数据质量的数源方及要素。数据质量分析报告的自动出具按照一定的周期进行,以报告为辅,分析为主的思路,通过人工智能的方式识别数据质量风险,达到数据自治理的目的,对数据质量的评判最大程度的信息化,降低管理信息人员的数据认知不同带来的风险。5)数据质量监控 平台总览统计展示平台数据的质量管理总评分及各维度的单项评分,支持多维度查看质量管理结果;能评价平台各机构数据的采集治理质量。 数据质量报告管理提供年、月、日、季度四种类型的数据质量报告编辑,能从模板中拷贝来快速生成质控报告;支持即刻发布、定时发布数据质量报告,设置是否重复发布及间隔周期,并通知相关人员;支持查看历史数据质量报告记录。 数据质量模型管理质量模型信息,包括模型的模型层、数据集分类、模型名称、编码等信息;支持按照及时性、完整性、一致性、准确性、唯一性、合理性六个质量评价维度对质量模型进行规则维护,包括但不限于非空值校验、重复校验、格式校验、同比波动、环比波动、占比波动、值域校验、最值校验、记录数校验、关系校验、固定值校验、逻辑校验、及时性校验;支持规则的评分计算,能自定义评分规则,设置规则的合格分数线、告警分数线。 数据质量实例记录数据质量模型的执行情况,提供日志记录和结果查看;数据质量检查结果支持查看字段的合格率,按机构分组查看规则的不通过情况,问题数据统计,支持质检样本下载。6)配置管理 数据规则模板支持设置质控规则模板,提供给平台数据表进行挂载,规则模板包括但不限于以下:格式校验、同比波动、环比波动、占比波动、值域校验、最值校验、记录数校验、固定值校验;支持针对各校验规则模板进行版本管理;支持对规则模板进行及时性、完整性、一致性、准确性、唯一性、合理性六个质量评价维度的统计。 数据质量报告模板支持维护平台数据质量报告模板,能用富文本编辑器进行报告模板编辑,能插入自定义字段集,进行数据汇总统计; 权重管理支持设置及时性、完整性、一致性、准确性、唯一性、合理性六个维度的权重值,调整评分规则的合理性。4 .主数据建设投标人承诺建立不少于3类主数据。并提供主数据建设功能截图。(提供承诺函)主数据指系统间共享数据(例如,人员、账户和组织部门相关数据)。与记录业务活动,波动较大的业务数据相比,主数据变化缓慢。主数据必须存在并加以正确维护,才能保证系统的参照完整性。5 .健康数据集市(1)数据范围分析为了实现全区健康管理数据的汇聚和分级分类工作,需要对XX区的健康管理数据资源目录进行全面全量彻底的梳理和编制,形成全区完整统一规范的健康管理资源目录清单和数据清单。进一步形成全区健康管理数据资源目录清单,帮助部门完成目录发布工作。同时需做好目录发布、变更、下架的审核工作,确保全区健康管理资源目录的规范性和权威性。范围分析包括对原有资源目录的修订以及新资源目录梳理和编制,并形成数据资产现状报告。1)原有资源目录的修订利用资源目录管理对本部门已有的资源目录进行修订,不断完善和查缺补漏的过程。部门编目人员通过门户核对本部门的资源目录清单进行目录核对,修改问题的目录,修订有迭代版本的目录,废置无用的资源目录。修订内容主要包括目录修改、目录废置、版本更新等动作。2)新资源目录梳理和编制与旧目录修订不同,新目录的梳理还要经过目录规划和调查两个阶段后再编制目录,新资源目录编制具体过程。3)数据资产现状报告通过对XX区健康管理数据家当进行全面盘点,形成XX区健康管理数据资产现状报告。对XX区各个单位和职能部门的调研,了解各单位的业务内容、信息系统、数据库信息、数据内容和形态、供需关系、交换共享要求、数据质量问题、可引入的标准资源等情况。同时对数据表设计、标准化、表命名、字段设计等方面对全量物理表进行分析。导出全量数据清单,形成数据资产现状报告,包括全量数据情况:包括具体数据量(条)有多少,数据存储量多大,已挂接数据有多少,各类数据占比有多少等;各部门数据更新情况:数据表变更和新增情况;数据治理分析情况:数据质量评价、有多少个治理分析任务,治理结果数据有多少等。(2)主题域建模主题域建模是在平台数据标准构建的基础上,支持对数据中心各类数据资源进行系统管理的功能模块。通过主题域建模,数据开发人员可对数据资源进行主题分类和分层管理以及数据表物理模型建立,构建清晰的数据治理方法和规范体系,辅助数据开发人员快速建表,完成从数据标准到数据实现的落实。(3)数据实体设计1)数据实体分类数据实体是用描述区域健康数据中心物理数据表属性,用于描述物理表的相关信息,根据数据实体的实际应用情况,可分为以下业务数据实体、技术数据实体、操作数据实体、管理数据实体四大类。2)数据实体设计设计路径分别从两方面入手,一是盘点XX区数据情况,厘清要管理的数据实体、数据实体来源、形态存储以及之间的关联性。第二方面是建模,建立数据实体的模型及元模型,抽象出数据实体元模型,建立数据实体模型之间的逻辑关系,并围绕技术维度、业务维度以及应用维度进行设计。3)数据实体梳理梳理需要做数据实体管理的应用系统、数据库、数据库用户以及数据表。确定需要管理的数据实体,按数据实体的定义来看只要能描述数据的数据都能作为数据实体进行管理,但从价值角度讲一定要找到对数据业务、数据运维、数据运营、数据创新带来帮助的数据实体进行管理。一般医疗数据实体建设都是围绕数据集中的数据平台进行全链路的源、数据平台、分析系统的数据实体数据管理,围绕这条主线,进一步管理业务数据实体和操作数据实体。4.)数据实体目录系统以目录树的形式管理元数据。目录节点下可以建立新的子目录,也可以挂载数据实体节点,元数据只能挂载到目录节点,且只能为叶子节点。元数据视图主要用于采集元数据信息,并对元数据信息进行格式化的展示,同时提供数据的血缘关系管理以及数据生命周期管理。数据分析操作流程为:新增目录节点,对目录节点进行修改和删除;手动采集元数据信息,查看元数据信息(包括表信息、字段信息、版本信息、血缘关系)。目录节点:依托构建数据仓库的标准规范,构建分层数据目录,实现数据分层可视化,可选类型包括:普通目录、ODS层、DW层。5)数据实体采集编制基于XX区的数据实体标准规范设计,进行区域健康数据中心的数据实体初始创建、采集和维护,方便创建数据表时候可以进行引用。数据实体采集提供自动扫描、批量导入、手工录入三种方式实现数据实体信息搜集。提取目标范围包括:关系型数据库、数据仓库、FTP接口、非结构化文件(TXT、EXCEL、PDF等)、系统接口等内容。数据实体采集任务用于自动的从数据源库中采集表的数据实体信息,通过配置各类数据实体适配器信息、采集任务信息、采集数据源、执行策略进行数据实体采集。通过数据实体管理平台将分散、异构的信息资源进行统一采集、描述、定位、检索等,实现数据的结构化,从而大大降低数据治理的人工成本。6)数据实体存储采集之后需要相应的存储策略来对数据实体进行存储,这需要在不改变存储架构的情况下扩展数据实体存储的类型;数据实体管理过程中,数据实体变更情况无可避免。为保证数据实体的版本可追溯性,避免数据实体管理错乱,数据实体管理提供严密的数据实体变更审核流程,可连续保存数据实体各历史版本,明确当前应用版本,并提供历史版本查看功能。通过时间变更轴,可图形化展现数据实体对象的变更情况,数据的变迁状态。7)数据实体维护提供对数据实体的基本信息、属性、被依赖关系、依赖关系、自合关系等数据实体的新增、修改、删除、查询、发布等功能,以管理XX区的数据标准。提供数据实体的版本管理功能,对于数据实体新增、修改、删除、发布等变更操作都对应相应的流程并进行记录。提供数据实体的标签管理功能,除系统内置的自动标签外,支持创建自定义标签,并将标签赋予不同的数据实体,用于数据实体的多样检索和管理。根据实际业务关系和数据需求情况,对数据实体进行定期检查,保证数据实体信息的完整性、合理性。8)数据实体采集日志采集日志是在手动数据实体采集操作过程中生成的操作日志,日志中记录了采集数据实体的目标目录、数据源名称、采集结果、采集人和采集时间。(4)集市应用开发1)数据开发集市应用开发包括图形化开发、脚本开发以及对数据处理任务的上下线管理等功能。图形化开发支持输入、转换、输出三大类开发节点配置组件,输入节点支持包括MySQLsHive、Doris三种类型数据输入,转换节点支持包含sample算子、filter算子、map算子、sort算子、split算子等,输出节点支持包括MySQL、Hive、Doris三种类型数据输出外,还提供命令行输出。脚本开发支持Shell、HivePython、SQL、Spark>SparkSQLSpark_Shell等任务类型。开发任务管理支持跨项目的任务复制功能,实现项目间任务的快速迁移。并提供一站式集成开发环境,满足大数据环境下的开发、调度、运维等需求。2)应用服务开发通过平台数据交换功能实现各异构数据库之间的数据集成,实现原有各业务系统在数据集成,保证各应用间的数据交换与共享,实现应用服务开发。6 .专题主题库投标人承诺建立不少于10个主题库,并提供主题库包含的数据字段及说明。(提供承诺函)根据健康管理业务需求,对相关数据的粒度和维度进行专题管理。基于全民健康信息平台,归集居民相关医疗卫生数据,建立居民信息主题、个人家族史主题、健康体征主题、辅助检查主题、疾病史主题、门诊主题、住院主题、体检主题、高血压主题、糖尿病主题、老年病主题、高危管理主题等数据库,并记录健康全周期健康管理过程中产生的新数据。7 .数据共享投标人承诺与XX区全民健康信息平台、XX区医疗云平台、区大数据治理平台、X好办、或与采购人约定的其他系统进行数据共享。并提供服务目录、服务市场、审核管理、监控运维功能截图。(提供承诺函)经过清洗、转换与健康管理业务融合的数据,将形成大数据平台中的重要数据资产,平台制定统一的数据交换标准,把数据资产以接口形式封装,提供对外开放的数据资源共享服务,推动更具大数据分析能力的应用落地,实现大数据赋能业务的最终目标。数据共享服务提供对平台数据资源的自定义快速接口封装流程与共享服务目录管理、审核、监控等全流程贯穿。主要包含服务目录、服务市场、审核管理、监控运维等功能。服务目录:主要提供数据共享服务的注册、编辑、发布与撤销、测试及日志查看等数据服务管理功能。服务市场:主要面向数据服务调用方,提供已发布数据服务的目录浏览视图,调用方可通过服务市场搜索感兴趣的数据服务,了解相关服务的基本信息,如调用次数、服务提供方、接口地址、字段信息等,并申请调用相关数据服务。审核管理:主要提供对申请调用的数据服务进行授权管理,包含对所有服务调用申请的申请单的查询浏览功能与申请的授权审批功能。监控运维:主要提供对用户注册服务、编辑服务、发布服务、申请调用服务等相关操作的日志记录,包含操作用户、操作模块、操作类型、操作时间与详细日志等信息记录想,实现操作可追溯。(二)区域健康管理系统根据人群的年龄、职业等属性依次进行类别、系统、层级划分,如公职人员(公务员、公安、教育、卫健)、专业人才、企事业单位管理人员和社区居民等,形成特殊群体健康画像。有效利用卫生健康资源,结合慢病分析,开展区域群体精准健康管理。根据个人全生命周期健康档案,结合问卷调查、互动信息,持续了解居民的健康行为方式,制定个性化和区域化健康干预方案,对居民与群体健康干预效果进行追踪分析。针对信息传播一觉察信息一引起兴趣f感到需要f认真思考一相信信息f产生动机一尝试行为态度坚决一动力定型一行为确立过程中所采集的信息开展多维度分析。注册用户通过区智慧惠民服务统一门户,可查询自身健康档案和健康建议。根据自身需求填写自测问卷,问卷填写内容自动保存到相应健康档案中。支持在线体检报告解读和健康咨询,支持体检机构及体检项目智能推荐。采用权威的评估问卷,包括生活方式、心理、疾病风险等问卷,有效采集个人的健康行为数据,为健康干预方案制定提供依据,支持问卷的编辑、审核、发布,支持前后问题的相关逻辑判断,支持自动计分和结果判断,根据问卷填写内容输出相应建议。同时根据个人健康画像,结合问卷调查、互动信息,持续了解居民的健康行为方式,制定个性化和区域化健康干预方案,对个体与群体健康干预效果进行随访、追踪和分析,根据需要提供复查方案及就医推荐服务。促进以诊疗为中心向健康管理为中心的转变。1 .智能健康画像投标人承诺配合采购人提供不少于100OOO份健康画像。并提供人体模型图、健康概览、居民健康指数、时序图、趋势分析、多发疾病风险预测、疾病进展、健康预警功能截图。(提供承诺函)基于区域健康数据中心汇聚的居民基础信息、诊疗信息、体检信息、健康评估结果以及慢病管理应用反馈等数据,结合健