医疗健康管理和服务大数据应用研究.docx
郝思佳医疗健康管理和服务大数据应用研究13354089医疗健康管理和服务大数据应用研究电政二班 郝思佳 13354089摘要: 本文首先从医疗信息化的背景出发,概述了目前医疗信息化的建设现状、市场分析以及建设流程。再详细举例阐述了目前医疗健康管理和服务大数据在我们日常生活中的应用,包括临床决策、远程医疗、个性医疗等等。最后分析了医疗大数据目前所面对的挑战,以及提出了相应的改进建议。关键词:大数据 医疗健康 管理 服务 信息化目录一、医疗大数据信息化背景31.1医疗大数据概述31.1.1大数据的定义31.1.2医疗大数据的来源31.1.3医疗大数据的应用41.2医疗数据信息化建设现状41.2.1信息化建设内容及要点51.2.2信息化建设分类情况61.2.3信息化建设投资情况61.3医疗数据信息化体系市场分析81.3.1信息化建设市场空间91.3.2信息化建设投资前景91.4医疗数据信息化建设流程101.4.1信息化建设资金来源101.4.2信息化建设决策者10二、医疗大数据在医疗健康管理与服务中的应用112.1 临床决策支持系统112.2 远程医疗及远程病人监控112.3 电子档案分析与公共健康122.4大数据在医疗个性化服务中的应用122.4.1基因测序122.4.2个性化药物开发132.4.3个人健康管理14三、医疗大数据面对的挑战153.1 医疗数据的整合153.2 医疗数据的存储153.3 医疗数据的挖掘利用163.4 医疗数据的安全保护16四、医疗大数据应用改进164.1 同步变革数据管理方式164.2 建立完善的区域卫生信息化标准体系174.3 积极探索利用数据挖掘技术174.4完善医疗预警机制174.5 完善医疗隐私保护机制18五、总结18六、参考文献19一、 医疗大数据信息化背景 医疗行业作为关系人民生命安全和国家稳定和重要行业而一直受到国家和各级部门的重视,如何有效的提高我国的医疗水平,更好的为人们提供医疗服务,国家和医疗行业所关注的问题。 随着计算机网络的发展,医疗行业也在不断的建设满足自身应用的行业应用信息系统。然而,由于国家早期对医疗行业信息化建设的认识不足,而医院自身对医疗行业的投资和认识都较低,导致我们国家医疗行业的信息化建设起步较晚,而且医疗行业的信息化建设相对其他行业的信息化建设要落后很多,而且各个医院都存在很大的差异。 信息化建设对于推动医疗行业自身的发展和体高工作效率,同时,为患者提供更及时更准确的服务都起到了至关重要的作用。因此,正是看到了信息化建设对医疗行业发展的重要作用和目前医疗行业信息化的落后现状。政府和医院自身都开始不断的加强信息化的建设,不仅发布了相关的各种发展规划纲要,鼓励医疗行业的信息化建设,同时,医院自身也在不断的加大信息化建设的投资。医疗行业信息化建设的第二个浪潮已经来到,也是医院对于自身信息化建设投资的又一个高峰期。作为网络设备提供商,我们也要开始重视医疗行业的信息化建设发展。对于我们来说,医疗行业的建设还是一个空白,但是,通过深入的分析医疗行业的应用和发展,将会是一个非常大的“馅饼”。1.1医疗大数据概述 1.1.1大数据的定义大数据其本质是信息爆炸时代 对数据的核心价值再挖掘,被大部分专业人士认为是计算机行业继云计算、物联网之后 IT 产业又一次颠覆性的技术变革。其有四个特征: 一是数据量大,起始计量单位至少是 P(1000 个T);二是数据类型繁多,包括音频、视频、图片、地理位置信息等等;三是数据价值密度相对较低,需要强大的机器算法 迅速完成数据价值的“提纯”;四是处理速度快,时效性要求高。可将其归纳为4个“V”:Volume, Variety,Value,Velocity。1.1.2医疗大数据的来源 医疗大数据的来源主要包括四类:1.制药企业/生命科学:药物研发是相当密集型的过程,对于中小型的企业也在 TB 以上的。在生命科学领域,随着计算能力和基 因测序能力逐步增加,美国哈佛医学院个人基因组项目负责人詹森· 鲍比就认为,到2015年,将会有 5000万人拥有个人基因图谱,而一个基因组序列文件大小约为750MB。2.临床医疗/实验室数据:临床和实验室数据整合在一 起,使得医疗机构面临的数据增长非常快,一张普通 CT 图像含有大约 150MB 的数据,一个标准的病 理图则接近 5G B。如果将这些数据 量乘以人口数量和平均寿命,仅一个社区医院累积的数据量,就可达数 TB 甚至数 PB 之多。3.费用报销/利用率:患者就医过程中产生的费用信息、报销信息、新农合基 金使用情况等。4.健康管理/社交网络:随着移动设备和移动互联网 的飞速发展,便携化的生理设备正在普及,如果个体健康信息都能连入互联网,由此产生的数据量不可估量。1.1.3医疗大数据的应用麦肯锡公司(世界级领先的 全球管理咨询公司)在其报告中指 出,排除体制障碍,大数据分析可 以帮助美国医疗服务业一年创造 3000 亿美元的附件价值,包括医 疗服务业 5 大领域(临床业务、付款/定价、研发、新的商业模式、 公众健康)的 15 项应用:(1) 临床操作包括:比较研究、临床决策支持系统、医疗透明度、远程病人监控、对病人档案的先进分析。(2) 付款/定价包括:自动化系统、基于卫生经济学和疗效研究的定价计划。(3) 研发包括:预测建模、提高临床试验设计的统计工具和算法、临床试验数 据的分析、个性化治疗、疾病模式的分析。(4) 新的商业模式包 括:汇总患者的临床记录和医疗保险数据集、网络平台和社区。 (5) 公众服务:改善公众健康监控。141.2医疗数据信息化建设现状 自从计算机出现之后,经过几年的发展诞生了计算机网络;网络的诞生,极大的提高了各个行业的信息交互速度和工作效率。随着计算机技术和网络技术的发展,为了实现更高效的信息交互和资源共享,提高生产效率,各个行业的网络建设规模也在不断的扩展,每个行业都在准备开始或正在发展自己的信息化建设,作为关系民生的医疗行业从十年前就开始了行业内的信息化建设。党的十五届五中全会提出“大力推进国民经济和社会信息化,是覆盖现代化建设全局的战略举措。以信息化带动工业化,发挥后发优势,实现社会生产力的跨越式发展”。“九五”以来,我国医疗信息化建设取得了明显进展:实施国家卫生信息网建设项目,信息化基础设施建设已见成效。然而,由于医疗行业自身的特点,医疗行业信息化建设起步较晚,技术力量薄弱,资金投入不足,与其他行业和卫生事业的实际需求相比,还处于初级阶段,有相当的差距。 同时,医疗行业由于其自身应用的特殊性,医院的网络建设不能照搬其他行业的网络建设,为了适应医疗行业自身的网络应用,2002年国家卫生部在医疗行业的全国卫生信息化发展规划纲要提出了医疗行业建设的基本原则是:标准统一、保证安全、以法治业、经济实效、因地制宜。1.2.1信息化建设内容及要点 根据医疗行业的总体应用区分,将医疗行业的信息化建设划分为三个部分;从广义上讲,一个完整的医院信息系统主要包括医院管理信息系统(HMIS)、临床管理信息系统(CIS:有的地方写作:HCIS)和局域医疗卫生服务系统(GMIS)三部分:医院管理信息系统(HMIS)临床管理信息系统(CIS)局域医疗卫生服务系统(GMIS)门、急诊挂号子系统住院病人医嘱处理子系统计算机化的病人病案系统(CPR)门、急诊病人管理及计价收费子系统病人床边信息系统科研支持系统 住院病人管理子系统护理信息系统教学支持系统药库、药房管理子系统门诊医生工作站系统Internet医学情报系统病案管理子系统临床实验室检查报告子系统(LIS)远程诊断与教学医疗统计子系统医学影像诊断报告处理系统人事、工资管理子系统放射科信息管理系统(RIS)财务管理与医院经济核算子系统手术室管理子系统医院后勤物资供应子系统功能检查科室信息管理子系统 固定资产、医疗设备管理子系统病理卡片管理及病理科信息系统院长办公综合查询与辅助决策支持系统血库管理子系统营养与膳食计划管理子系统临床用药咨询与控制子系统医学图象实时传输与查询、归档系统(Picture Archiving and Communication System,PACS) 其中,临床医疗信息系统可能包括的内容很多,甚至可能是专科、专病、专课题的信息 处理系统,上表给出一些常见系统的例子。1.2.2信息化建设分类情况 医疗行业经过近十年的信息化建设,全国有90的三级医院和二甲医院在过去五年已经完成了医院信息化的建设,各大、中、小型医院都已经建设了覆盖整个医院或部分办公区域的计算机网络,然而,由于地域和医院自身实力的不同,医院的网络建设也有着明显的差别。 医院自身有一定的资金实力,处于信息化发展较快的大中型城市的医院,医院的信息化建设较完善,网络建设也具有了一定的规模,不仅建设了覆盖整个医院的完整的计算机网络,而且建设了较全面的HMIS系统,主要是满足医院自身的办公和运营需要,通过覆盖各办公区域和门诊收费部门的计算机网络和HMIS系统,极大的提高了医院自身的办公、门诊收费、挂号、费用核算、药品器械管理等工作的效率。更有实力的大型医院已经建设了自己的CIS系统网络,通过覆盖住院部、放射科、检验科、手术室的网络系统,在为住院病人提供更为完善住院服务的同时,协同各个部门之间的工作和数据交互,提高医院整理的工作和生产效率。而有少部分的大型医院,正在着手建设GMIS系统网络。 处于信息化建设的较为落后城市的中小型医院,信息化的建设相对比较落后,位于医疗信息化建设的初级阶段,仅建设了覆盖主要办公区域的计算机网络,HMIS系统的建设也主要是为了满足日常的简单办公需要,没有一套非常完整的HMIS系统。计算机网络也停留在几年前的网络建设规模,大都采用的是较老的非网管交换机,进行简单的网络连接,搭建了满足简单办公需要的计算机网络。稍有实力的中型医院,虽然已经建设了覆盖主要办公区域和各门诊、挂号收费部门的计算机网络,但是网络建设仍然比较简单,网络设备也都已经是落后和淘汰设备了,仅能满足目前简单的HMIS系统的需要,为各办公部门和收费部门提供简单的服务。1.2.3信息化建设投资情况 据悉,国外医院建设HIS的投入一般达到每年总经费预算的24%,长期以来国内对HIS的投入不够重视,认为没有直接的经济收入。 目前中国有3万多家医院,其中有6000家左右是三甲以上的医院。5万多个防疫站,在信息化上的投入大约占医疗卫生服务市场容量(4000亿元到5000亿元之间)的千分之一,而与国外医院信息系统建设的投资大约占其总投资24相比,明显不足。举个例子,在信息化投入上,美国麻省医院一年为4亿美元,而北京协和医院一年只有400万元人民币。 美国医院年花费统计: 美国医院HIS投资水平: 中国医院HIS投资水平: 虽然目前我国医院信息化的资金基本全部靠自筹,国家对医院的财政拨款较少,但随着医疗消费每年20的高速增长,加上国家政策的大力扶持,以后医院信息化中资金的问题会得到较好的改善。1.3医疗数据信息化体系市场分析 全国卫生信息化发展规划纲要(2003-2010年)提出2010年卫生信息化建设的奋斗目标,即“建立起较完备、标准统一规范、系统安全可靠,与卫生改革与发展相适应的卫生信息化体系,经济发达地区卫生信息化建设和信息技术应用达到中等发达国家水平,其余地区卫生信息化建设要处与发展中国家的前列”。 十年前我们谈论的是如何基于商业化的数据库建设医院管理信息系统,而今天,我们谈论的却是无胶片化、无纸化、无线化、移动计算、临床信息系统、PACS、管理与临床决策、系统集成与安全、流程再造,甚至是数字化医院的实现。数字化医院的标准:三部分的统一:1. 数字化医疗设备2. 计算机网络平台3. 医疗行业业务软件三无医院:1. 无纸化2. 无胶片3. 无线网 医院信息化的根本目的是减少医疗错误、提高医疗服务质量、控制医疗成本和医疗费用的增长。当今我国医疗行业所面对的所有挑战,医院信息化是一个功能强大的应对武器。这正是当今医疗卫生信息化成为世界性热潮的根本原因。1.3.1信息化建设市场空间 从全国的整体形式看,目前,全国有90的三级医院和二甲医院在过去五年已经完成了计算机,网络平台的建设,重点建设是为了满足医疗管理信息系统的需要;这些医院第一阶段的信息化建设已经基本完成。 全国80以上三级医院,特别是三甲医院,都面临着网络升级改造,这些医院将从原有简单的10/100M网络,非网管交换设备,升级到1000M主干网络甚至10G主干网络,他们这各阶段的网络建设主要是满足完善的医院临床管理信息系统(CIS)的需要,其中以PACS系统,LIS系统,RIS系统最为突出。 而全国20的三甲医院正在向建设数字化医院的目标迈进,建设:以人为本,以病人为中心,以医护人员为主体的数字化医院。目的旨在:提高医疗质量,提高工作效率,简化病人就医流程。 经过近十几年的发展,我国医院信息系统(Hospital Information System,HIS)建设已经初具规模。信息系统的发展经历了从单机系统、局域网络系统到整个医院网络信息系统的几个阶段。在医院网络建设中已经比较普遍地使用结构化网络布线、采用以太网和光纤网络技术,各种网络交换技术和网络应用也大量地使用。国际发展趋势表明,医院信息系统已从重在费用和信息管理的管理信息系统阶段逐渐发展到面向临床医疗信息管理的CIS(Clinic Information System)阶段,包括电子病历(Computer-based Patient Records CPR)系统、医学影象系统(Picture Achieving and Communication System, PACS)、实验室检查系统和远程医疗等交互式网络信息服务功能的开发和应用。 远程医疗正在迅猛发展。我国的远程医疗近几年发展迅速,一些著名的医学院校、医院都建立了远程会诊中心。 另外,智能卡将在医药卫生系统广泛应用。目前在个别医院里出现了IC卡进行电话预约挂号,随着以病人为中心的管理模式逐渐被广泛接受,付费、查询、保健、急救医疗等领域都将出现智能卡的使用。 目前,医疗行业信息化建设的第一个阶段基本已经完成,信息化建设已经开始重新洗牌。医疗行业已经开始考虑更换第一阶段的系统和设备,同时考虑临床信息系统的建设甚至更高的应用系统和数字化医院的建设。1.3.2信息化建设投资前景 全国卫生信息化发展规划纲要(2003-2010年)提出:在医疗服务领域,信息化建设资金主要来源于单位自筹,通过信息化手段提高效率、降低成本和提高服务质量,各单位应按总收入2-4%的比例投入信息化建设。 在2005-2009年的未来5年间,医疗行业的信息化市场与其他行业相比,将继续保持快速的增长,今后三年,国家每年将对医疗卫生系统投资80多亿元,是以往的8倍。另据计世资讯研究结果表明,2004年中国医卫行业的IT投资规模为35亿元人民币,比2003年增长25,与其他行业相比,医疗行业的IT投资仍然保持着较高速度的增长。 近年来,随着医院对加强管理和信息化认识的提高。一般国内大型医院信息化投入可以达到年收入的0.5%,有些医院开始讨论2%的投入标准。卫生部要求,各单位应按总收入24%的比例投入信息化建设。如果全国医院能够达到24%的投入,可以创造一个每年80亿到160亿人民币的医院信息化大市场。未来几年中,我国将有超过70%的医院实现信息化管理,预计市场总量将达到200多亿元。1.4医疗数据信息化建设流程1.4.1信息化建设资金来源 医疗行业目前的各种建设包括信息化的建设中,一个三级甲等医院要实施全院的信息化建设,至少需要几千万元甚至上亿元的投资。而我国国家对医院信息化的投入较少,医院本身又因政策的制约,信息化的投资无法计入成本,更无法考虑收回。医院因受赢利限制,更愿意投资于很快产生效益的医疗设备,而很难拿出一笔巨资投入于信息化的建设。但是医院的发展又迫切需要信息化系统的管理。 而且中国的风险投资机制还不够成熟。国外很多医院要上这种大型的信息化系统,都是靠银行贷款或者吸引风险投资来进行。风险投资作为一种中间桥梁对推动新技术起到一种催化剂的作用。然而中国虽然有所谓的高新科技资金和风险投资,却是一种“后风险投资”,也就是说必须在评估之后,才能拿到项目,然后是等待资金。常常延误了很多大好的机会。1.4.2信息化建设决策者 医疗行业的信息中心一直处于比较尴尬的地位;在一些信息化建设较好的大医院,网络中心的地位相对较高,而且在医院的各种建设中规划中都有一定的发言权,可以说医院的CIO和CEO是坐在一个板凳上的;而在在一些信息化建设相对落后的中小型医院,网络中心的地位相对较低,同时,在一些医院的建设规划等方面都没有太多的发言权,有的信息中心甚至在医院被认为是和电工房一样的,在这样的中小型医院,信息化建设的拍板权集中在院长或副院长的手里,有时甚至被分到基建科的手里,网络中心一直得不到很好的地位提升。 信息系统是要为企业战略服务的,CIO从信息技术的角度来设计和策划企业的发展和竞争战略,所以他不应该仅仅是辅助决策信息的提供者,而且应该是决策者之一。而在中国的医院,真正的在CIO体系制度的确立尚有待时日。目前实际上是由主管副院长加计算机室主任共同承担CIO的职责。对信息化的理解与重视往往因人而异,政策缺乏连贯性。一个稳定的、有职有权的CIO职位关系到信息系统的成败、也关系到一个现代化、数字化医院运转的成败。“中国医院CIO制度建立之时,便是中国e-hospital的实现之日。” 从目前医疗医院网络中心自身来看,很多的网络中心都在不断的为自己的部门争取更高的地位,同时也在为网络中心在医院的各种建设上争取一定的决策权。11二、医疗大数据在医疗健康管理与服务中的应用 医疗行业的传统数据应用具有重要的参考价值,必须明确的是大数据的发展是建立在已有的技术基础、数据积累之上的拓展。新的信息分析技术 和通讯技术为传统的医疗网络应用和数据分析带来了新的思路。 在对用户的诊疗数据、健康监测数据的采集和分析的基础之上,可以实现用户身体状况的预测、监控,甚至可以确定用户是哪一类的疾病的易感人群。提高用户的健康状况水平,降低用户的患病风险。精准分析包括病人体征数据、费用数据和疗效数据在内的大型数据集,可以帮助医生确定临床上最有效和最具有成本效益的治疗方法。医疗护理系统将有可能减少过度治疗,比如避免副作用大于疗 效的治疗方式。2.1 临床决策支持系统 临床决策支持,是指医生在诊疗过程中,能对医生的实时诊疗决策制定做出帮助的各种资源。常见的 有科研文献、在线期刊、专家会诊意见、循证医学证据、临床决策支持系统(CDSS)等。临床决策支持 系统,是通过数据、模型等,以人机交互辅助临床工 作人员决策的计算机应用系统。 得益于对非结构化数据的分析能力的日益加强, 临床决策支持系统在大数据分析技术的帮助下变得更 加智能。比如可以使用图像分析和识别技术,识别医 疗影像数据,或者挖掘医疗文献数据建立医疗专家数 据库,从而为医生提出诊疗建议。文献1介绍一种 基于生理数据的云计算用药决策支持系统,使用了基于生理数据和药物剂量及临床表现的历史数据用以指 导早产儿药物剂量。文献2探讨了一些不便到达的特殊地区的远程临床咨询服务系统的技术挑战,介绍了基于移动终端的远程临床决策支持系统。文献3论述了利用临床心脏影像大数据支持的人工智能和先进计算,用以实现个性化的治疗。利用机器学习对临 床数据建模,用以实现疾病的预测、康复和临床决策支持,为医生的治疗提供了新的思路。2.2 远程医疗及远程病人监控 从对慢性病人的远程监控系统采集数据,并将分析结果反馈给监控设备(查看病人是否正在遵从医嘱),从而确定今后的用药和治疗方案。利用移动智能终端及穿戴式设备实现对病人的远程监控,将患者的状态、参数纳入到病人的病历之中。特别是在慢性病患者的治疗过程中,远程监护可以有效的监测用户的健康状况。文献4介绍的一种针对糖尿病人的远程医疗和远程病人监护系统,系统包括可穿戴式的、便携式的生理参数监测设备,可以对病人的生理参数进行实时监控,在专家系统和医生的 监控之下进行长期的跟踪治疗,是远程监控的典型应用。文献5介绍了移动健康的相关技术和体系结构,并对互联网通讯技术的发展对远程医疗的 推动进行了详细的阐述。2.3 电子档案分析与公共健康 在病人档案方面应用高级分析可以确定哪些人是某类疾病的易感人群,进行药物使用的安全性分析。文献6通过对相关病人的电子病历以及药品代理商的药物资料进行数据分析,用以完成药品安全监测,防 止药品滥用事件的发生。文献7综述了几种通过对基 因和遗传等数据进行建模来推断疾病的潜伏期、易感 群体、传染性的方法。通过全面分析病人特征数据和 疗效数据,然后比较多种干预措施的有效性,可以找 到针对特定病人的最佳治疗途径。文献8介绍了通过 电子医疗记录进行公共卫生监测和传染病控制的几种 方法,文献9以心衰为例子综述了使用电子病历进行 疾病预测建模的挑战与策略,并对几种智能算法进行 了分析。文献10对使用电子档案进行数据挖掘完成研 究工作和临床治疗的意义和面临的挑战进行了阐述, 电子病历的数据挖掘有利于新的疾病分级策略的建立 和对未知疾病的相关临床症状进行分析,结合基因数 据,可以实现对基因表达的生物机制研究。2.4大数据在医疗个性化服务中的应用 试想一下,未来你的手环会提醒你最近睡眠质量差,下周流感来袭你很有可能要感冒;或者你的车载系统会提醒你下个路过的商圈流感人群聚集,可以先摇上窗户各种智能设备的出现是因为人们对智能生活的不断追求,健康管理是智能设备避不开的一个发展方向。有业内专家指出,疾病预测关注的角度与民众的生活息息相关,不但可以帮助民众更有针对性地预防疾病,也可以让相关的医疗、快消等行业在大数据的帮助下,优化资源分配、提升运转效率。美国罗彻斯特大学医学院精神病学和内科教授恩格尔(G. L .Engel)在1977年科学杂志上发表的题为科研信息化技术与应用的论文指出,我们需要新的医学模式,对生物医学的挑战”的文章中指出,现有的占统治地位的疾病模式是生物医学模式,以分子生物学的可测量的生物学变量来分析疾病,没有将病患的社会、心理和行为方面纳入到医学模式之中。通过对病人生理参数的长期监测,挖掘病人电子档案,实现疾病的预测、疾病的建模已经广泛应用在医疗领域。大数据背景下,把患者的健康数据包括锻炼习惯、生活习惯、社交媒体信息等等纳入到疾病模式的分析和建模中来,可以更有针对性的针对个体实现个性化的治疗,也是生物心理社会医学的一个发展方向,例如可以通过对社交媒体数据进行文字关键字分析来分析青少年心理压力。122.4.1基因测序 随着大数据的飞速发展,它已经把触角触及到很多领域。在医疗健康领域,美国已经开始利用大数据应用来防止流感蔓延,而伴随科学技术的不断发展,也让以 往无比昂贵的基因测序变得不再遥不可及,基因测序的成本已经逼近 1000 美元。目前美国拥有 2000多家从事人类基因序列分析的公司, 而且预测未来会有更多的企业将涉足这一领域。这就意味着,个性化医疗的时代即将来临。成立于2011年的初创公司Bina Technology 近期获得了650万美元的风险投 资,Bina Technology 主要从事的工作就是利 用大数据来分析人类的基因序列,他们的分析 成果将为研究机构、临床医师等下游医疗服务行业提供最基础的研究 素材。研究型大学、制药公司和临床医生利用 Bina Technology 的技术对基因数据进行分析,能够利用这些数据发现基因中罕见的病变信息,而正是这些病变信息造成了癌症、新生儿疾病、镰刀状细胞性贫血等。基因测序不同阶段所达到的效果如下图所示。 Bina Technology 计划与威斯 康星州的医疗中心展开合作,将对 新生儿重症监护室的儿童进行完整 基因组序列测定。在未来几年内, 该团队希望以后每一位新生儿都能 够接受 Bina Technology 提供的完 整基因分析数据。斯坦福大学基因 学研究的 Michael Snyder 博士在Bina Technology 平台正式发布之前先进行了初期试点工作。实验表明,Bina Technology 平台在 5个小时内可完成几百人的基因序列分 析,按照传统的分析方法,这需要 花费一周时间来完成。 随着从基因测序解决方案中得到越来越多的遗传信息,未来对基因组进行可扩展分析的需求显然将会越来越多。虽然技术仍需要数年时间来发展,但是从长远来看,它 们可能对我们的健康产生很大影响,毕竟医学是一个整体。我们也有理由相信,个性化医疗时代距离我们已不再遥远 2。2.4.2个性化药物开发 另一种在研发领域有前途的大数据创新,是通过对大型数据集 ( 例如基因组数据 ) 的分析发展个性化治疗。该应用考察遗传变异、对特定疾病的易感性和对特殊药物的反应三者之间的关系, 然后在药物研发和用药过程中考虑个人的遗传变异因素。很多情况下,病人用同样的诊疗方案但是疗效却不一样,部分原因是遗传变异。针对不同的患者采取不同的诊疗方案, 或者根据患者的实际情况 调整药物剂量,可以减少副作用。 个性化医疗目前还处在初期阶段。麦肯锡估计,在某些案例中,通过减少处方药量可以减少30% 70% 的医疗成本。比如, 早期发现和治疗可以显著降低肺癌给卫生系统造成的负担,因为 早期的手术费用是后期治疗费用 的一半。 苹果公司的传奇总裁史蒂夫 乔布斯在与癌症斗争的过程中采用了不同的方式,成为世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。为此,他支付了高达几 十万美元的费用,他得到的不是一个只有一系列标记的样本,而是包 括整个基因密码的数据文档。对于一个普通的癌症患者,医生只能期 望他或她的 DNA 排列同试验中使用 的样本足够相似。但是,史蒂夫 乔布斯的医生们能够基于乔布斯的 特定基因组成,按所需效果用药。如果癌症病变导致药物失效,医生 可以及时更换另一种药,也就是乔布斯所说的“从一片睡莲叶跳到另一片上”。通过大数据技术开发出的个性化药物将乔布斯的生命延长了好几年。2.4.3个人健康管理 利用大数据技术,对个人健康进行全生命周期管理,实现在任 何时间、任何地点都可以访问相关 信息,从而保证了健康信息的一致性连续性,如 Google Health、 微软的 Health Vault 等平台。健康 管理系统的最主要特点就是:个人的健康状态得得到了连续观测,健康分析人员能够有效地对个人健康状况进行分析,以便在身体处于非健康状态时得到及时的干预。 在健康管理领域中最需要解 决的问题就是及时发现身体的健康异常和重大疾病风险预警,传统情况下我们会通过年度体检来实现这一要求,但是体检时间跨度大,同时地域的覆盖能力也不足够,可穿戴式设备(如下图) 能够实现跨地域大人群身体异常实时发现。通过体征数据(如心率、脉率、呼吸频 率、体温、热消耗量、血压、血糖 和血氧、激素和 BMI 指数,体脂含 量)监测来帮助用户管理重要的生理活动。现阶段可以利用的体征数据传感器包括:体温传感器热通量传感器:用来监测热量消耗能力,可以用于血糖辅助计算和新陈代谢能力推算体重计量传感器:用于计算 BMI 指数脉搏波传感器:推算血压,脉率等数据生物电传感器:可用于心电、脑电数据采集,也可用来推算脂肪含量等光学传感器:推算血氧含量,血流速设备初始会将一天设 定数十个检测点,只需累积28个检测结果即可建立个人初级模型,利用大数据技术对所有产生数据进行分析,汇总成一个健康风险指数,用户可以看到自己的健康风险指数和同龄、同性别人群的平均风险指数,并且能明确自己的健康风险在同龄人群中的排位。同时,利用大数据技术, 设备会根据使用者实际情况进行调整,一旦数据显示异常,就会加大检测密度,反之则会拉长检测间 隔,进行动态调整。这些数值交叉分析结果可以用来分析用户现在的体质状况,进行健康风险评估,并可以结合数据给出几项关键生理活动:睡眠、饮食、运动和服药的个性化改善建 议,让用户保持在一个稳定的身体健康状况。13三、医疗大数据面对的挑战3.1 医疗数据的整合 对“小数据”而言,最基本、最重要的要求就是减少错误,保障质量,在大数据时代,允许不精确的出现已经成为一个新的亮点,而非缺点。分散挂接于卫生信息共 享平台下的各类医疗卫生机构中, 产生了大量的异构数据,使得数据采集、整合变得十分困难,现有平台的数据质量并不理想。毋庸置疑, 对于个人信息来说,每一次的历史诊疗数据都必须准确无误。但是, 只把目光集中在提高数据质量上, 忽视那些不精确数据的利用将无法 适应这个大数据时代。错误并不是大数据固有的特性,而是一个亟需我们去处理的现实问题,并且有可能长期存在。在这种情况下,是否能够忽略数据本身的差错,使我们掌握利用更多的数据。3.2 医疗数据的存储 不断膨胀的医疗信息数据中混 杂着大量非结构化数据,分析数据来源日趋多样化,目前的存储架构已经无法满足大数据应用的需要, 在处理和查询大数据集时更是力不从心。第一是容量问题:“大容量”通常可达到PB 级的数据规模,因 此,海量数据存储系统一定要有相应等级的扩展能力。除数据规模巨大之外,还拥有庞大的文件数量, 因此如何管理文件系统层累积的元 数据也是一个难题。第二是延迟问题:医疗大数据应用存在实时性问 题,需对数据进行实时或准实时的处理、秒级的查询需求响应。在卫生信息化调研过程中,很多医务人员反映调阅数据速度慢,放射科医生调阅病人CT影像要等待数分钟。显然,静态的存储方案无法满足数据动态演化所带来的挑战。第三是并发访问:一旦认识到医疗大数据分析应用的潜在价值,就会将更多数据集纳入系统进行比较,同时让更多的人使用这些数据。而这些数据则可能存储在多个地点的多种不同类型的存储设备上,并发问题将会日益突出。3.3 医疗数据的挖掘利用 当前区域卫生信息平台数据的利用主要分为直接利用和间接利用两大类。直接利用包括信息调阅共享、卫生服务智能提示与诊断辅助,还有各类基于信息共享的业务 协同服务等。间接利用主要是根据卫生行政与管理需求,实现的 BI 统计,绩效分析等。而在企业中, 已有许多开始深入研究医疗数据的 挖掘利用 5,并已经从大数据中找到了与医疗卫生相关的潜在价值, 例如:2009年甲型 H1N1 流感爆发的几周前,谷歌公司成功预测动机流感的传播;苹果公司总裁史蒂夫乔布斯的医生们能够基于他的特定基因组成,按所需效果用药。可以说,医疗卫生系统人员对于服务器中大量的医疗数据利用度不够, 大部分还停留在关注数据的精确性,而非数据关联性的阶段。卫生管理部分每年都投入大量资金,对数据进行维护管理,但是不断增加的数据、设备为政府带来了沉重负担,这些数据的价值还未真正体现出来。3.4 医疗数据的安全保护 正如纳米科技时代的到来一样,任何一项高新技术的发展在推 进社会发展前进的同时,必然会产生一定的负面作用。医疗数据和 应用呈现指数级增长趋势,也给动 态数据安全监控和隐私保护带极大的挑战。媒体曾爆出温州多家医院 信息系统遭黑客侵入,医药信息外泄;央视“315”晚会曝光了罗维邓白氏公司非法买卖公民个人信息事件。卫生信息安全现已存在着“内忧外患”,信息泄露事件造成恶 劣影响,其背后暴露出的政策衔接不到位、管理监督不严格等问题值得关注和反思。大数据时代的到来, 产生新的安全性问题,例如过去不会有数据混合访问的情况,但大数 据的分析需要多类数据相互参考等 问题让人更为担忧。四、医疗大数据应用改进4.1 同步变革数据管理方式庞大的数据量在存储上是一个非常严重的问题,除对网络、硬件、软件进行升级以保证数据存储系统的灵活性,使其能够适应各种 不同应用类型和数据场景之外,闸 北区还在积极探索存储虚拟化技术。以“上海市云计算产业基地” 落户于我区为契机,选取市北医院作为试点,计划在试点成熟的基础上,全区推广。希望通过对虚拟化 技术的充分利用,实现数据的大容量存储和快速处理,并能有效降低管理成本。在数据安全方面,闸北区正在加快推进医疗卫生行业信息安全综合防护体系建设,制定有效的安全保护措施和审计机制;提高信息系统的灾难恢复能力和抗攻击能力;同时,强化安全监督,建立信息安全监控体系;健全信息安全通报制度,完善信息安全应急指挥和应急处置预案。在享受大数据时代带给我们丰收果实的同时通过有效的管理措施防患于未然。4.2 建立完善的区域卫生信息化标准体系逐步以 ISO/HL7 标准化文档传输方式替换原有的以接口对接进行 数据交互的传统方式。在结合国家和上海市卫生信息标准的基础上, 开发统一的标准,形成覆盖领域全 面、系统架构合理的区域卫生信息 化标准体系。以信息标准和技术规 范的形式,提出闸北区区域层面信 息收集、交换和共享以及使用的参考模型、原型、基本数据集、数据 字典等。这些具体标准相互之间有 较高的相容性和一致性,并且能在时间上保持前后的长期连贯性。通过标准化采集的数据能够快速进入平台数据仓库,由数据仓库进行有效梳理,借助数据清洗与转换技术 得以整合,以便之后更好地利用这 些数据。4.3 积极探索利用数据挖掘技术2011 年,闸北区开发并应用了“基于区域医疗卫生共享信息的决策支持系统”,通过数据仓库对海量信息去伪、剔重、过滤,并以丰富的图表形式展示给使用者,系 统应用效果明显,区域卫生机构管理效率和效能得以提高。现有的 BI 虽实现了强大的查询分析功能, 但对共享信息的更深层次挖掘还未涉及。对信息进行归纳性推理和联 想,寻找数据间内在的某些关联, 发掘现时BI所不能发现的、隐含的、有潜在价值的数据已纳入研究计划中。例如:运用各种数据挖掘算 法探求各种疾病之间的相互关系、发展规律,总结各种治疗方案的诊疗效 果,预测未来某段 时间各医疗机构的 病房使用情况、用药情况等等。144.4完善医疗预警机制百度商业市场部总经理陈志峰对大数据的挖掘管理做了一个想象的比喻,他说,电影让子弹飞中有一句经典台词“别急,让子弹飞一会。”子弹在飞与击中目标的过程,以及过程中看客心态,射击者心态,与我们当下的一种环境十分相像:大数据与公共卫生建设。在过去的几年间,大数据技术之于公共卫生就像一颗高速飞出的子弹,一直飞在空中,无法真正为公共卫生提供成熟可操作的解决方案。传统的公共卫生管理中,一般要求医生在发现新型流感病例时告知疾病控制与预防中心。但这种处理方式有一个致命弊端:流行疾病的