大数据环境下医保数据监测和预警平台关键技术研究.docx
《大数据环境下医保数据监测和预警平台关键技术研究.docx》由会员分享,可在线阅读,更多相关《大数据环境下医保数据监测和预警平台关键技术研究.docx(23页珍藏版)》请在三一办公上搜索。
1、科技专项: 科技惠民 计划类别: 科技支撑计划(社会发展) 指南代码: 3140(其他社会事业) 常州市科技计划项目申报书( 科技支撑计划-社会发展 )项目名称: 大数据环境下医保数据监测和预警平台关键技术研究 承担单位: 河海大学常州校区 所在地区: 常州市新北区 单位地址: 江苏省常州市晋陵北路200号 邮编: 213022 项目负责人: 徐绪堪 电话: 13861133668 主管部门: 常州市科技局 申报日期:2013年4月23日常州市科学技术局二一三年 一、立项依据1、本项目国内外科技创新发展概况和最新发展趋势随着常州市社会保障信息系统的广泛应用,特别是医保数据爆炸式增长,积累了海量
2、的历史数据,数据量更是有1.5T之多。这些数据有对医保行业最关键的资金数据,还有尚未被利用的病人信息、医院信息、治疗项目和药方信息等,对这些高关注度民生数据的应用大多停留在录入、查询、修改和简单的统计等数据展现功能。而目前对恶意配药等骗保行为的监管还主要靠人工,面对日益膨胀的数据,仅靠人工检测已明显不能满足需求。所以目前已有的医保系统无法对医保资金进行有效监管,也无法获取病人治疗等规律或变化趋势,由于医保资金涉及范围广、人数多、业务复杂等特点,虽有配药、治疗、费用使用明细等信息,但这些信息没有得到充分利用和发挥效益,难以为人社局制定政策、资金预算和监管提供决策支持。1.1医保数据高关注度和高敏
3、感度医保数据主要涉及社会医疗保险基金征缴和使用,而医疗保险基金是为实施社会医疗保险制度而建立起的专项基金,是给予参保人员基本医疗保障的经济基础。它主要由参保个人及单位所缴纳的医疗保险费组成,并交专门的经办机构统一组织与管理,用于补偿参保人员因疾病所需要的医疗费用医疗保险基金是货币形态的后备资金,是职工的“保命钱”。常州医保系统依据的医保政策及各种待遇极其复杂,主要包括职工医疗保险、居民医疗保险、低保二次补助、大病救助等,。医保数据直接关系到常州广大群众“治病救命”的切身利益,同时也关系到常州国计民生和社会稳定,对平稳安全运行保障要求极高。因此研究医保数据监测和预警显得非常必要。医保数据监测和预
4、警是一项以防范和控制医保基金运营风险为目标的复杂且长远的课题,其涉及参保人员,各级医疗机构,医生体系,定点药店等多方面,人力资源和社会保障信息中心拥有所有参保人账户信息,医疗机构信息,药店和药品信息等等,同时还维护了所有参保人就诊、购药等海量实时数据信息。医保数据监测和预警的关键问题在于如何从海量数据中获得有价值的信息,从而指导医疗保险政策决策,提高医疗效果和管理效率。目前国内医疗保险信息化已经逐渐完善,数据库和数据仓库技术对医疗保险实时交易数据和历史数据的存储起到了重要作用,在医疗保险信息化过程中操作型数据库记录了大量详细的医保相关的交易信息,并通过每日更新至数据仓库,数据仓库保存海量的历史
5、数据,并维护数据的准确性,通过对数据仓库的统计分析等操作可以生成业务报表,然而随着业务需求的不断扩大,对运营决策支持需求日益强烈背景下,简单的报表己经不能满足需要,医疗保险机构的决策者和医保基金运营监管人员希望能够从海量数据中获取更多的知识,以辅助决策和监管,维护基金的稳定运营。1.2最新大数据发展趋势大数据能够成为可用的资源得益于大数据处理技术的出现。计算机历史前五十年主要是利用人们专门收集的数据,这些资料被视为资源,而现在计算机开始关注工作流程中顺带积累的超大规模数据,无处不在的信息设施不停地记录了人们行为的信息痕迹,利用大数据技术能够分析这些信息痕迹,从中提取重要信息以减少对环境认识的不
6、确定性,提高工作与生产效率。大数据已成为新时期人类可开发利用的重要资源,以美国为代表的发达国家已经开始把大数据的利用与大数据技术的开发视为国家一项战略性任务。目前,我们已进入大数据时代,科学研究的主导方式已经从逻辑驱动、实验驱动转向了数据驱动的研究范式。数据就像货币、黄金以及矿藏一样,已经成为一种新的资产类别,我们认为,大数据必将在我国国民经济中成为一个重要产业。美通社最新发布的大数据市场:2012至2018年全球形势、发展趋势、产业分析、规模、份额和预测报告指出,2012年全球大数据市场产值为63亿美元,预计2018年该产值将达483亿。2012年,美国政府拨款2亿美元启动“大数据研究和发展
7、倡议”计划。IBM、微软、谷歌等国外IT巨头早已嗅到了“大数据时代”的商机,这些国际巨头借助自己拥有领先技术和丰富资源,以及稳定的大客户群,实力雄厚,率先涉足。我国互联网数据中心(IDC)对中国大数据技术和服务市场2012-2016年的预测与分析指出:该市场规模将会从2011年的7760万美元增长到2016年的6.17亿美元,未来5年的复合增长率达51.4%,市场规模增长近7倍。在国内,大数据正在引起越来越多的企业关注。不但阿里巴巴、腾讯等把大数据当成近期的重点项目。作为国内互联网产业的发源地和创新高地,中关村也在抢抓大数据发展机遇,着手布局大数据产业。工信部发布的物联网“十二五”规划上,把信
8、息处理技术作为四项关键技术创新工程之一被提出来,其中包括了海量数据存储、数据挖掘、图像视频智能分析,这都是大数据的重要组成部分。而另外三项信息感知技术、信息传输技术、信息安全技术,都与“大数据”密切相关。适逢世界走向数据化,迈入大数据时代的时刻,我们迎来了新的机遇,在这个新一轮产业发展中,医保作为国家、省以及常州市重点民生工程领域,我们应该如何应对?如何开发利用大数据抢占竞争制高点? 如何使未来大数据产业在常州医保监控、管理和预警等方面快速、健康和领先发展?大数据在医保领域应用是新一代信息技术的集中反映,是一个驱动性很强的服务领域,能有效解决大数据及医保领域的技术问题。1.3本项目国外技术发展
9、概况数据挖掘(DataMining,简称 DM)技术是用于发现潜在数据信息和隐藏模式的技术。该技术最早出现于 20 世纪 80 年代后期,是机器学习、模式识别、数据库、统计学以及管理信息系统等多学科研究成果的交汇,其在 90 年代有了飞速的发展,曾被认为是未来对人类产生重大影响的 10大新兴技术之一。全球研究数据挖挖掘比较著名的大学和研究机构有:麻省理工学院,ACM(ACM Special Interest Group on Knowledge Discovery in Data and DataMining)等。典型数据挖掘系统有:IBM Intelligent Miner、SAS Ente
10、rprise Miner、SPSS Clementine 及 Oracle Data Mining 等。数据挖掘技术起源于上个世纪的八九十年代,在西方发达国家首先得以推广运用。在金融、电信、商业和保险界等拥有大量客户数据的领域得到了成功的应用。目前数据挖掘的产品较多,但主要是国外的产品。例如SAS公司的SAS Enterpriser Miner,SPSS 公司的SPSS系列产品,IBM公司的Intelligent Miner, Microsoft公司的SQL Server 2008等。数据挖掘在国内外医疗保险行业的应用案例同样也很丰富。国外的商业保险公司中常使用定向营销为不同的客户制定相应的营
11、销策略,还有客户忠诚度分析,客户流失分析,保险产品的交叉销售等等使用的数据挖掘技术也多样化。IBM研究中心的Marisa等人基于澳大利亚医疗保险机构采集的数据,将关联规则和神经分割技术应用于医疗保险信息系统中,从GB级的数据中获取未知模式。MohitKumar等使用数据挖掘和机器学习技术预测和预防保险公司在处理医疗保险申诉过程中的支付错误,用以降低日益增长的医疗保险开销。还有许多数据挖掘方法研究集中在医疗保险行业的异常和欺诈检测。1.4本项目国内技术发展概况我国社会医疗保险起步较晚,数据挖掘技术在保险欺诈检测中的应用较少,同时与国外的医疗保险面临的欺诈问题也存在诸多差异根据研究,当前我国医疗保
12、险的欺诈可能涉及的主体有参保人,定点医院,定点药店,医保经办机构等多方面,存在的欺诈方式多样:如在征缴保费时参保人出现少报或漏报,在支付保费时的超支或套现行为,此外还有保险基金管理机构的资金挪用等。目前,国内对医保基金的风险相关研究主要集中于由于道德风险带来的基金风险及控制医疗费用增长的具体方法上,采用的手段较为简单,往往是人工控制,辅助以简单规则的数据筛选。缺乏系统、全面的医保基金风险控制框架,缺乏强有力的数据分析和系统的支持。上海市医疗保险信息中心秦德霖基于 SOA 和动态数据仓库技术,利用数据挖掘和分析技术,针对基金运行管理的主要环节和基金风险的主要因素,建立对医保基金风险防控基础技术平
13、台。该平台实现实时数据抽取、海量数据的整合、异构平台的集成。上海医保基金风险防控平台的研究,为控制医保基金的风险、保障基本医疗、促进医疗保险可持续发展提供强有力的支撑。在医保管理过程中,存在一种特殊的就医现象,称之为就医聚集行为。就医聚集行为通常表现为多张医保卡过于频繁地同时同地消费。就医聚集行为可能是由于某些特殊病症人群如某些慢性病人群造成,也有可能存在欺诈行为。找出这些具有就医聚集行为的人群,一方面能够对特殊疾病人群提供针对性的管理和服务,另一方面能有效提高对违规人群的监督力度。复旦大学何俊华基于 CBM 算法,开发出 B/S 结构的一致行为挖掘平台,该平台能够有效地对一致行为进行监控。并
14、将一致行为与参保人费用记录的信息,药品使用情况,医院医生信息等相关联。通过一致行为挖掘平台,在医保管理中能迅速锁定慢性病人群,了解这些特殊人群的医疗费用负担等情况。挖掘平台为医保管理决策提供参考,便于为不同参保人群提供针对性的管理和服务。此外,该平台能有效检测出可疑违规人群,这类可疑违规人群可能同时使用了多张医保卡进行就医,针对这些可疑违规人员,需要对其进行严格监管。石萌利用数据挖掘的关联分析方法,对社会医疗保险基金收支情况进行了研究,深入分析了参保人员、参保单位、医疗单位等各因素对社会医疗保险基金平稳运行的影响,为社会保障部门适时调整基金收缴政策、确保医疗保险制度的顺利实施提供有力的技术支持
15、。国防科学技术大学朱攀利用人工神经网络模型对医保定点医疗机构的信用等级进行学习,并且根据学习过程中出现的问题,对人工神经网络做了改进,克服了医保定点医疗机构信用等级评价网络原有的不足。并以医保信息系统形成的大量数据为基础,利用LOF算法对大量数据进行挖掘,找出了医保定点医疗机构的违规行为。翁滔华等通过利用数据挖掘软件SPSS11.0对病毒性肝炎的住院费用情况进行分析,并分别给出了病毒性肝炎费用控制的上下限,发现能能起到控制医院的住院费用的作用。黄晶晶等利用数据挖掘技术制定医保定额指标并进行相关数据的分析,结果发现数据挖掘技术能够制定动态的定额指标,加快分析反馈的速度,并做出及时的分析返溯。综上
16、所述,国内对医保人群医疗费用的分析研究还处于起步阶段,方法与手段一般, 研究结果尚不科学全面;国外有不少相关的产品,由于国外医保制度与我国的医保制度差别很大,不能直接采用;另外,这些系统但大都是专有产品并且价格高,难以集成。国内关于医保人群医疗费用分析的研究,大都采用订立措施制度和传统半手工方式进行。不少单位制定相关规定和制度进行管理,这些规定和制度大都是针对医保政策和现有的医院管理条文,结合医保进行修改的结果;或者,各医院针对控制定额费用情况,进行大量的数据采集及统计,制作医保分析报表并利用该报表对当月医保费用进行分析,由于均采用手工与信息系统的结合方式,对于超定额费用考核方面明显滞后,也难
17、以对医保各方面进行灵活的详细分析,进而无法及时分析产生各种异常情况的根本原因,亦不利于监控实时费用,没有解决医保病人医疗费用的不断上涨的根本问题,更谈不上对医保预算和预警。因此,本课题拟采用先进的关系挖掘模型技术,分析常州医保现状,开发医保数据监测和预警模型。2、本项目研究的目的、意义2.1 项目研究的目的项目以常州市人力资源和社会保障信息系统中医保海量数据为研究对象,以提高医保资金使用效率为目的,通过静态的社会保障知识与动态的社会保障决策相结合方式,借助数据挖掘模型和联机分析理论和算法,对医保征收和使用等海量数据进行联机分析和数据挖掘研究,寻求医保资金使用网络、病人诊治规律以及医保资金回溯和
18、跟踪,对医保中心各定点医疗机构的监管、各种疾病的常用治疗方案提供数据支持,以实现对医疗单位和参保人精细化管理。最终为市社会保障部门具体政策的合理制定及市政府的宏观决策提供科学的依据,从而可以精确控制社会保障部门的决策过程,加强社保决策过程的信息化,保证决策过程的科学性、合理性和有效性。2.2 项目研究意义常州市医保数据涉及范围广、人数多、数据庞大、业务复杂,是市民高关注度和敏感的数据,因此对医保数据监测和预警研究具有社会、学术和经济三个层面的价值和意义。(1)社会层面医疗保险是社会保障制度的重要组成部分,涵盖的参保人总多,其中核心就是医保数据,例如常州市参加职工医疗保险、居民医疗保险等的参保人
19、数就超过100万人,使用好数据挖掘对众多的参保人进行有效的管理,掌握参保人的概况,群体特征和变化等信息对于医疗保险机构的管理和决策具有很高的参考价值,不仅是国家、省、市等政府部门制定政策预计影响范围和程度,也是一项民生工程,为医保管理决策部门和医疗机构提供科学可行的建议,对科学合理地利用现有医疗资源,控制医保医疗费用的上涨,尽量减少群众的经济负担,构筑一个和谐的医、保、患关系,促进关系千家万户的民生与幸福的医药卫生体制改革顺利进行和实现,都具有非常重要的社会和现实意义。(2)学术层面本项目涉及统计学、公共管理、计算机技术等多个学科交叉,通过对常州医保海量数据分析,丰富社会经济统计理论,有助于在
20、医保领域探讨不同的数据挖掘算法和实践应用。通过在常州医保监测和预警中的应用,不断优化数据关联规则和挖掘算法,提供较好的数据支撑。(3)经济层面通过对医保数据监测和预警,可以从系统角度对医保过程中治疗、资金合理使用等在线监测,有效避免恶意配药等不合理行为,提高市民治病的治疗效果;同时通过预警预测技术分析医保资金使用情况,有助于提高医保资金预算精确度和资金使用效率,最终为常州市医保资金预算和高效使用提供数据支撑,间接地为政府和市民节约医保费用。3、本项目研究现有起点科技水平及已存在的知识产权情况河海大学常州校区与常州市人力资源和社会保障信息中心双方不断探讨、沟通,明确系统总体目标和思路,并开展了前
21、期调研,掌握目前常州市医保数据现状和亟待解决的监测和预警问题。通过研究和积累,课题组已获得获软件著作权8件,出版基于模糊信息的多属性决策方法研究及应用、生态视角下企业管理与信息系统匹配研究两本专著,相关学术论文12篇。4、本项目研究国内外竞争情况及产业化前景在商业智能的研究和应用不断发展的同时,我国政府部门对于数据分析工作越来越重视,开始对数据仓库技术有了一定的需求。就社保领域而言,相关的研究虽然不多,但已不断的开始出现,是一种发展必然趋势,是本项目产业化的基础和前提。预计到2014年,我国六十岁以上人口将达到2亿,2026年将达到3亿,成为超老年型国家。与年轻人相比,老年人的患病率和人均医药
22、费用均较高,并且多患有慢性非传染性疾病,疗程长、预后差、费用大。这将进一步加剧社会医疗保险的支出压力,因此有必要对医疗保险基金运行平衡做长期的测算,提前进行预警,本项目具有广阔的应用范围。二、研究内容1、具体研究开发内容和要重点解决的关键技术问题;针对医疗保险业务中的各项数据进行分析计算,利用计算机网络技术和数据仓库与数据挖掘技术对参保单位、门诊费用、住院费用等多年数据进行采集、转换、聚合或重用,提出了一套科学、合理、符合实际需求的多维数学模型,旨在分析不同病因、不同病种随年龄变化的趋势,掌握人们随年龄增长的平均健康状况,从而为医疗保险政策指标的制订提供依据,如下年度基本医疗保险费的测算、医保
23、费用补偿比的合理确定、个人帐户随不同年龄段计提比例的合理确定等,并据此建立医保数据监测和预警模型,首先自动提取医保业务数据,构建数据仓库,进行多维分析测算,并用各种图表形式来反映结果。这为政府各相关部门确定保障金制度及比例,拓宽医疗保障的范围,为医保资金预算和监管提供直接的科学依据。项目具体研究开发内容主要包括监测和预警数据的准备、医保数据抽取与分类、算法选择与改善、医保数据仓库设计、医保数据再组织和分析、监测和预警模型构建以及医保数据展现等。项目总体结构如图1所示。1.1监测和预警数据的准备对医保数据分析目的是提高医保资金使用效率,通过对海量的医保大数据进行分析,寻求医保资金使用网络、病人诊
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 环境 医保 监测 预警 平台 关键技术 研究
链接地址:https://www.31ppt.com/p-1906398.html