欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    面向中文电子病历的NLP关键技术研究.ppt

    • 资源ID:5762493       资源大小:2.33MB        全文页数:39页
    • 资源格式: PPT        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    面向中文电子病历的NLP关键技术研究.ppt

    面向中文电子病历的NLP关键技术研究,2014年4月13日Copyrights 2014 HITAll Rights Reserved,蒋志鹏 关毅哈尔滨工业大学计算机学院xyf-,电子病历(EMR),医务人员在医疗活动过程中,使用医疗机构信息系统生成的文字、符号、图表、图形、数据、影像等数字化信息,并能实现存储、管理、传输和重现的医疗记录,2014年4月13日Copyrights 2014HITAll Rights Reserved,中文电子病历(CEMR),对患者身体状况的半结构化专业描述,2014年4月13日Copyrights 2014HITAll Rights Reserved,中文电子病历(CEMR),医疗大数据每天约800份每月约15000份每年约15万份,2014年4月13日Copyrights 2014HITAll Rights Reserved,中文电子病历(CEMR),2014年4月13日Copyrights 2014HITAll Rights Reserved,目前在CEMR方面展开的研究工作,CEMR句法树库构建,2014年4月13日Copyrights 2014 HITAll Rights Reserved,语法标注规范制定 语法标注结果及分析 高精度词性标注系统,语法标注规范制定,2014年4月13日Copyrights 2014HITAll Rights Reserved,基于PCTB规范进行迭代修订人机互助医生协助一致性评价,语法标注规范制定,2014年4月13日Copyrights 2014HITAll Rights Reserved,规范中一些重要修订 筛选、补充、细化PCTB词性标注规范 例如,“伴有视物模糊”中的“视物”提出适用于CEMR的术语切分方案 PCTB:“吃饭”不切分,“吃梨”“吃桃”切分 CEMR:“持物”“抗凝”是否切分?,以“抗凝”为例:,语法标注规范制定,2014年4月13日Copyrights 2014HITAll Rights Reserved,标注质量控制表1 规范修订前后主要词性歧义项分布表2 前3次迭代分词和词性标注准确率及一致性,语法标注规范制定,2014年4月13日Copyrights 2014HITAll Rights Reserved,分词、词性标注、句法标注规范,语法标注规范制定,2014年4月13日Copyrights 2014HITAll Rights Reserved,标注结果 138份带有词性、句法标签的电子病历 来自神经内科和普通外科 包括出院小结和首次病程记录,语法标注规范制定,2014年4月13日Copyrights 2014HITAll Rights Reserved,CEMR句法树库构建的主要困难:目前没有任何基于CEMR的标注语料各级标注均需要医生的参与不同医疗机构、不同科室病历差异较大,CEMR句法树库构建,2014年4月13日Copyrights 2014 HITAll Rights Reserved,语法标注规范制定 语法标注结果分析 高精度词性标注系统,语法标注结果分析,2014年4月13日Copyrights 2014HITAll Rights Reserved,CEMR文本语言的特点:包含大量专业术语(如“共济运动”、“脑梗死”)、习惯用语(如“伴”、“否认”)及缩略词(如“CT”、“MMR”)常用数字、量词和形容词表示检查结果(如“100/70mmHg”)句子结构不完整,但规律性较强频繁使用并列长句,导致句法结构趋于扁平,语法标注结果分析,2014年4月13日Copyrights 2014HITAll Rights Reserved,通用标注模型效果 词性标注 平均准确率仅为 82.35%,Fig.2a 出院小结各部分标注效果 Fig.2b 首次病程记录各部分标注效果,语法标注结果分析,2014年4月13日Copyrights 2014HITAll Rights Reserved,通用标注模型效果句法分析 F1(auto pos):53.58%F1(gold pos):73.19%,Fig.3a 出院小结各部分标注效果 Fig.3b 首次病程记录各部分标注效果,语法标注结果分析,2014年4月13日Copyrights 2014HITAll Rights Reserved,实验数据:训练集:56份中文电子病历调试集:14份中文电子病历实验结果:,CEMR句法树库构建,2014年4月13日Copyrights 2014 HITAll Rights Reserved,语法标注规范制定 语法标注结果及分析 高精度词性标注系统,系统处理流程,2014年4月13日Copyrights 2014HITAll Rights Reserved111,中文分词与词性标注的联合模型,2014年4月13日Copyrights 2014HITAll Rights Reserved,感知器算法,输入:,训练样本;迭代次数T,初始化:,参数向量,训练过程:,for t=1.T,i=1.n,使用beam search 算法找到当前参数下满足下面条件的标注序列,如果,则更新参数向量,输出:,参数向量,基于转移的错误驱动模型,2014年4月13日Copyrights 2014HITAll Rights Reserved,提出适用于CEMR的转移模板扩展经典的训练算法:1.以转换前为当前词的规则 2.以转换前为条件的规则 3.以转换后为当前词的规则 4.以转换后为条件的规则,实验结果及分析,2014年4月13日Copyrights 2014HITAll Rights Reserved,实验数据:训练集:PCTB语料+110份中文电子病历调试集:14份中文电子病历测试集:14份中文电子病历实验结果,CEMR实体和实体关系语料构建,2014年4月13日Copyrights 2014 HITAll Rights Reserved,实体标注语料规模和科室分布标注语料中实体的统计分析实体标注规范制定实体标注结果及评价,实体标注语料规模,2014年4月13日Copyrights 2014HITAll Rights Reserved,CEMR实体标注语料规模原始语料:2012全年的电子病历,共144230份,来自35个科室,87个子科室已校对语料:3085份中文电子病历,按照上述子科室平均抽取已标注语料:991份中文电子病历,包含为479420个字符,35327个实体,实体标注语料科室分布,2014年4月13日Copyrights 2014HITAll Rights Reserved,CEMR实体标注语料分布,CEMR实体和实体关系语料构建,2014年4月13日Copyrights 2014 HITAll Rights Reserved,实体标注语料规模和科室分布标注语料中实体的统计分析实体标注规范制定实体标注结果及评价,标注语料中实体的统计分析,2014年4月13日Copyrights 2014HITAll Rights Reserved,对比CEMR和开放领域语料的实体密集度开放领域语料:MET-2中的中文新闻语料,共104个文档,CEMR实体和实体关系语料构建,2014年4月13日Copyrights 2014 HITAll Rights Reserved,实体标注语料规模和科室分布标注语料中实体的统计分析实体标注规范制定实体标注结果及评价,实体标注语料构建团队,2014年4月13日Copyrights 2014HITAll Rights Reserved,语料构建团队研究室成员:2名博士生,1名硕士生主要负责标注规范初步制定、实体关系标注参与标注的医生:哈医大四院神经内科医生(硕士)哈医大二院呼吸内科医生(博士)主要负责标注规范修订、实体标注和标注人员培训,实体标注规范制定,2014年4月13日Copyrights 2014HITAll Rights Reserved,实体标注规范制定 实体标注培训,The realization of Chinese interface for UMLS,2023/8/17,2014年4月13日Copyrights 2014HITAll Rights Reserved,实体标注规范制定,CEMR实体和实体关系标注规范,CEMR实体和实体关系语料构建,2014年4月13日Copyrights 2014 HITAll Rights Reserved,实体标注语料规模和科室分布标注语料中实体的统计分析实体标注规范制定实体标注结果及评价,The realization of Chinese interface for UMLS,2023/8/17,2014年4月13日Copyrights 2014HITAll Rights Reserved,实体标注结果,CEMR实体标注样例,The realization of Chinese interface for UMLS,2023/8/17,2014年4月13日Copyrights 2014HITAll Rights Reserved,实体标注结果,CEMR实体关系标注样例,实体标注语料一致性评价,2014年4月13日Copyrights 2014HITAll Rights Reserved,正式标注质量控制,实体标注语料一致性评价,2014年4月13日Copyrights 2014HITAll Rights Reserved,评价标准实体边界匹配实体边界、实体类型匹配实体边界、实体类型、实体修饰类型匹配,其他研究工作,2014年4月13日Copyrights 2014HITAll Rights Reserved,CEMR,PHK,UMLS,个性化健康信息抽取,个性化健康知识表示,个性化健康知识维护,已录用文章,2014年4月13日Copyrights 2014HITAll Rights Reserved,Xinbo Lv,Yi Guan,Benyang Deng.Transfer Learning based Clinical Concept Extraction on Data from Multiple Sources.Journal of Biomedical Informations,2014(SCI 2.131)杨锦锋,于秋滨,关毅,蒋志鹏.电子病历命名实体识别和实体关系抽取研究综述,自动化学报,2014(long)蒋志鹏,赵芳芳,关毅,杨锦锋.面向中文电子病历的词法语料标注研究.高技术通讯,2014,6,谢谢!,2014年4月13日Copyrights 2014 HITAll Rights Reserved,Q&A,

    注意事项

    本文(面向中文电子病历的NLP关键技术研究.ppt)为本站会员(sccc)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开