基于深度学习的机载传感器领域知识图谱构建研究与实现 遥感地质专业.docx
《基于深度学习的机载传感器领域知识图谱构建研究与实现 遥感地质专业.docx》由会员分享,可在线阅读,更多相关《基于深度学习的机载传感器领域知识图谱构建研究与实现 遥感地质专业.docx(33页珍藏版)》请在三一办公上搜索。
1、经历了世界航空维修产业(MRO,Maintenance,Repair&Operations)的高速发展,我国的航空维修产业(MRo)也获得了到了很多发展的契机与挑战。怎样按照自己的发展情况计划好布局和方向,加入该产业的世界化高速发展中成了目前亟待解决的问题。中国的民用航空维修产业第一是要把技术发展放在首位。依托当下热门的大数据研究民用飞机维修方案,以寻求更加合理化的、增强航空器性能的、减少维修成本的方案,是非常有意义的。中国民航所在飞航空器中,大多数采用电传操纵,机载传感器数量、种类众多。以知识图谱为代表的处理关联数据的大数据应用技术是解决机载传感器更好飞机维修方案的方法之一。机载传感器知识图
2、谱构建的核心内容包括实体识别和关系抽取,本文以作者所在MRO企业机载传感器维修日志文本信息为基础,全面探索机载传感器知识图谱识别与关系抽取的理论,进行了以下的研究:(1)在机载传感器实体识别问题中,提出一种基于转换器的双向编码表征(BERT)与双层双向长短期记忆网络(BiLSTMS)与条件随机场(CRF)结合的机载传感器实体识别方法,针对BERT预处理模型对其Positionembedding进行每一个字的标注,再接双层BiLSTM模型,获取更好的上下文表示,结合AttentiOn机制,进行字力度信息获取,减少三层模型带来的庞大计算量,最后在CRF模型的作用下得到序列标注的成果。研究结果显示,
3、和传统的CRF模型相较而言,F值上升了百分之4.03。(2)(2)在机制传感器关系抽取问题中,采用BiLSTM-ATT模型。首先将文本信息中的每个词向量与位置向量进行融合,将其输入BiLSTM模型中,然后引入一层词注意力机制来获取词重要性,减少噪声,最后通过SoftmaX分类输出关系抽取结果。(3)运用Neo4j构建可视化机载传感器知识图谱,并进行数据分析应用。关键词:机载传感器知识图谱,关系抽取,深度学习,实体识别,算法ABSTRACTWiththecontinuousgrowthoftheglobalaviationmaintenanceindustry(MRO,maintenance,r
4、epairandoperation)market,Chinasaviationmaintenanceindustryhasalsousheredinmanydevelopmentopportunitiesandchallenges.Howtomakealayoutplanaccordingtoitsowndevelopmentstatustoadapttothenewwaveofdevelopmenthasbecomeatopicworthyofattentioninthedomesticaviationmaintenanceindustry.Makingfulluseofthedevelop
5、mentofadvancedtechnologyisofgreatsignificancetomycountryscivilaviationmaintenanceindustry.technologyandrelyonthepopularbigdatatostudycivilaircraftmaintenanceprogramstofindmorerationalizedsolutionsthatImproveaircraftperformanceandreducemaintenancecosts.MostoftheplanesflyingbyChinascivilaviationareope
6、ratedbywire,andthenumberandtypesofairbornesensorsarealsonumerous.Thebigdataapplicationtechnologyofprocessingrelateddatarepresentedbytheknowledgegraphisoneofthewaystouseairbornesensorstosolvebetteraircraftmaintenanceplans.Thecorecontentofairbornesensorknowledgegraphconstructionincludesentityrecogniti
7、onandrelationshipextraction.BasedonthetextinformationoftheauthorsMROcompanysairbornesensormaintenancelog,thispaperconductsin-depthresearchontheentityrecognitionandrelationshipextractionoftheairbornesensorknowledgegraph.Themainresearchcontentsinclude:(1) Intheproblemofairbornesensorentityrecognition,
8、Aconverter-basedbidirectionalencodingrepresentation(BERT)combinedwithatwo-layerbidirectionallong-termshort-termstoragenetwork(BiLSTM)andaconditionalrandomfield(CRF)forairbornesensorentityidentificationisproposed.ThemethodistomarkeachwordembeddedinitspositionfortheBERTpreprocessingmodel,andthenconnec
9、tthetwo-layerBiLSTMmodeltoobtainabettercontextualrepresentation.Combiningtheattentionmechanismtoobtainthestrengthinformationofthewords,reducethehugeamountbroughtbythethree-layermodel.Calculatethenumber,andfinallyobtainthesequenceannotationresultthroughtheCRFmodel.TheexperimentalresultsshowthattheFva
10、lueisincreasedby4.03%comparedwiththetraditionalCRFmethod.(2) Intheproblemofmechanismsensorrelationshipextraction,theBiLSTM-ATTmodelisused.Firstly,eachwordvectorinthetextinformationisfusedwiththepositionvector,andinputitintotheBiLSTMmodel.Thenalayerofwordattentionmechanismisintroducedtoobtainwordimpo
11、rtanceandreducenoise.Finally,therelationshipextractionresultsareoutputthroughSoftmaxclassification.(3) UseNeo4jtobuildavisualizedknowledgemapofairbornesensorsandperformdataanalysisapplications.Keywords:airbornesensorknowledgegraph,entityrecognition,relationextraction,deeplearning,algorithm目录第一章绪论11.
12、1 研究背景及意义11.2 国内外研究发展及现状21.2.1 知识图谱发展及研究现状31.2.2 实体识别发展及研究现状41.2.3 关系抽取发展及研究现状51.3 本文的研究内容71.4 本文的组织结构8第二章相关的理论分析与研究92.1 知识图谱构建技术92.1.1 知识图谱的基本概念92.1.2 知识图谱的关键技术102.2 条件随机场模型122.3 词向量模型152.3.1 Word2vec模型152.3.2 ELMo模型162.3.3 BERT模型172.4 深度学习方法192.4.1 卷积神经网络192.4.2 循环神经网络212.4.3 Attention机制242.4.4 Tr
13、ansformer模型262.5 机载传感器实体识别和关系抽取相关研究错误!未定义书签。2.5.1 实体识别相关研究错误!未定义书签。2.5.2 关系抽取相关研究错误!未定义书签。2.6 本章小结错误!未定义书签。第三章基于BERT-BiLSTM-CRF的机载传感器实体识别错误!未定义书签。3.1 基于深度学习的机载传感器实体识别流程错误!未定义书签。3.2 数据预处理错误!未定义书签。3.3 改进的BERT-BiLSTM-CRF模型构建设计错误!未定义书签。3.3.1 字符向量表示层错误!未定义书签。3.3.2 BERT预训练层错误!未定义书签。3.3.3 BiLSTM层错误!未定义书签。3
14、.3.4 CRF层错误!未定义书签。3.4 实验结果及分析错误!未定义书签。3.4.1 实验数据错误!未定义书签。3.4.2 评价指标错误!未定义书签。3.4.3 实验结果与分析错误!未定义书签。3.5 本章小结错误!未定义书签。第四章基于BiLSTM的机载传感器关系抽取错误!未定义书签。4.1 实体关系抽取问题描述错误!未定义书签。4.2 文本结构关系处理方法错误!未定义书签。4.3 机载传感器关系抽取方法错误!未定义书签。4.3.1 特征向量的生成错误!未定义书签。4.3.2 BiLSTMs-ATT模型构建错误!未定义书签。4.3.3 SOftmaX分类错误!未定义书签。4.4 关系抽取结
15、果及分析错误!未定义书签。4.5 本章小结错误!未定义书签。第五章机载传感器的知识图谱构建错误!未定义书签。5.1 知识图谱的构建流程错误!未定义书签。5.2 知识图谱构建错误!未定义书签。5.3 基于知识图谱对机载传感器数据进行分析错误!未定义书签。5.4 本章小结错误!未定义书签。第六章总结与展望错误!未定义书签。6.1 总结错误!未定义书签。6.2 展望错误!未定义书签。致谢错误!未定义书签。参考文献错误!未定义书签。攻读硕士学位期间取得的成果错误!未定义书签。第一章绪论这一章是对此次探索的实验背景和最终意义摘到,还有对这个项目在世界范围的研究情况,结尾在对此次行为的文章内容和文章分布进
16、行说明。1.1 研究背景及意义根据中国民用航空维修产业年鉴2020表示,我国民用航空维修产业要利用好先进技术的发展,把握好对时下应用较多的bigdata、数学建构、区块链、预测性维修、机器人等方面富有创新性的技术,来引领行业“新业态”发展。紧盯前沿高端研发专业化修理技术,如以大数据为依托实现传统维修方式的变革。同时,民用飞机维修方案则是可以直接影响到民用飞机的性能和所费资本的,所以需要重视飞机的维修成本,合理化安排维修方案。研究发现,飞机的维修成本已经跃升为飞机在使用寿命内最大的花销之一,甚至可以相当于飞机购买价格的1.2倍,是飞机使用寿命中花销最大的一项开支。依托当下热门的大数据研究民用飞机
17、维修方案,以寻求更加合理化的、增强航空器性能的、减少维修成本的方案,是非常有意义的。电传操纵(Fly-By-Wire,简称FBW)系统,还被叫做电子飞行控制系统,使用的原理是将驾驶员提出的命令转化为电信号再和飞机的运动传感器的反馈进行一起处理,在经过电脑的程序语言转化之后,用电缆传送的方式传递给操作面作动器,是一种能够绝对控制飞机运行的一类人工飞行操作装置。现在的民航上还在应用的电传操控装置,切却来看大概是20世纪80年代空客公司研发的a30为他的初始模型。那个时候的数字技术也被应用到主飞控装置上,造成了第一台携带机械备份的全电传飞龙装置。如今我国的民用航空大多应用的客机机型,有空客系列和波音
18、系列等等的都使用的操作方式为电传操控,还有马上要投入飞行使用的我国制造的飞机c919同样应用的也为电传系统。电传操纵有传感器数量多、传感器种类多的特点。且根据作者所在公司维修日志数据库资料显示,与传感器相关的维修日志条数众多。本文依托大数据研究机载传感器相关数据信息,是非常有意义的。以知识图谱为代表的处理关联数据的大数据应用技术是解决修复机载传感器一个值得选择的方案。知识图谱为系统化的语言知识储存仓,知识图谱的组成结构主要是以实体为主,再用图像的类型进行展示。知识图谱可以把机载传感器的维修日志数据实现全面分析,把数据信息还有它们之间的联系整合成有用的部分,让信息资源得到更有效的利用。创造机载传
19、感器的一个知识图谱,在通过对相关数据的直接运用,现存信息的理想外推和寻找,得到信息间存在的关系,能够把机载传感器的运行检测方法的精确度和可行性提高。笔者在这里主要探索机载传感器的知识图谱创建的方式与相关技术的路径,可以创造效果更佳的记载传感器维修知识的数据库,使用图像的方法一定会对飞机的正常修复、意外检修和飞机的维修方案起到一个积极的约束作用。同时,国内的MRO大部分负责诸如航线维护、机体大修、航材管理等低利润的业务。部附件修理方面,进入门槛相对较低,企业呈现百家争鸣的状态,但普遍维修能力重复建设,缺乏深度维修能力,关键部件与核心技术受OEM产权保护,维修受限,仍要送修国外。根据本文所建立的知
20、识库,对机载传感器故障种类、故隙次数等要素进行分析,能够有效指导国家对高新技术与小微企业的扶持政策,在确保安全的前提下依据国家政策极大节约维修飞机的总体成本。按照织体系框架和所占领域的不一样,能够把知图谱化成一般突破与特别区域知识图谱。但是我们不能忘记的是它们的性质是没有差别的。总的来说,一般知识图谱的特点是作用对象是所有领域的性质、常识的主观认识强、状态一般是系统化的百科知识、侧重于知识的涉猎领域广、大多是普通用户在进行应用等等的特点。特别区域的知识图谱还被叫做行业知识图谱,较前者言之,特定领域知识图通常被构造为描述某个专业领域的知识。它通常提取特定领域中的特定实体和特定关系,并在此基础上完
21、成语义网络的构建。目前,市场上尚未建立基于机载传感器的特定领域知识图谱,本文进行机载传感器知识图谱的建立具有十分重要的意义。机载传感器的知识图谱,创造的中心部分主要是实体识别与关系抽取等等,这两个部分是创造机载传感知识图谱必不可少的部分。笔者在这里以自己公司的机载传感器相关的文本信息作为实体识别和关系抽取的数据来源,从机载传感器实体识别和关系抽取两个方向开展全面和深入的研究,有效地实现了机载传感器实体和关系的自动提取,为机载传感器知识图谱的构建奠定了重要基础并提供了更好的方法支撑,在机载传感器飞机维修方案制定、修订方面具有重耍的理论意义和实际应用价值。1.2 国内外研究发展及现状1.2.1 知
22、识图谱发展及研究现状在维基百科中,知识图谱的正式术语定义如下:知识图谱是GOOgIe用来增强其搜索引擎功能的知识库。按照维普百科对峙图谱的理解,最早的之图谱是被谷歌在二十一世纪十二年五月份的时候定义的。谷歌公司使用它是因为它可以让谷歌的搜索引擎的相关能力拓展和提升,让用户拥有更好的体验感。谷歌的知图谱最早是在二十一世纪十年,他以freebase网站的服务为基础,捕获与应用维基百科还有和他相像的更多数据发源地,最后创造出了知识图谱。两年过后,谷歌公司对知识图谱下了定义。随即将知识图谱功能引入其搜索引擎,其结果当然是引入的知识图谱功能极大地增强了其搜索引擎的能力,从而可以为用户提供更快、更准确的搜
23、索知识,以及其他相关信息。其他的搜索引擎公司无一不进入了知识图谱的探索领域。就像facebook研发出了facebook社会图表知识图谱,而我们国家的Baidu公司也研发出自己的知心知识图谱还有Sogou公司的智立方知识图谱等等的。经过对知图谱的探索和开发进程,使得它慢慢的被扩展到了其他的行业,就像在AI问答、个性化推送等等的智能信息应用中,知识图谱可以产生巨大的学术和商业价值。近年来,学术界和工业界都建立了自己的知识图谱,根据应用可以将其分为两个主要类别:一种是通用知识图谱,也称为开放领域知识图谱。通俗讲就是大众版,没有特别深的行业知识及专业内容,它通常解决了科普知识和常识性问题,主要用于互
24、联网大规模的搜索、推荐、问答等场景。另一种是行业知识图谱,也称为特定领域知识图谱和垂直领域知识图谱。通俗讲就是专业版,基于对某个行业或子领域的深入研究而定制的版本,主要用于解决当前行业或子领域的专业问题,是目前知识图谱更具价值的研究方向。就目前的研究现状来看,国内外在通用知识图谱的构建方面都取得了重大成果。例如,对于国外的通用知识图谱而言,由CyC公司1984年开始创建推出的典型常识知识“Everytreeisaplant,在PrinCeton大学,的知识科学实验室自20世纪80年代研发的应用在语句消除分歧的Wordnet词典知识库,最后被谷歌公司合并的Mateweb公司,最后得到的freeb
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于深度学习的机载传感器领域知识图谱构建研究与实现 遥感地质专业 基于 深度 学习 机载 传感器 领域 知识 图谱 构建 研究 实现 遥感 地质 专业
链接地址:https://www.31ppt.com/p-5750432.html