2023知识图谱互联互通白皮书.docx
《2023知识图谱互联互通白皮书.docx》由会员分享,可在线阅读,更多相关《2023知识图谱互联互通白皮书.docx(337页珍藏版)》请在三一办公上搜索。
1、知识图谱互联互通前言IV第一章知识图谱互联互通的背景1一、技术层面1(一)基础共性技术问题1(一)行业应用技术问题3二、产业层面6三、政策层面11(一)国际层面11(二)国家层面17(三)行业政策层面23第二章知识图谱互联互通的内涵与外延27一、知识图谱互联互通的内涵27(一)定义27(二)知识图谱互联互通互操作等级31二、知识图谱互联互通的外延33(一)存在的利益相关方33(二)潜在的影响35第三章知识图谱互联互通的任务与约束39一、互联互通的模式39二、互联互通的活动构成41(一)活动流程框架41(二)任务流构成42三、互联互通的质量评估维度45四、互联互通的实现类型46五、互联互通约束条
2、件50(一)技术层面约束条件50(二)非技术层面约束条件53第四章知识图谱互联互通的典型应用场景56一、知识融合与计算56二、知识联合检索61三、知识发现66四、知识生成73五、综合应用服务79第五章知识图谱互联互通的实践案例91第六章互联互通的难点与挑战93第七章知识图谱互联互通的统一架构108一、知识图谱互联互通架构108(一)互联互通交互模型108(二)互联互通逻辑架构113(三)知识消息描述与处理框架115二、知识图谱互联互通安全保障128第八章面向知识图谱互联互通的知识表示框架132一、整体表示框架132二、知识表示规范化133(一)概念模型133(二)实体模型134(三)事件模型1
3、35三、谓词表示规范化135(一)谓词框架136(一)实体谓词规范化136(三)谓词结构规范化137(四)谓词语义规范化137四、知识交换格式表示规范化137第九章面向知识图谱互联互通的本体模型注册流程142一、本体涵义及其分类142二、本体构建工具142三、本体模型构建流程143四、开放本体模型注册流程145(一)总体原则145(二)注册流程146(三)注册平台结构147(四)本体模型实例148第十章基于知识图谱互联互通的知识融合与知识计算流程150一、基于互联互通的知识融合流程150(一)知识融合分类150(二)知识融合流程151二、基于互联互通的知识联合查询/计算流程153(一)概述15
4、3(二)知识联合查询/计算流程154(三)任务构成155第十一章展望与建议159一、技术发展展望159(一)知识图谱互联互通支持大规模预训练模型的发展159(二)知识图谱互联互通支持智能问答/对话的发展166(三)知识图谱互联互通支持智能内容生成的发展169(四)知识图谱互联互通支持智能推荐的发展172二、政策支持建议175(一)国家政策支持175(二)行业政策支持177三、标准化需求建议178Il四、产业推广措施建议179附录A:知识消息编码示例182一、基于段的知识消息编码182二、基于XML的知识消息编码183附录B:知识图谱互联互通的实践案例详情187一、智慧纪检:知识共享实践案例18
5、7二、智慧纪检:知识关联分析实践案例192三、智慧金融:反洗钱实践案例198四、智慧金融:声誉风险金融知识融合实践案例202五、智慧金融:金融领域知识图谱数据和服务融合案例208六、智能金融:新一代银行知识管理系统214七、智慧金融:金融机构客户尽职调查222八、智慧能源:油气勘探开发知识中心230九、智慧医疗:共享平台实践案例238十、智慧医疗:智能医保审核实践案例249十一、智慧医疗:基于知识图谱的医药智能知识平台254十二、智能通信:知识共享实践案例259十三、智慧情报:智慧情报知识图谱互联互通实践案例266十四、智慧情报:科技情报智能分析与监测实践案例269十五、智慧汽车:智能售后服务
6、实践案例280十六、智慧能源:电力设备缺陷知识图谱知识共享实践案例285十七、算力:服务器智能运维知识互联互通实践案例293十八、智慧家居:家电知识互联互通实践案例301十九、智慧城市:新型基础测绘知识图谱互联互通实践案例309二十、轨道交通:智能运维知识互联互通实践案例313-JUL.1刖三尊敬的读者:我们很高兴向您介绍知识图谱互联互通白皮书。本白皮书旨在探讨知识图谱互联互通的重要性和实现方法,以及它对于推动人工智能技术发展和应用的意义。知识图谱是人工智能技术的重要组成部分,它是将各种数据和信息进行结构化、标准化、语义化处理后形成的一种知识表示形式。知识图谱的建立和应用可以帮助我们更好地理解
7、和利用数据,从而推动人工智能技术的发展和应用。然而,由于不同领域、不同机构、不同国家之间的数据格式、标准、语义等方面存在差异,知识图谱之间的互联互通面临着很大的挑战。本白皮书旨在探讨这些挑战,并提出了一些实现知识图谱互联互通的方法和建议。我们希望,本白皮书能够为各位读者提供有价值的思路和启示,推动知识图谱互联互通的实现,进一步促进人工智能技术的发展和应用。祝愿您阅读愉快!知识图谱互联互通白皮书编写组注:该前言由ChatGPT生成。由于知识图谱技术发展迅速,白皮书编制时间和作者学识限制,恐有纸漏或不严谨之处,敬请谅解和批评指正。编写组成员单位名称参编人员中国电子技术标准化研究院郭楠、韩丽、李瑞琪
8、、李湘、胡成林、陈艳利东软集团股份有限公司、沈阳东软智能医疗科技研究院有限公司王伟光、汤一凡、赵耕弘、蔡巍深圳市矽赫科技有限公司洪鹏达、洪宝璇、林叠守蚂蚁科技集团股份有限公司郭智慧、梁磊、周俊、廖博森郑州中业科技股份有限公司李介、张恒星、刘向宇网智天元科技集团股份有限公司贾承斌、艾青中国医学科学院生物医学工程研究所蒲江波、姚博、李婷北京智通云联科技有限公司高艳、谭培波、张学龙北京京航计算通讯研究所宋明艳、马静、白洋、姚帅中电科大数据研究院有限公司曹扬、王华、蔡惠民、闫盈盈、熊子奇华为云计算技术有限公司薛海威、周玉晶、金斌斌中译语通科技股份有限公司陈自岩、程国艮、彭旋中国电力科学研究院有限公司马
9、震媛、张英强、何可嘉、谈元鹏中国电子科技集团公司第十研究所崔莹、代翔中国兵工物资集团有限公司吴波、张炬通深圳工业总会黄永衡中国电子科技集团公司第二十八研究所严红上海合合信息科技股份有限公司徐升上海市人工智能行业协会王逸浩、陈曦、钟俊浩中国医学科学院医学信息研究所李姣、吴萌星环信息科技(上海)股份有限公司伊人、杨一帆、唐剑飞、夏正勋河北大学张彬北京中企智造科技有限公司蔡志伟、张燕之江实验室王海涛广州拓尔思大数据有限公司马谅、岳松深圳市洲明科技股份有限公司白莹杰富泰华工业(深圳)有限公司张学琴、史晶浙江创邻科技有限公司周研、马超昆明市儿童医院刘晓梅、敖凌翔北京海致星图科技有限公司杨娟、邵伯仲、熊蕙
10、国际商业机器(中国)有限公司(IBM)程海旭、陈栋、孙腾北京大学医学信息学中心于娜、李毅泰瑞数创科技(北京)股份有限公司刘俊伟、王金兰、罗伊莎浙商银行股份有限公司陈嘉俊、钟礼斌、汪雷领美的集团(上海)有限公司牟小峰、蔡亚森重庆警察学院刘彦飞云知声智能科技股份有限公司史亚飞、刘升平北京文因互联科技有限公司张玉洁、余姗、段文静、贺余龙超聚变数字技术有限公司吴施楷、梁永贵同方知网数字出版技术股份有限公司尹青云、刘剑兰海乂知信息科技(南京)有限公司胡芳槐、李一斌南瑞集团有限公司高若寒、于聪、张万才、施雨、石超中国南方电网有限责任公司超高压输电公司李强达观数据有限公司王文广、贺梦洁暗链科技(深圳)有限公
11、司吴刚、蔺静茹深圳思谋信息科技有限公司刘枢、张驰、陈鹏光嘉信达资产管理有限公司吴凯棋、童庆广州柏视医疗科技有限公司颜子夜绿盟科技集团股份有限公司袁军、顾杜鹃中电莱斯信息系统有限公司宋文韬山东亿云信息技术有限公司李成梁各章节编辑:第一章中国医学科学院生物医学工程研究所蒲江波第二章郑州中业科技股份有限公司李介第三章北京京航计算通讯研究所马静第四章北京中企智造科技有限公司张燕第五章深圳市矽赫科技有限公司洪鹏达、洪宝璇第六章中国电力科学研究院有限公司马震媛、张英强第七章沈阳东软智能医疗科技研究院有限公司王伟光第八章蚂蚁科技集团股份有限公司郭智慧第九章中电科大数据研究院有限公司闫盈盈第十章华为云计算技术
12、有限公司薛海威第十一章网智天元科技集团股份有限公司贾承斌附录深圳市矽赫科技有限公司洪鹏达、洪宝璇星环信息科技(上海)股份有限公司唐剑飞Vl,个知识图谱互联互通第一章知识图谱互联互通的背景一、技术层面(一)基础共性技术问题1、知识多样性知识资源是通过智力劳动发现和创造的,进入经济系统的人类知识。现今,知识己经成为社会变革的核心。每个人的发展、组织结构和形态的变化、社会生活方式,甚至包括人们的价值观念,都需要从工业时代机械的方式向有利于知识潜力的开发方式转变。知识不等同于信息,而是从噪音中分拣出来数据,转化为信息,升级为知识。这是信息从无序到有序的管理和分类过程I(图1-1)。在广义上,数据要素包
13、括知识资产和知识要素等,在数据驱动时代,数据要素的价值越来越被重视。通过收集、存储和分析数据,可以发现其中的模式、趋势和关联性,进而提取知识并应用于实际问题中。知识资产和知识要素在数据中扮演着重要的角色,帮助组织和个人做出更明智的决策,创造更大的价值。图1-1从数据到智慧的层次等级知识资源的类型多种多样,涵盖多个行业、领域并体现了学科间的交叉融合。其中,显性知识是可以明确、清晰地表达和传递的知识,它是形式化和结构化的,易于记录、编码和共享的知识形式,通常以文字、图像、音频、视频等可见或可感知的形式存在。显性知识可以通过书籍、,叶继元,成颖.情报的概念及其与信息链、DIKW链的关系探讨J.中国图
14、书馆学报,2022,48(04):39-51.文件、数据库、培训课程等形式进行传递。科学原理、法律条款、技术规范等都属于显性知识。这种知识相对容易被传递和学习,可以通过教育和培训来获取。与显性知识相对,隐性知识往往是直觉性的、难以定义的、主要基于经验的知识,是个人经验、洞察、直觉、技能和专业知识的一部分,通常是非结构化的、内化于个人思维和行动方式中的知识。隐性知识难以用语言或符号直接表达。例如,骑自行车、游泳、驾驶汽车等技能都属于隐性知识。转换隐性知识为显性知识的过程称为知识转移或外显化。显性知识和隐性知识相互依存,共同构成了知识的完整体系。合理管理和整合这两种知识类型对于组织和个人的发展和竞
15、争力提升至关重要。在企业的发展过程中,涉及到各种不同类型和不同模态的知识,包括业务系统数据、公司制度文档、合同文档、标准规范等。这些知识在组织内部以及与外部环境的互动中起着关键作用。然而,随着企业发展,这些知识不断增加,对知识管理提出了挑战。另外,这些知识往往分散在不同的地点和业务系统中,没有进行有效的挖掘和关联,降低了知识的可利用价值。这导致了知识的孤立和碎片化,使得企业无法充分利用这些宝贵的资源。因此,有效的知识管理变得至关重要。它涉及对知识进行收集、整理、存储、分析和共享的过程。通过建立知识管理系统,企业可以将分散的知识整合起来,建立知识库或知识图谱,以便更好地组织和查找知识,提高知识的
16、可访问性和可利用性,促进跨部门和跨系统的知识共享和合作。同时,采用技术手段如数据挖掘、自然语言处理和人工智能等,可帮助企业发现隐藏在大量数据和文档中的知识,提供洞察和决策支持。通过实施知识管理,企业可以更好地利用各种类型和模态的知识,加强内部的学习和创新能力,适应快速变化的商业环境,提高竞争力。2、知识适用性/b知识图谱互联互通,知识是在具体场景下的应用,知识不一定放之四海皆准。适用性是指知识在不同场景和情境中的适用能力。适用性是依赖于领域的,适用性越高的知识信息能得到越广泛的应用。知识图谱帮助企业自动构建行业图谱,摆脱原始的人工输入,可以应用于智能搜索、文本分析、机器阅读理解、异常监控、风险
17、控制等场景,达到真正的智能和自动2。3、知识归一化为了实现知识体系的互联互通,需要对多种渠道来源和不同行业领域的知识进行归一化。知识的归一化是指通过汇聚、组织和融合有效资源,使用匹配规则或相似度等方式对不同信息进行对齐。这可以通过建立信息名称库来实现,将抽取的信息统一对应到库中,并统一表述方式。归一化的主要原因是知识库中存在实体的同义词、同义异形、简写、缩写等情况,而实体归一化后,具有相同或相近意义的实体将映射为知识库中的统一实体。实现语义的互操作性是知识体系互联互通的另一个关键。这意味着通过使用一套通用标准,各个系统能够自主交换和整合具有普遍意义的数据。在语义化的过程中,数据被赋予了一种正规
18、的通用表示方法,使其能够描述自身的含义。数据的消费者可以通过查找特定的词汇表来从数据中获取真正的含义。这些通用的表示方法主要围绕知识图谱展开,包括本体、RDF(资源描述框架)和语义图等。通过归一化和语义互操作性,不同来源和领域的知识可以更好地交流、整合和共享,从而促进知识的传播和创新。这为企业和组织提供了更广阔的知识基础,加强了合作和决策的基础,推动了业务发展和创新的进程。(二)行业应用技术问题1、知识孤岛知识孤岛是指在组织中由于信息资源得不到有效的交叉融合,知识2金岩.网络信息计量学方法研窕D中国科学院文献情报中心,2001.板块之间相互割裂而形成的无序状态,仿佛大海中的一个个“孤岛”。在我
19、国,当前存在许多“知识孤岛”的现象。社会中知识共享性、知识扩散性、知识传播性、技术扩散性和网络创新性都不发达,部门所有、地方所有、单位所有、条块分割、各自为战,“创造”了一个个“科研知识孤岛”、“产业群知识孤岛”和“企业知识孤岛”等。大学虽然知识丰富,却同当地经济、企业联系不强,以基础性知识文化传播为主,校企合作性差,知识产业化水平低。行业之间、机构之间和部门之间或多或少存在着信息和知识孤岛,而知识孤岛直接导致机构整体利益受损、效率低下、透明度差和资源浪费。在市场经济中,企业要适应市场的变化,快速调整战略并采取协调行动,必须具备有较高透明度的知识交流系统。面对知识孤岛所造成的瓶颈,必须实现知识
20、关联:通过知识求助和协作,整合来自组织内外的专家经验和最佳实践等,实现知识互联互通。然而,大多数企业的数据信息往往只停留在归档整理阶段,未能得到充分的挖掘和利用。孤岛现象是企业和政府部门在信息化、数字化发展过程中普遍存在的,通常可分为物理性和逻辑性两种形式。物理性的孤岛指的是数据在不同部门之间相互独立存储和维护,彼此之间缺乏互联互通,形成了物理上的隔离。逻辑性的数据孤岛则是指不同部门从各自的角度理解和定义数据,导致相同的数据被赋予不同的含义,增加了跨部门数据合作的沟通成本。在许多传统行业中,专家经验传承通常仅限于口述传递,未能有效沉淀。而员工离职、调动往往会导致专家经验和企业专业知识的中断或缺
21、失。此外,企业员工普遍缺乏知识共享意识,文档和案例难以有效传递,知识难以被有效复用,进一步形成了知识孤岛。随着企业的不断发展壮大,档案资料不断膨胀,相关数据未能及时更新,进一步加剧了孤岛效应。解决数据孤岛问题需要企业采取积极的措施。这包括建立统一的数/b知识图谱互联互通据管理平台,促进部门间的数据共享和协作,制定统一的数据标准和定义,以及推行知识共享文化,鼓励员工之间的交流和合作。同时,利用先进的技术工具,如数据挖掘和人工智能,可以帮助企业发现和利用数据中的潜在价值。通过打破数据孤岛,企业可以更好地利用自身的信息资源,加强内部协同和创新能力,提高决策的准确性和效率,从而在竞争激烈的市场中获得竞
22、争优势。2、知识标准化标准化的目的是为了在既定范围内实现最佳秩序,促进共同效益,并确立共同使用和重复使用条款以及编制、发布和应用文件的活动。随着知识经济时代的到来,知识管理的重要性和复杂性不断增加,如何有效地促进不同行业和部门之间的知识共享成为知识管理的核心主题和目标。知识管理的目标在于实现知识的共享和创新,因为只有通过共享,知识才能不断创新,产生更大的价值。在知识共享的过程中,知识体系向着标准化的方向发展。标准化在知识管理中具有重要作用。知识图谱是一种将知识以图形结构的形式进行建模和表示的方法。它通过连接不同的知识元素,形成一个网络,使得知识之间的关系和联系得以清晰展现。通过标准化的方法,可
23、以对知识图谱中的知识进行统一的表示、分类和交互,从而实现不同行业、不同部门之间的知识互联互通。标准化可以确保知识的一致性和可共享性。通过制定统一的标准,不同的组织和个体可以使用相同的语义和结构来表示和交流知识。这样,知识图谱中的知识可以在不同系统和平台之间无缝地共享和集成,避免了信息孤岛和数据隔离的问题。此外,标准化还有助于推动知识创新和发现。通过建立共享的知识标准,不同行业和部门之间可以更加便捷地发现和利用彼此的知识,促进知识的交叉融合和创新。标准化还可以促进知识的持续更新和演化,使得知识体系能够与时俱进,适应不断变化的环境。因此,通过知识图谱的标准化互联互通,可以实现知识共享、知识创新和知
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 知识 图谱 互通 白皮书
链接地址:https://www.31ppt.com/p-5898926.html