第四讲元数据课件.ppt
《第四讲元数据课件.ppt》由会员分享,可在线阅读,更多相关《第四讲元数据课件.ppt(136页珍藏版)》请在三一办公上搜索。
1、2022/11/29,信息管理系,1,第四讲 元数据,2022/11/29,信息管理系,2,元数据(MetaData), 就是“描述数据的数据”或“关于数据的结构化数据”。哈佛大学数字图书馆项目定义: 元数据是帮助查找、存取、使用和管理信息资源的信息。,一、元数据概念,2022/11/29,信息管理系,3,具体: 元数据是用来描述数据本身的内容特征和其它特征的数据, 目地是加强对网络信息资源的发现、识别、开发、组织和评价, 而且对相关的信息资源进行选择、定位、调用, 追踪资源在使用过程中的变化, 实现信息资源的整合、有效管理和长期保存。,2022/11/29,信息管理系,4,例如: 文献信息资
2、源, 元数据可以是目录、索引、摘要及主题等文献特征和属性。从元数据的提供者角度来看, 元数据能改进针对文档的检索能力, 特别是搜索的精确度、以及对资源的控制和管理问题。对于电子文档所存在的格式和控制方法多样性问题, 元数据能支持用户决策过程。,2022/11/29,信息管理系,5,DL信息体系结构,2022/11/29,信息管理系,6,元数据是关于数据的数据(data about data),此术语指任何用于帮助网络电子资源的识别、描述和定位的数据。元数据是关于数据的结构化的数据(structured data about data)。,2022/11/29,信息管理系,7,元数据是与对象相关
3、的数据,此数据使其潜在的用户不必预先具备对这些对象的存在或特征的完整认识。元数据是对信息包(Information package)的编码描述 ,其目的在于提供一个中间级别的描述,使得人们据此就可以做出选择而无需检索大量不相关的全文文本。,2022/11/29,信息管理系,8,元数据,即代表性的数据,通常被定义为数据之数据。它包含用于描述信息对象的内容和位置的数据元素集,促进了网络环境中信息对象的发展和检索。,2022/11/29,信息管理系,9,应用于不同领域的Metadata格式 网络资源:DublicCore、ROADSTemplate、CDF(ChannelDefinitionForm
4、at)、WebCollections文献资料:MARC(with856Field),DublicCore人文科学:TEIHeader(TextEncodingInitiativeHeader)社会科学数据集:ICPSRSGMLCodebook(Inter-universityConsortiumforPoliticalandSocialResearch)博物馆与艺术作品:CIMI(ComputerInterchangeofMuseumInformation)、CDWA(CategoriesfortheDescriptionofWorksofArts)、RLG REACH Element Set
5、.,2022/11/29,信息管理系,10,视觉资料:VRA (Visual Resources Association) Core Categories for Visual Resources音乐资料:SMDL(Standard Music Description Language)政府信息:GILS(Government Information Locator Service)地理空间信息:FGDC/CSDGM(Federal Geographic Data Committee/Content Standards for Digital Geospatial Metadata),2022
6、/11/29,信息管理系,11,数字图像:MOA2metadata、CDL metadata、Open Archives Format、VRA Core、NISO/CLIR/RLG Technical Metadata for Images档案库与资源集合:EAD(Encoding Archival Description)技术报告:RFC1807:A format for Bibliographic RecordsFTP文件和FTP文件库:IAFA Templates (Internet Anonymous FTP Archives Templates)连续图像:MPEG-7,2022/11
7、/29,信息管理系,12,二、元数据的目的,2022/11/29,信息管理系,13,2022/11/29,信息管理系,14,2022/11/29,信息管理系,15,2022/11/29,信息管理系,16,三、元数据结构,2022/11/29,信息管理系,17,2022/11/29,信息管理系,18,2022/11/29,信息管理系,19,2022/11/29,信息管理系,20,2022/11/29,信息管理系,21,3 语义结构:,2022/11/29,信息管理系,22,2022/11/29,信息管理系,23,2022/11/29,信息管理系,24,2022/11/29,信息管理系,25,20
8、22/11/29,信息管理系,26,2022/11/29,信息管理系,27,2022/11/29,信息管理系,28,2022/11/29,信息管理系,29,2022/11/29,信息管理系,30,资源描述框架(Resource Description Framework)数据描述模式而且采用基于 XML的句法提供语义、结构、句法三个层次的互操作能力模块化的互操作能力有些数据化信息需要不同的元数据描述,RDF对集成这些元数据非常有用。,四、元数据描述框架RDF,2022/11/29,信息管理系,31,RDF是一个与任何特定语法无关的抽象的资源表达模式,用来反映资源(Resource)、属性(Pr
9、operty)与属性值(Value),资源resource,属性property,属性值value,语句statement,2022/11/29,信息管理系,32,换言之“张三是由以下网址所标识的资源的作者:http:/ ”,http:/,作者author,张三,2022/11/29,信息管理系,33,http:/,作者author,张三, 张三 ,RDF基于XML的描述实例:,RDF描述实例,2022/11/29,信息管理系,34,http:/,DC:Creator,张三,Dublin Core基于RDF的描述: 张三 ,基于RDF的DC描述实例,2022/11/29,信息管理系,35,1)
10、http:/www.w3.org/1999/02/22-rdf-syntax-ns# RDF标准申明2)dc=http:/purl.org/dc/elements/1.0/ DC标准申明,Notes:,2022/11/29,信息管理系,36,五、元数据种类,由于网上数字资源的形态各异, 既有论文、会议录等普通电子文本, 也有图像、声音、网页等, 不同形式的数字资源对数据格式的要求也不一样, 因此现在有多种描述网络数字资源的元数据格式, 到目前为止还没有出现成熟的统一格式。 两种:Marc、 DC,2022/11/29,信息管理系,37,1 MARC(Machine-Readable Catal
11、ogue)元数据 机读目录格式MARC 是图书情报领域广泛应用的标准格式, 国际通用的MARC 标准为USMARC和UNIMARC标准。我国的MARC 标准(CNMARC) 是在UNIMARC 标准的基础上加以补充规定形成的。由于多语种图书文献的存在, 目前我国的机读书目数据实际上是以CNMARC 和US-MARC为主,其他MARC格式为辅的现状。,2022/11/29,信息管理系,38,MARC 格式可由四个部分组成, 其中记录头标区固定为24 个字符长, 为记录处理提供基本参数。地址目次区由若干目次项组成, 每个目次项为定长12 个字符, 标识某MARC 字段在整个MARC 流中的位置。数
12、据字段区由一些可变长的数据字段组成, 除了001 字段和005 字段由数据和一个字段分隔符组成外, 其余每个字段都有两个指示符, 后接若干子字段。,2022/11/29,信息管理系,39,整个MARC 数据流经检测有效才能成为书目数据库的正式书目数据。MARC 元数据格式主要用于描述图书文献资源。,2022/11/29,信息管理系,40,MARC 局限性: ( 1)MARC 描述手段往往只适用于图书馆; (2)MARC 需要在专门的软件系统中使用,而且不太适应互联网的环境; (3) 修订程序相当复杂,而且非常缓慢; (4) 适用于完整的、静止的信息内容的处理,不易处理动态的多媒体信息; (5)
13、 编制一条机读目录不仅需要经过严格的专门训练,而且需要花一定的时间 。,2022/11/29,信息管理系,41,2、DC 元数据简介 1995 年3 月, 在美国俄亥俄州的都柏林召开的第一届元数据研讨会上, 52位来自图书馆界、电脑网络界专家共同研究产生。目的是希望建立一套描述网络电子文献的方法,以便网上信息检索。其中心议题是如何用一个简单的元数据记录来描述种类繁多的电子资源,使非图书馆专业人员都能够了解和使用著录格式,来描述网上资源。经过与会代表的商讨和辩论, 产生了一个精简的元数据集都柏林核心元素集(Dublin Core Elem ent Set) , 简称都柏林核心(DC)。,2022
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 数据 课件

链接地址:https://www.31ppt.com/p-1474467.html