信息管理概论课件第6章.ppt
《信息管理概论课件第6章.ppt》由会员分享,可在线阅读,更多相关《信息管理概论课件第6章.ppt(99页珍藏版)》请在三一办公上搜索。
1、第六章 信息采集与组织,6.1 信息源与信息采集6.2 信息组织的一般原理6.3 分类与主题标引6.4 元数据6.5 网络信息组织6.6 信息构建,6.1 信息源与信息采集,信息源概述信息采集,6.1.1 信息源概述,信息源的3个层次 信息源的类型信息源的分布,6.1.1 信息源概述,1.信息源的3个层次(1)信息最原始的来源 物质和现象的存在及人类的实践活动(2)信息资源开发机构(3)信息系统,6.1.1 信息源概述,2.信息源的类型 依不同角度,信息源可分为不同的类型。(1)按时间顺序:先导信息源、实时信息源、滞后信息源(2)按信息产生过程:原始信息源、加工信息源(3)按信息源在信息布局中
2、的地位:强势信息源、弱势信息源(4)按信息的存在形式记录型信息源、实物型信息源、思维型信息源、零次信息源,6.1.1 信息源概述,3.信息源的分布 信息源的分布有一个总的规律,即非均衡。一是在时间序列上,信息源的分布是非均衡的。从时序上看,信息源的分布遵循社会学的一个发展理论:后胜于今,今胜于古。二是空间分布也显示出非均衡的规律,国家与国家之间、地区与地区之间其信息分布都不均衡。此外,信息源在行业、部门、学科、信息类型等方面的分布也存在着非均衡的现象。,纽约时报,6.1.2 信息采集,信息采集的实质是信息的选择过程,是根据不断变化的用户信息需求从已确定的信息源体系中连续地选择、提取和收求信息的
3、过程。1.信息采集的原则 2.信息采集的渠道和方法 3.信息采集方法举要分析:调查访问 4.网络信息采集,6.1.2 信息采集,1.信息采集的原则(1)针对性原则(2)完整性原则(3)及时性原则(4)预见性原则(5)计划性原则(6)连贯性原则(7)灵活性原则,6.1.2 信息采集,2.信息采集的渠道和方法 信息采集的渠道是指经由哪些信息源去采集信息,信息采集的方法是指到信息源那里采集信息的行动手段,两者是密切相关的。信息采集的渠道主要有:大众传媒渠道、出版发行渠道、信息系统渠道、人际关系渠道、文献情报机构渠道、专业性学会渠道、行业协会渠道、社会中介机构渠道、信息发布机构渠道、互联网渠道、各类会
4、议渠道、邮政部门渠道等。,6.1.2 信息采集,信息采集的方法(1)内部信息索取法(2)互通有无的交换法(3)委托采集法(4)实物样品分析法(5)实地考察法(6)间接调查法(7)网络查询法(8)大众传媒采集法(9)咨询采集法,6.1.2 信息采集,3.信息采集方法举要分析:调查访问(1)问卷调查法 问卷的设计形式有3种:结构式、非结构式和混合式。(2)访问调查法 此法又叫采访法,是新闻机构常用的信息采集方法,它又包括电话采访、信函采访、会议采访、观察访问、座谈采访、单独采访等。,会议采访,信函采访之预约,6.1.2 信息采集,4.网络信息采集 这里主要是指搜索引擎的信息采集机制和方法,即对WW
5、W站点和其他网络信息资源进行采集、标引和检索的一类检索系统机制。这里主要涉及它的信息采集机制。基本机制:搜索引擎的信息采集机制是按照一定规律和方式对网络上WWW站点进行搜索,并将搜索到的WWW页面信息存入搜索引擎的临时数据库。自动采集器:是采用自动采集方式的搜索引擎的核心,是一种在网络上搜索文件、自动跟踪该文件超文本结构并循环检索被参照文件的软件。,6.2 信息组织的一般原理,信息组织概念信息组织的3个层次 信息组织的内容,6.2.1 信息组织概念,信息组织是采用各种方法和手段使信息有序化的过程,它通过揭示信息之间内在逻辑联系,将其一方面大量、分散和杂乱的信息经过加工、整理、提炼和优化,使之组
6、织化、系统化,从而达到有效利用的目的。,6.2.2 信息组织的3个层次,在信息过滤的过程中,存在着3个不同的层次,即信息的语法过滤、语义过滤和语用过滤,因而形成了3种不同层次的信息类型,即语法信息、语义信息和语用信息。与此相对应,信息组织也分为三种不同的层次:语法信息组织语义信息组织语用信息组织,6.2.2 信息组织的3个层次 1.语法信息组织语法信息组织是以信息的形式特征为根据序化信息的方法。语法信息的组织需要遵循方便性、多向成族性和标准化等原则。其重要特征是标准化.比较常见的语义信息组织方法有以下几种:(1)字顺组织法(2)代码组织法(3)地序组织法(4)时序组织法(5)上述组织法所没有囊
7、括的信息组织法,比如颜色组织法 和形状组织法等。,商标条代码,电话号码,6.2.2 信息组织的3个层次,6.2.2 信息组织的3个层次,2.语义信息组织它是以信息的内容或本质特征为依据序化信息的方法。语义信息组织需要遵循客观性原则、逻辑性原则和发展性原则。比较常见的语义信息组织方法有以下两种:(1)分类组织法它属于一种逻辑组织法,常见的分类组织法包括学科分类、文献分类、专利分类、商品分类和职能分类等。(2)主题组织法主题组织法是从事物内涵的主题或涉及的问题与事物的属性出发,以语词作为概念标识,并通过概念标识的字顺排列和参照方法等间接地揭示概念之间相互关系的一种信息组织方法。,6.2.2 信息组
8、织的3个层次,3.语用信息组织它是以信息的效用特征为依据序化信息的方法。语用信息组织需要遵循目的性、实用性和个性化原则。常见的语用信息组织方法有以下几种:(1)重要性大小组织法(2)权值组织法(3)概率组织法(4)特色组织法,6.2.3 信息组织的内容,信息源外表特征描述初级组织信息源内容特征揭示中级组织信息重组高级组织信息存储空间组织,6.2.3 信息组织的内容,1.信息源外表特征的描述即信息形式特征的描述,是根据一定的原则和方法,对信息的外表特征和部分内容特征进行全面描述并予以记录的过程。对信息的外表特征的描述,目前比较成熟的是:1)对文献信息描述的ISBD模式。这种模式已获得国际上的认可
9、,它主要采用统一描述格式、统一描述内容(包括描述项目和描述单元)和统一描述符号(即标识符号)的方式,核心是统一描述内容,在此基础上运用统一描述符号按统一描述格式记录。2)另一种重要的信息描述模式是MARC(Machine Readable Catalogue)模式,这是一种在ISBD模式上利用计算机技术的新型处理格式,是一种国际性的书目数据标准交换格式。,6.2.3 信息组织的内容,2.信息内容特征的揭示信息内容特征的揭示是指对信息内容特征进行深层揭示并转换成规范化的标识(包括分类号和主题词),形成科学的概念标识系统。它需要利用一定的工具(信息组织语言)或规范(标引规则)将信息内容特征进行转换
10、。,6.2.3 信息组织的内容,3.信息重组信息重组是在信息内容特征分析的基础上的具有创造性的活动,它根据特定的目的和任务,对有关的大量信息进行系统性、综合性的加工处理,形成新的信息的过程。其基本方法是,以一批相关信息为基础,利用分析、鉴别、浓缩、提炼、综合归纳和评价等手段,对信息中的相关各方面知识点进行重组,形成更加系统的信息产品或知识产品。,6.2.3 信息组织的内容,4.信息存储信息存储是指在对信息的外部、内容特征进行描述,且在确定标识之后按一定的规则和方法,把所有的信息记录组织成为一个有序的体系,以方便人们检索利用。,6.3 分类与主题标引,分类语言与分类标引主题语言与主题标引,6.3
11、.1 分类语言与分类标引,分类语言是分类组织法的语言基础和依据,其具体表现形式主要是分类表。由于用分类表和分类规则来标引、组织和检索文献信息的方法被称为分类法,因此习惯上人们将某种分类语言又叫分类法。分类法的主要类型有先组式分类法和分面组配式分类法,前者又被称为体系分类法或等级列举式分类法,后者的典型代表是印度阮冈纳赞编制的冒号分类法。,1.分类法的结构 类目表 1)基本大类。2)简表。3)详表。4)复分表。分类号,其构造方法可分为如下几种:1)层累制:即分类号的位数与类目级别基本上相对应,一位号码表示一级类目,两位号码表示二级类目,依此类推。2)顺序制:即分类号是按类目的先后顺序而不是等级从
12、小到大安排。3)混合制:即混合采用以上两种方法构成分类号。类目注释和分类法索引 1)类目注释:是说明类目的含义、范围、使用规则等事项,以便正确理解和使用该类目的文字。2)分类法索引:是为了帮助不熟悉类目表逻辑体系的人,从类名及其他相关名称字顺途径查找分类号的工具。,6.3.1 分类语言与分类标引,国际专利分类法,美国生物学文摘,6.3.1 分类语言与分类标引,6.3.1 分类语言与分类标引,2.分类法用于信息组织的使用方式(1)分类编排手工检索工具的正文(主体)部分,具体来说,这种使用方式有两种情况:编排分类目录。用于编排文摘型或题录型检索刊物的正文(文摘、题录)部分。(2)用于编排检索工具的
13、分类索引。(3)用于构成计算机检索数据库信息记录的分类号字段。,美国化学文摘,英国科学文摘,美国生物学文摘,6.3.1 分类语言与分类标引,6.3.1 分类语言与分类标引,3.分类组织法的实施保证分类标引规则基本标引规则(2)各种主题形式的信息的分类标引规则,6.3.2 主题语言与主题标引,主题语言是信息的主题组织法的语言基础,是以信息的主题为依据,用语词作为概念标识,将概念标识按字顺组织排列,并用参照系统间接显示概念之间的相互关系的一种检索语言。主题语言包括标题词语言、单元词语言、叙词语言和关键词语言,其中叙词语言是较为规范和使用较广泛的信息组织语言,因此这里以它为例进行介绍:1叙词语言的构
14、成原理 2叙词语言的具体体现叙词表 3.用于信息组织的使用方式 4.主题组织法的实施保证主题标引规则,6.3.2 主题语言与主题标引 1叙词语言的构成原理 就其性质而言,叙词语言是一种采用表示单元概念的规范化语词的组配来对信息主题进行描述的后组式词汇型标识系统。(1)它采用了组配分类法的概念组配,并适当采用了标题法的概念预先组配的方法,克服了某些词分拆后再组配时产生意义失真的缺点。(2)它采用了标题法对语词进行严格规范化的方法,以保证词和概念的一一对应。(3)它采用并完善了标题法的参照系统,采用了分类法的基本原理编制叙词分类索引和等级索引,采用了与关键词法类似的方法编制叙词轮排索引,从多方面显
15、示叙词间的相互关系,以保证准确、全面地选用叙词进行标引和检索。,6.3.2 主题语言与主题标引 2叙词语言的具体体现叙词表 叙词表有以下几个组成部分:主表附表辅助索引:1)词族索引。又称为等级索引或族系索引。它是将主表中具有属种关系、整体与部分关系、包含与被包含关系的正式主题词,按其本质属性展开,显示词间从属关系的一种词族系统。2)范畴索引。又称范畴表或分类索引。它是把叙词表的全部叙词按其所属学科范畴归结在相应的类下,同一类中的叙词按字顺排列。3)轮排索引。又称轮排表,它是把主表中全部词组按其所含词素的字顺排列,使含有同一词素的词组集中于一处的叙词索引,它方便查词者从一个词组的各个部分进行查找
16、。4)双语种对照索引。是把主表中的词与其外语译名相对应,提供从外语词字顺查找主表叙词的一种索引。,6.3.2 主题语言与主题标引 3.用于信息组织的使用方式(1)在计算机检索的数据库记录中构成主题字段,提供主要检索途径。(2)构成主题标识,组织文献主题目录。(3)用于编排检索工具的正文,这种使用方式不多见。(4)用于编排检索工具的辅助主题索引。具体包括:单个叙词(单词或词组)后直接标出一个或多个文摘号。单个叙词(单词或词组)下配有说明语(主要是来自文献题名中的词)或直接列出题名,然后标出文摘号。多个叙词组成主题标识,表达文献主题,之后标出文摘号。,6.3.2 主题语言与主题标引4.主题组织法的
17、实施保证主题标引规则主题标引规则分为一般标引规则、不同文献信息的特殊标引规则和单位具体标引细则。依据我国汉语主题标引工作细则(1998年修订本)和国家标准文献主题标引规则对主题标引的规定如下:(1)标引词的书写规则(2)标引深度规则(3)标引词选取的专指性规则(4)单主题文献信息标引规则(5)多主题信息标引规则(6)一般信息的主题标引规则(7)特殊信息主题标引,6.4 元数据,元数据的概念、类型与特征网络信息组织中的元数据及 元数据的应用元数据的发展,对象元数据,元数据模块,6.4.1 元数据的概念、类型与特征,1.元数据的概念元数据是描述和限定其他数据的数据.其典型事例有:用于描述数据的重要
18、特征(如创作者的名称、出版年)、用于数据定位的数据(如图书馆图书的杜威分类号、电视节目频道)以及有助于数据检索的数据(如数据的自由文本描述或数据的摘要,或者一系列适用于一系列数据的可检索的主题关键词)关于元数据,迄今为止,还没有完全统一的定义,最简洁的定义是:元数据是关于数据的数据(data about data)。其中前一个“数据”代表的是“资源”,后一个则对应着元数据。,6.4.1 元数据的概念、类型与特征为了正确认识和使用元数据,有必要对其概念和范围有一个清楚的认识。在关于元数据的许多定义的表述内容中,其中比较重要的几点内容有:1)元数据最简洁定义中的“数据”一般指的是表示事物性质的符号
19、,是进行各种统计、计算、科学研究、技术设计所依据的数值。2)元数据形式多样,不一定是数字形式的。3)元数据不只是对信息对象的描述,在对博物馆、档案馆、图书馆的数据进行描述或编目的同时,还能够说明被描述资源的使用环境、管理、加工、保存和使用等方面的情况。4)元数据可以来自各种不同的资源,元数据可以由人类(编制者、信息专家或使用者)提供,还可以由计算机自动生成,或者通过一项资源与另一项资源的关系来推断,如超链接。,6.4.1 元数据的概念、类型与特征,2.元数据的类型及其应用范围管理型元数据:在管理信息资源中利用的元数据。描述型元数据:用来描述或识别信息资源的的元数据。保存型元数据:与信息资源的保
20、存管理相关的信息。技术型元数据:与系统如何行使职责或元数据如何发挥作用相关的元数据。使用型元数据:与信息资源利用的等级和类型相关的元数据。,6.4.1 元数据的概念、类型与特征,3.元数据的属性与特征 一般认为,元数据的来源主要有两部分:来自信息对象内部,是由信息对象的制作部门首次生成该对象或其数字化时编制;来自与信息对象相关的信息对象外部,它是后来生成的,往往由其他人而不是信息对象的原来制作者编制。元数据的生成方式也有两种:由计算机自动生成的元数据;由人工编制的元数据。,6.4.1 元数据的概念、类型与特征,3.元数据的属性与特征元数据的状态:稳定的元数据,一旦生成就永远不变;动态的元数据,
21、可能会随着信息对象的使用或操作而改变。长期使用的元数据,用于保证信息对象的持续存取和使用;短期的元数据,主要是用于处理的数据。元数据的结构:结构化的元数据,符合可预言的标准化的或非标准化的结构;非结构化的元数据,不符合可预言的结构。元数据的语义:控制的元数据,符合标准化的词汇或规范格式;非控制的元数据,不符合任何标准化的词汇或规范格式。元数据的层次:馆藏元数据,与信息对象的集合相关;文献元数据,与单个的信息对象相关,通常被包含在馆藏中。,6.4.2 网络信息组织中的元数据 及元数据的应用,1.元数据的应用目的确认和检索(Discovery identification),著录描述(Catalo
22、ging资源管理(Resource Administration)资源保护与长期保存(Preservation and Archiving),6.4.2 网络信息组织中的元数据 及元数据的应用,2.元数据的建立为信息包生成元数据的过程包括3个部分:编码、提供对信息包的描述以及信息包的管理和保存所必需的其他信息。利用元数据组织因特网上信息内容的活动正在扩展。在创作阶段,当作者将元数据嵌入使用HTML META标识符、SGML标题和/或其他元数据的模板时,就可以生成元数据。它也可以由搜索引擎生成。例如,摘要对象交换格式(Summary Object Interchange Format,SOIF)
23、的元数据是由收获程序生成的。还可以在服务阶段形成的元数据,元数据被定位在一个有指示器指向它所描述的资源的集中或分散式数据库中。,6.4.2 网络信息组织中的元数据 及元数据的应用,3元数据的结构(1)总体结构定义方式 一个Metadata格式由多层次的结构予以定义:内容结构(Content structure),对该Metadata的构成元素及其定义标准进行描述。句法结构(Syntax structure),定义Metadata结构以及如何描述这种结构。语义结构(Semantic structure),定义Metadata元素的具体描述方法。(2)内容结构内容结构定义Metadata的构成元素
24、,包括:描述性元素、技术性元素、管理性元素、结构性元素。(3)句法结构句法结构定义格式结构及其描述方式,例如元素的分区分段管理、元素选取使用规则、元素描述方法(例如Dublin Core采用ISO/IEC11179标准)、元素结构描述方法(例如MARC记录结构、SGML结构、XML结构)、机构语句描述语言(例如EBNF Notation)等。(4)语义结构语义结构定义元素的具体描述方法,例如:描述元素时所采用的标准、最佳实践(Best Practices)或自定义的描述要求(Instructions)。,6.4.2 网络信息组织中的元数据 及元数据的应用,4.元数据的编码语言与制作方式(1)元
25、数据编码语言(Metadata Encoding Languages)指对元数据元素和结构进行定义和描述的具体语法和语义规则,常称为定义描述语言(DDL)。(2)元数据制作方式专门编制模块(例如对MARC、GILS、FGDC等);数据处理时自动编制(例如对Dublin Core等);数据物理处理时自动编制(例如数字图象扫描时的某些元数据参数);共享元数据(例如OCLC/CORC IMESH,6.4.2 网络信息组织中的元数据 及元数据的应用,5.元数据格式的应用范围描述:根据元数据的定义,它最基本的功能就在于对信息对象的内容和位置进行描述。定位:由于网络信息资源没有具体的实体存在,因此,明确它
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息管理 概论 课件
链接地址:https://www.31ppt.com/p-5947434.html