信息生命周期管理.ppt
2023/3/1,1,第三章信息生命周期管理,3.1信息生命周期,3.2 信息用户与需求,3.3 信息采集,3.4 信息处理与组织,3.5 信息存储与检索,3.6 信息传递,3.7 信息利用,3.8 信息处置,课件主页面,2023/3/1,2,3.1信息生命周期(information life cycle),1 定义信息生命信息对其主体所具有的各种价值的存续期。信息生命周期信息从生成到其价值绝大部分甚至全部丧失的时间间隔,或者指信息从产生到最终老化过时被处理掉的整个过程,是信息从“生”到“死”的轮回。,2023/3/1,3,2 信息生命周期的五个阶段确定信息需求:用户所需要信息的内容、格式、类别、媒体、来源、质量和数量信息生成或采(收)集:渠道、对象、方法和手段信息处理:重新组合、提炼、压缩、扩充、运算、排序,转换语言、格式、媒体、载体,编制目录、索引,制作文摘、撰写综述、述评、报告信息利用:终端用户或决策者运用信息进行决策或解决各种问题信息处置:将老化过时无效的信息从信息集合(信息库)中及时清除掉,2023/3/1,4,3.2 信息用户与信息需求分析,1 信息用户 用户指信息的用户,通常指那些接受信息服务的人类个体或群体。信息用户的三个特征拥有信息需求具备利用信息的能力具有接受信息服务的行为潜在信息用户拥有信息需求具备利用信息的能力2 信息需求信息需求是指向某个图书馆或其他信息系统提出的书面的或口头的要求或请求。,2023/3/1,5,用户信息需求的决定因素用户的特征个人特征:与生带来的特征和后天发展的特征 组织特征:职业组织、业余组织和社区组织社会特征:时代背景和社会环境用户的类型与特点(见下表)确定用户信息需求的方法:总体方式有:用户自己进行识别、信息工作者亲自识别和信息工作者会同用户进行识别具体方法:采访法、问卷调查法、实地调查法、抽样调查法、观察法、案例历史法、日记法等等,2023/3/1,6,表 组织内部不同层次的信息用户的信息需求,2023/3/1,7,3.3信息源与信息采集 3.3.1信息源概述,1 信息源的定义信息源是指信息的来源,即产生信息的地方。联合国教科文组织出版的文献术语将其定义为:个人为满足其信息需要而获得信息的来源。人、报纸、广播、电视、Internet 信息源的三个层次(P121),2023/3/1,8,信息最原始的来源物质和现象的存在及人类的实践活动。这种信息源的特点:它提供的是初始信息,内容翔实可靠,但复杂、无序;它传递信息的方式最直接、最迅速;它对信息人员来说具有一定的局限性。信息开发机构:这是第二层次的信息源,其职能和任务就是专门从事信息的采集、处理、存储和传递,主要包括:专门从事信息生产和服务的机构;各单位的信息部门。信息系统:它是在信息技术的支持下由信息机构对实践活动中所产生的信息进行过滤加工的成果,它存储了大量的信息,可以通过现代信息网络进行传递,为各类信息部门和信息系统对外服务提供更高层次的信息源基础。,2023/3/1,9,2 信息源的性质相对性信息源不是一成不变的在错综复杂的社会信息流通过程中,任何一个信息源都可能既是信息的发出端又是信息的接收端。多样性提供同样信息内容的信息源可能有多种不确定性信息源发出的信息的内容、种类、形式、媒体等不固定 生物和社会信息源大多数具有生命周期,2023/3/1,10,替代性大多数情况下,可用间接源替代直接源。补充性不同信息源提供的信息能够相互验证、互为补充自组织性:对外部环境的冲击具有一定的适应能力能够自动调节自身以适应外部环境的变化,2023/3/1,11,3 信息源的分类按照信息生成方式或产生过程,信息源可以划分为初始源和再生源(原始源和加工源)初始源又称原始源、一次信息源:没有经过信息机构的加工处理,是实践活动中直接产生的。再生源又称加工源:信息机构对原始信息进行加工、处理、改编和重组而形成的各种信息源。,2023/3/1,12,再生源按加工的深度又分为二次信息源和三次信息源。前者指各种中介性检索工具,如目录、索引、文摘性检索刊物和书目数据库等;后者是在原始信息源和二次信息源的基础上,通过分析、综合、浓缩和提炼而形成的高层次的信息源,是对原始信息的深层揭示和报道,如年鉴、手册、述评、进展报告、百科全书等。,2023/3/1,13,按发送信息与组织之间的关系,信息源可以划分为内部源和外部源内部源的信息完全在组织内部生成的外部源是指组织的环境按提供信息的实体形态:机构源和物体源机构源:信息机构、非信息机构物体源:文献源、非文献源 文献信息源可以按其载体形态划分:手写型文献:甲骨文、简册、帛书、笔记、书稿等印刷型文献:铅印、胶印、油印等缩微型文献:缩微胶卷、缩微平片等计算机阅读型:电子图书、电子期刊视听型(声像型)文献:唱片、录音(像)带、CD、VCD、DVD等,2023/3/1,14,非文献源:一般强调的是通过人的感官获取的实时信息,或者说第一手知识信息。主要分为:实物信息源:实物、样品或展览会的展品。如服装、仪器仪表、建筑物、生物品种、化学物质、药品和医疗器械等实情信息源:自然现象如气候、水文、生物等的演进和反应的状态和过程;社会信息如政治法律事务、军事行动、企、商、事业机构运行状态、演出现场等口头信息源:存在于人脑记忆中,通过交谈、讨论、报告等方式交流传播的信息。如:会议发言、电话和网络交谈、直接口头交谈等,2023/3/1,15,按生成领域,可把信息源划分自然信息源、生物信息源和社会信息源自然信息源是指自然界中的各种无机物,它们是自然科学家研究的对象生物信息源是指地球上的各种生物,包括动物、植物和微生物,它们是生物科学家的研究对象社会信息源是指由人及其所组成的各类、各级团体、群体、组织乃至他们(它们)的社会活动的成果。通常人们所说的信息源一般是指社会信息源,包括人、机构和物体。,2023/3/1,16,3.3.2 信息采集,1 信息搜集、信息收集和信息采集的定义信息搜集具有积极主动的含义,是指信息获取人员主动出击,想方设法去获取所需要的信息。信息收集是指运用各种方法、借助于各种手段,通过各种渠道(正式交流或非正式交流)从不同的信息源获取信息的过程或活动。信息采集是信息的选择过程,是根据不断变化的用户信息需求从已确定的信息源体系中连续地选择、提取和收求信息的过程。(P123),2023/3/1,17,2 信息采集的方式第一种是按采集信息的组织方式将信息采集划分为报告制度和专门组织的采集。第二种是按采集的信息宽度,将信息采集划分为全面采集和非全面采集。第三种是按采集信息的时间可划分为定期采集和不定期采集。,2023/3/1,18,3 信息采集的原则针对性原则:要针对用户的信息需求完整性原则:全面完整地采集方方面面的信息及时性原则:信息的时效性和竞争的要求预见性原则:在用户现时需求的基础上预见需求的未来变化趋势计划性原则:制定合理的采集计划,有步骤、有条理地进行连贯性原则:用户的信息需求具有连贯性;信息服务机构和信息系统也需要连续地采集信息以形成系统的信息体系灵活性原则:灵活采用多种方式和方法采集信息,2023/3/1,19,4 信息采集的步骤明确任务确定目标制定计划设计信息结构确定采集的对象和方式宣传与培训开展采集试点实施修订过的采集计划,2023/3/1,20,5 信息采集的质量控制要严格审查采集计划要确保采集步骤严密完善采集人员要有很强的责任心,要掌握采集的基本技术提供信息的个人、组织要对自己提供的信息质量负责采集单位要对采集到的信息进行审核,主要审核填报的信息内容的正确性、完整性、及时性,2023/3/1,21,6 信息采集的渠道和方法渠道主要有:大众传媒渠道、出版发行渠道、人际关系渠道、文献情报机构渠道、专业性学会渠道、行业协会渠道社会中介机构渠道、信息发布机构渠道、互联网渠道、各类会议渠道、邮政部门渠道等等具体方法:调查法就是深入被采集的信息对象处,通过实地观察信息对象采集有关的信息:全面调查、典型调查、重点调查、详细调查和抽样调查,2023/3/1,22,统计法就是按照统计法规和统计工作的有关规定自下而上地收集信息,一般说来统计工作的信息收集主要采用的是填表法,上一级统计部门对下一级统计部门提交的统计数据进行汇总、分析,并得出相应的结论。会计法就是按照会计法规和会计工作的有关规定来收集信息。预测法是指在收集、分析、研究历史信息的基础上推测和把握事物未来的运动变化规律。,2023/3/1,23,新闻收集法就是通过收听、收看和阅读新闻报道的方法来收集信息。文献调查法就是收集与某事物有关的各种记录形态的信息,包括图书、期刊、报纸、专利说明、产品样本、技术报告、广告、简报、宣传材料,等等。测试法就是对获得的信息对象运用各种仪器进行测量来获取相关的信息,这是反求工程所运用的主要方法。试验法主要是针对新产品、新服务、新计划而言的,在这些项目尚未正式推广之前,可以采用局部试点或试验的方法来收集信息。检索法就是通过各种方式进入数据库中收集相关信息。搜索法就是利用已经上网的计算机对网上信息进行搜寻。,2023/3/1,24,举例说明一种较常用的信息采集方法:调查法访问调查法和问卷调查法访问调查法:又叫采访法,是新闻机构常用的信息采集方法,它又包括电话采访、信函采访、会议采访、观察采访、座谈采访、单独采访等。注意事项:做好充分准备(把问题吃透并具体化、纲要化,认真选择并了解调查对象和相关背景);访问中要机智灵活,善于交流互动。问卷调查法:是一种统计调查和定量分析的信息采集方法,此法主要考虑的问题是:所采集的信息的内容范围、数量,所选定的调查对象的代表性、数量,问卷的精心设计、数量,问卷的回收率的控制,回收后问卷的统计分析,对分析结果的评价等。,2023/3/1,25,问卷调查法的主要特点:费用较低,调查面广,但调查对象无法控制,问卷回收率不高,问卷回答的质量也不高。问卷的设计形式:结构式、非结构式和混合式 调查表:(微软出版社作者俱乐部调查表)前言 调查项目 问答形式:结构式、开放式 结束语,2023/3/1,26,7 网络信息采集 这里主要是指搜索引擎的信息采集机制和方法,即对WWW站点和其他网络信息资源进行采集、标引和检索的一类检索系统机制。主要涉及它的信息采集机制。基本机制:搜索引擎的信息采集机制是按照一定规律和方式对网络上WWW站点进行搜索,并将搜索到的WWW页面信息存入搜索引擎的临时数据库。自动采集器:是采用自动采集方式的搜索引擎的核心,是一种在网络上搜索文件、自动跟踪该文件超文本结构并循环检索被参照文件的软件。,2023/3/1,27,3.4信息处理与信息组织3.4.1信息处理和信息组织的定义,1 信息处理狭义的信息处理仅指信息加工,也就是对收集到或生产出的信息进行转换、增删、重组,它既可以是载体的转换,也可以是描述方式的转换,甚至可以是内容方面的提炼、延伸。广义的信息处理是指科学计算、实时控制和事务处理。,2023/3/1,28,2 信息组织运用科学的方法来提高信息的有序程度,它包括信息选择、加工、分析、提炼、转述等活动。根据信息的内容特征和外部特征,采用一定的原则和方法,对信息进行加工处理,使之有序可用的过程。(P128),2023/3/1,29,3.4.2信息组织方法的分类,按信息本身的层次划分可分为(P128):语法层次的信息组织方法语义层次的信息组织方法语用层次的信息组织方法,2023/3/1,30,语法层次的信息组织方法语法层次的信息组织方法又称为语法信息组织:是以信息的形式特征为根据序化信息的方法。重要特征是标准化:因为语法信息不涉及含义和用途,必须用标准化来约束;标准的形成和应用的过程就是语法信息优化的过程。常见的有:字顺组织法代码组织法:代码一般是指代表事物的名称、属性、状态的符号和记号地序组织法时序组织法其他组织法,2023/3/1,31,语义层次的信息组织方法语义层次的信息组织法又称为语义信息组织,是指以信息的内容或本质特征为依据序化信息的方法。语义信息组织要遵循客观性、逻辑性和发展性原则 常见的有:分类组织法就是根据分类对象的内容性质、形式体裁、读者用途等分门别类地系统地组织事物的方法。主题组织法指直接用语词作为表达主题概念的标识,并用字顺排列标识和用参照系统等方法来间接表达各概念之间的相互关系的信息组织方法。,2023/3/1,32,语用层次的信息组织方法语用层次的信息组织方法又称为语用信息组织,是以信息的效用特征为依据序化信息的方法。语用信息组织遵循目的性、实用性和个性化原则。常见的有:重要性大小组织法:递增法和递减法。如:大众传媒的栏目设计,推荐书目的款目安排等。权值组织法:即赋予不同的信息以不同的权重值,然后通过复杂的计算,以权重大小组织信息的方法。如:决策方案的选择和教学质量评估等。概率组织法:即根据事件发生的概率大小序化信息的方法。如期货交易等过程。,2023/3/1,33,3.4.3信息组织的基本原理,1 信息组织的语言学基础2 信息组织的逻辑学基础3 检索语言的构成原理,2023/3/1,34,1 信息组织的语言学基础,2023/3/1,35,语言的分类,2023/3/1,36,2023/3/1,37,检索语言的构成有一套专用字符用以构词有一定数量的能够表达基本概念的基本词汇词汇是登录在类表、词表中的全部标识。词汇由语词组成,语词是词表中的一个标识,如分类号、检索词、代码。有一套能够表达复杂概念的语法规则有一种能把自然语言转换成检索语言的工具,即词典,也称为类表、词表(分类表、主题词表),它们都是检索语言中语词的词典。,2023/3/1,38,检索语言的实例 目前全世界有近千种检索语言,最主要的有:国际十进分类法(UDC universal decimal classification)杜威十进分类法(Dewey Decimal Classification)NASA(National Aeronautics Space Administration)叙词表中国图书馆分类法中国图书资料分类法中国科学院图书馆分类法汉语主题词表军用主题词表,2023/3/1,39,检索语言的分类按照结构原理划分 分类语言用分类号表达各种概念,采用概念划分与概括的方法,将各种概念按照科学的原则进行分类和系统排列,建立起等级体系。如国际十进分类法描述语言用语词来表达各种概念,并将各种概念不管其相互关系而完全按照字顺进行排列。如NASA叙词表代码语言,用某种代码来表示事物的某一方面特征,并加以标引和排列。如化合物的分子式语言有时也可将这几种语言结合使用,比如我国的国民经济行业分类与代码,2023/3/1,40,按照组配的方式先组式语言其标识在编表时就已经组配好,如各种分类语言后组式语言其标识只有在检索时才组配起来,如各种叙词语言,2023/3/1,41,对检索语言的基本要求有较高的查全率和查准率 输出的相关信息数 查全率=100%集合(信息系统)中的相关信息总数 A=100%A+C输出的相关信息数 查准率=100%输出的信息总数 A=100%A+B A检准的相关信息数 B误检的信息数(无关信息)C遗漏的相关信息数 D无关的信息数,2023/3/1,42,满足多途径检索的要求多途径检索从多个侧面进行检索,如书名、著者、分类、主题等途径等族性检索从学科、专业出发的检索,是一种范围较广的检索特性检索从事物出发的检索,是一种范围较窄的检索扩检和缩检扩大和缩小检索的范围,2023/3/1,43,易于标引、易于检索具有对先进检索方式和检索设备的适应性,2023/3/1,44,2 信息组织的逻辑学基础,逻辑(logic)是思维的规律性或客观事物的规律性检索语言是表达一系列信息内容的概念及其相互关系的概念标识系统,是建立在概念逻辑的基础上概念是事物本质属性的概括,概念逻辑是揭示事物本质属性及其之间的区别与联系的科学思维方法。检索语言要能准确表达不同的概念,还要显示它们之间的关系。,2023/3/1,45,概念的内涵与外延概念的内涵即其含义,是它所指事物的本质属性的总和概念的内涵有深浅,即它所概括的事物的 本质属性有多少概念的外延是其适用范围,即它所包含的所有事物概念的外延有广窄,即它的适用范围有大小概念的内涵与外延之间成反比关系,概念的内涵越浅,则它的外延越广,2023/3/1,46,概念之间的关系 全同关系全同关系又称为同一关系、重合关系,是指有同一外延、不同内涵的两个概念之间的关系。在全同关系中的两个概念实际上是指同一事物,故在检索语言中要加以合并,即只选择其中一个作为标识,以提高专指性。电子计算机与电脑、小苏打与碳酸氢钠、父亲与爸爸、庐州与合肥、DNA与脱氧核糖核酸等。,2023/3/1,47,属种关系属种关系是指两个概念中一个概念完全被包含在另一个概念的外延里,是该概念外延的一部分在属种关系中,外延较大概念是属概念或上位概念,外延较小的概念是种概念或下位概念生物与动物、学生与小学生、学校与大学、行星与地球,飞机、直升飞机、喷气式直升飞机。,2023/3/1,48,整体与部分关系整体与部分关系是指在两个概念中,其中一个概念概括某一事物,而另外一概念仅仅表示这一概念的某一部分中国与安徽、安徽农业大学与(安徽农业大学)管理科学学院、人体与(人的)心脏、汽车与(汽车的)方向盘、树与树干等属种指同族事物的属与种、类称与别称之间的关系,整体与部分关系关系指两个不同族的事物一个成为另一个的构成部分之间的关系,2023/3/1,49,交叉关系交叉关系也称为部分重合关系,是指两个概念之间的外延有一部分重合所形成的关系两个概念的外延重合部分(即相同部分)常常 能形成一个新概念,其内涵等于两个交叉概念的内涵之和,该新概念对原来两个概念中的任何一个都属下位概念古代史+中国史=中国古代史核动力舰+驱逐舰=核动力驱逐舰彩色打印机+手提打印机=彩色手提打印机(或手提彩色打印机),2023/3/1,50,并列关系并列关系又成为同位关系,是指同一个概念之下的几个种概念之间的关系,具有并列关系的各个概念互称为并列概念或者同位概念综合性大学、师范大学、工业大学、农业大学、医科大学、铁道大学、交通大学、测绘大学都是大学这一属概念之下的种概念,故它们之间的关系就是并列关系,2023/3/1,51,矛盾关系矛盾关系是指外延总和等于其上位概念全部外延的两个并列概念之间的关系,是并列关系的一种特殊形式金属材料与非金属材料的外延总和等于材料这一概念的全部外延男学生和女学生这两个概念的外延总和也等于学生这一概念的全部外延正极与负极这两个概念的外延总和也等于极性这一概念的全部外延,2023/3/1,52,对立关系对立关系是指外延总和小于其上位概念全部外延的两个概念之间的关系,也是并列关系的一种特殊形式导电体和绝缘体之间即为此关系,因为它们的上位概念是导电性,而导电性这一概念的外延中除了包括导电体和绝缘体之外,还包括半导体酸性与碱性也是这种关系,因为在物质的酸碱性中还包括了中性,2023/3/1,53,检索语言在表达概念及其相互关系时,利用了概念逻辑原理用概念的划分与概括和概念的分析与综合这两种逻辑方法建立起自己的体系结构,3 检索语言的构成原理,2023/3/1,54,3 检索语言的构成原理,检索语言在表达概念及其相互关系时,利用了概念逻辑原理用概念的划分与概括和概念的分析与综合这两种逻辑方法建立起自己的体系结构利用概念的划分(缩小)与概括(扩大)原理分类概念的缩小(概念限制)即增加属性,如管理、经济管理、信息经济管理、中国信息经济管理;概念扩大(概念概括)即减少属性,如中国信息经济管理、信息经济管理、经济管理、管理。,2023/3/1,55,利用概念的分析(分解)与综合(合成)组配,可建立起另外一种形式的检索语言体系结构概念组配体系,如叙词法两个概念的外延重合部分可以构成一个新词,其内涵等于原来的两个概念内涵之和,它和原来的两个概念之间具有隶属关系,故可将一个内涵较深的概念分解成为两个或两个以上的内涵较浅的概念,也可反向进行。,2023/3/1,56,3.4.4信息组织的内容(P130),信息组织的内容包括信息源外表特征描述、信息源内容特征描述、信息重组和信息存储4个方面其中信息源外部特征的描述是信息的初级组织信息源内容特征的揭示是信息的中级组织信息重组是信息的高级组织信息存储是对信息及其他信息组织的成果的空间组织。四者相互独立又相互联系,共同构成信息组织的完整内容。,2023/3/1,57,1 信息源外表特征的描述即信息形式特征的描述,是根据一定的原则和方法,对信息的外表特征和部分内容特征进行全面描述并予以记录的过程。目前比较成熟的是对文献信息描述的ISBD模式。它主要采用统一描述格式、统一描述内容和统一描述符号的方式,核心是统一描述内容,在此基础上运用统一描述符号按统一描述格式记录。,2023/3/1,58,ISBD描述内容包括如下8大项目:题名与责任者项、版本项、信息特殊细节项、出版发行项、载体形态项、丛编项、附注项、国际标准编号和获得方式项。我国的文献著录总则、普通图书著录规则等等都是以ISBD为基础的。另一种重要的信息描述模式是MARC(Machine Readable Catalogue)模式,这是一种在ISBD模式上利用计算机技术的新型处理格式,是一种国际性的书目数据交换格式。,2023/3/1,59,2 信息内容特征的揭示信息内容特征的揭示是指对信息内容特征进行深层揭示并转换成规范化的标识(包括分类号和主题词),形成科学的概念标识系统。它需要利用一定的工具(信息组织语言)或规范(标引规范)将信息内容特征进行转换。,2023/3/1,60,3 信息重组这是在信息内容特征分析的基础上的具有创造性的活动。它根据特定的目的和任务,对有关的大量信息进行系统性、综合性的加工处理,形成新的信息的过程。其基本方法是:以一批相关信息为基础,利用分析、鉴别、浓缩、提炼、综合归纳和评价等手段,对信息中的相关方面知识点进行重组,形成更加系统的信息产品或知识产品。信息重组的过程中融入了信息分析人员的智能,形成了新的信息组合,因此是高级的信息组织活动。信息重组的结果常常表现为综述、述评、进展报告、研究报告等。,2023/3/1,61,4 信息存储指在对信息的外部、内容特征进行描述,且在确定标识之后按一定的规则和方法,把所有的信息记录组织成为一个有序的体系,以方便人们检索利用。因此,信息存储是信息在空间中的科学排列和组织,也是形成信息系统的一项必不可少的组织环节。一般地讲,信息存储都是以信息的外部特征或内容特征作为主要存取依据的,因而信息存储与信息的描述、揭示和重组并不是截然分开的两个方面,信息存储在很大程度上还要依赖于信息的描述、揭示和重组并且同时还要对信息的描述、揭示和重组成果进行存储。,2023/3/1,62,信息存储主要有两种方式:第一是手工存储,主要是存储空间如何划分的问题。比如按照文献载体类型区分为普通书库、报刊库、线装库、缩微资料库和声像资料库等;按照文献的利用率可分为一线书库、二线书库、三线书库等;按照文献的学科属性划分为社会科学、自然科学书库。第二是计算机存储,这主要是利用计算机技术及其现代化存储技术如光盘技术和数据库技术等多种信息技术实现信息的自动化存储和管理。一方面可以节省存储空间,另一方面是信息管理现代化的必然要求。其结果就是形成一个由各种信息组成的动态性集合,并由计算机技术及相关技术支持的信息数据库。,2023/3/1,63,信息存储不仅是信息的归档和排列,而且还有一个维护和更新问题。手工存储中的维护问题主要表现为存储空间的保护和信息资料的保管问题,当然主要是信息资料的保管问题(考虑温度、湿度、灰尘、大气污染、有害生物、阳光、灾害等)。计算机存储中,除存储介质的维护外,计算机系统维护也非常重要,包括计算机硬件、软件、数据库、机房、人员等多方面的维护。,2023/3/1,64,3.4.5信息组织方法,凡是能将信息按一定的规律进行有序排列的方法,都称为信息的组织方法。明确信息的外部特征和内容特征(属性)。外部特征是物质载体所直接反映的特征,指文献的书名(刊名)、著者、出版者、出版地、语种、版次、刊期、以及各种编号等等。按外部特征组织信息的有引用法、索引法。内容特征指信息所包含和承载的具体内容。按内容特征组织信息的有分类法、主题法、文摘法。另外还有代码组织法,网上信息组织法。,2023/3/1,65,1 分类组织法,“类”是指在性质上相同或相似的事物,属性相同的或相似的事物就属同类事物。分类是人类认识事物的一种思维方式,分类就是把相同的或不同的事物区别开来,把不同的事物根据彼此相互关系,联成一个系统。类的形成以相同性或相似性为条件,相同的东西加上一点不同的因素,就形成同类中的另一小类。,2023/3/1,66,分类组织法就是根据分类对象的内容性质、形式体裁、读者用途等分门别类地系统地组织事物的方法。分类法主要有分面分类法(面分类法)和体系分类法(线分类法)分面分类法(组配分类法),即按一定标准将各个事物概念的属性划分为一个个的面。面就是一些具有某一共同特征属性的一组事物。在一个面里都含有许多具有同一范畴性质的类目。把这些面以及面下面的细目的标识符号,按照一定的组配顺序编排成为一个个的分类表。,2023/3/1,67,体系分类法(学科体系分类法、层累制分类法、等级制分类法),是把所有类目主要按照学科知识的体系和内在的逻辑性,采取尽量列举类目的方式,组成一个有等级层次的分类系统。(文献的)体系分类法是以科学分类为基础,运用概念划分的方法,按知识门类的逻辑关系,从总到分,从一般到具体,层层划分逐级展开的层累制号码检索系统。根据这种方法编制的目录称之为分类目录。(文献)分类包括分类和归类两个方面,前者是指建立分类体系,后者是指运用该体系来分类文献。分类要按分类表(类分文献的工具)来组织。,2023/3/1,68,2023/3/1,69,分类法的特点从事物的某一方面出发,按表达事物的层累制号码排列,同一学科内容的资料集中在一起,可以体现学科的系统性,反映事物的从属派生关系,便于按学科体系进行族性检索以人工语言(数字、字母代号)作为标记符号,不直观,较难记体系固定,增补新类目不及时,但按分类号组织分类目录较容易组配方式较机械,较难满足多元检索要求,2023/3/1,70,分类组织法的实施保障分类基本标引规则(P134)信息分类要以信息的学科内容或专业属性为主要标准。必要时再参照其他特征进行标引信息分类要体现逻辑性、系统性。信息所归入的类目与其上位类之间的关系体现出分类法的逻辑性、等级性、次第性。信息归入其最大用途的类。以专指性为原则。把信息归入最切合实际的专指的类目层次,能入下位类,就不要归入其上位类。不可单凭信息的题名的含义归类。信息分类要坚持一致性原则。同一信息归入一类,使同一种信息集中在一起,也就是说同种信息必须同类、同号。,2023/3/1,71,主题组织法又称词汇控制法。指直接用语词作为表达主题概念的标识,并用字顺排列标识和用参照系统等方法来间接表达各概念之间的相互关系的一种组织方法。主题组织法可分为标题法、单元词法、叙词法和关键词法等。,2 主题组织法,2023/3/1,72,标题法标题词是指用来表达主题内容(即主题标识)的、经过规范化处理的自然语言中的词或词组。标题法是指用经过规范化处理的自然语言中的名称术语作为标识来直接表达文献所涉及或论及的事物主题,并将全部标识按照字顺方式进行排序,用参照系统来间接显示标识所表达的事物主题之间的相互关系的组织方法。简单地说,标题就是表达文献主题的一种语言形式,按照这种标题的字顺来组织文献信息检索工具的方法就是标题法。,2023/3/1,73,例一篇关于羊饲养的文章和一篇关于羊病防治的文章在标题系统中,它们都可直接用“羊”(或“羊饲养”、“羊疾病”)来做标题而不是用“畜牧学羊”、“兽医学羊”来做标题 并都按“羊”字排列被集中到一起。检索时,不管是“羊饲养”还是“羊治病”的信息,也不论其学科性质,都按照字顺查“羊”即可如将有关“羊”的信息全部找到,在“羊”的标题下可看到一条参照“参见羊、山羊、黄羊”,据此可将相关信息全部查出。,2023/3/1,74,例一篇关于羊的饲养的文章和一篇关于山羊的饲养的文章它们的标题分别为“羊”(或“羊饲养”)和“山羊”(或“山羊饲养”),它们在标题系统中都是按照“羊”和“山羊”的字顺来排列的,因而被分散在两处。这是标题法的缺点。,如何解决这一“分散”问题呢?,2023/3/1,75,标题词关系的显示标题的语义参照(标题参照系统)是标题法揭示标题(概念)之间的语义关系的一种重要手段。主要有单纯参照、相关参照和一般参照。单纯参照是反映同义关系的参照,一般用“见”、“见自”来显示等同关系。相关参照是指两个具有等级或者相关关系而又是正式使用的标题词之间的参照,用“参见”、“参见自”来显示。一般参照是一种概括性的举例性参照。,2023/3/1,76,等同关系的显示 等级关系的显示,非标题词 见 标题词,标题词 见自 非标题词,电脑 见 计算机,孙中山 见自 孙逸仙,上级标题词 参见 下级标题词,下级标题词 参见自 上级标题词,电机 参见 电动机 发电机,标题词A 参见 标题词B,电动机 参见 发电机,标题词B 参见 标题词A,发电机 参见 电动机,相关关系的显示,2023/3/1,77,标题法的特点标题之间的顺序关系是预先组配好的,属先组式标引和检索时直接使用,不易混乱使用不灵活,不能满足多途径检索要求标题法以事物为中心来集中与该事物有关的文献,适于从主题出发进行检索,易查找某一主题的文献,且使用方便、检索速度快、修改容易,2023/3/1,78,单元词法单元词(uniterm)是指一个个在概念上不能再分的、最小的、最基本的词汇单位,是能够独立地描述文献所论及或涉及的事物主题的那些单词。它们可以是:单纯词“山”、“水”、“氧”、“玻璃”、“逻辑”、“火车”、“资料”、“马克思”、“乌鲁木齐”合成词“文字”、“图书馆”、“车床”、“隔音”、“公路”这些词的特点是在概念上不能再进一步分解,如进一步分解将不能表达原来的概念,从而失去检索意义。,2023/3/1,79,单元词法就是用规范化了的单元词来表示文献的主题单元词是构成标题的部件,它们本身绝大部分是不符合“直接精确地表达文献主题”这一基本要求的“标题词”,只有用单元词的相互组合(即组配)才能构成一个个专指的“标题”,以精确地表达文献主题或进行检索。单元词法的构成原理是组配,即任何完整的、复杂的概念都可以分解成为一般的单元词,反过来说,任何复杂的概念都可由单元词的组合(组配)而成。,2023/3/1,80,组配就是从主题词表(但组配也适用于分类组织法)中选取两个或两个以上的主题词,按照一定的概念组合关系和符号,把它们有机地结合起来,以表达更为专指的主题。,2023/3/1,81,单元词法的主要特点可以同时使用多个单元词对同一份文献从不同的侧面分别进行标引;单元词之间不存在次序问题,可能产生误检。如查找“学校图书馆”时,由于使用“图书馆”和“学校”这两个单元词进行组配,结果可能会把“图书馆学校”和“学校图书馆”方面的文献都检索出来 组成“标题”的每一个单元词都可以作为检索入口,检索途径较多。利用对单元词的增加或减少,可进行扩检或缩检,2023/3/1,82,标引深度较高。单元词是一个标识(一个单元词)一张卡片,单元词的数量都有一定的限制。每张单元词卡片可记录200个文献号码,且还可继续使用第2、3张卡片。有利于向计算机检索方向发展。,2023/3/1,83,叙词法单元词法的缺陷单元词的选取主要考虑词的结构,重在拆词。单元词的组配基本上属于单纯的字面组配,误检率较大。字面组配只考虑词的字面形式而不考虑内容含义,把概念简单地看成是词的任意叠加,因而组配经常会导致望文生义或不知所云,以至检索时无所适从。,2023/3/1,84,为避免单元词法的缺陷,人们又研制了一种新的信息组织方法叙词法。叙词是一些以概念为基础的、经过规范化的、并且有组配性能、能显示词间语义关系和动态性的词和词组,又称其为描述词、叙述词、主题词。叙词法就是以叙词作为标识符号,标引和检索文献信息的一种信息组织方法。,2023/3/1,85,基本原理:叙词法采用概念组配概念的分析与综合(拆义),它把完整的一个主题内容从概念上分解为若干个分概念,然后再从词表中选用能够确切地表示这些分概念的词或字组加以组配,以形成更为专指的概念;叙词法严格遵守概念组配原理,对语词进行严格规范化,不简单地拆词;用参照系统显示概念间的相互关系,用分类法的基本原理编制叙词分类索引和等级索引,2023/3/1,86,字面组配与概念组配有时相同,有时不同。组配时需要注意的几个问题 要尽量使用词表中给出的主题词,只有词表中单个主题词不能够表达主题,才进行组配要防止单纯字面组配,组配必须是概念组配;要防止多标识组配,必须选用与所表达的主题关系最密切、最邻近的主题词进行组配。要防止越级组配要防止虚假组配。要防止二义性组配,2023/3/1,87,叙词语言的具体体现叙词表叙词表的组成部分主表:是叙词表的主体部分,它是把全部或大部分叙词和非叙词款目按字顺排列而成的词汇表。附表:将一些专有叙词,比如地理和区划名称、组织结构名称、人物名称等叙词款目独立按字顺编排,作为附表。其结构和功用与主表完全相同,都是信息组织和检索时选词的依据。辅助索引:为了查找方便,并以多种方式展示叙词之间的关系。像词族索引(显示从属关系)、范畴索引(学科)、语种对照索引等。,2023/3/1,88,叙词法的主要特点1.直接以规范化了的自然语言叙词作为标识符号,直观性强;2.直接从具体对象和问题出发选词,并用叙词组配来描述主题,专指性强;3.叙词法能随时加以增设修改,适应性强;4.对叙词主要采用字顺排列方式,查找迅速;5.主要采用后组式概念组配方法,灵活性强;6.对同一主题的文献,可作多途径检索;7.叙词表中编制和建立了叙词语义关系的网络结构(叙词字顺索引的参照系统,叙词范畴分类系统、叙词等级系统,叙词词族图等),加强了叙词法的学科系统性和族性检索作用,2023/3/1,89,关键词法关键词是从文献的题目、正文或摘要中抽出的能表征文献主题内容的具有实质意义的词语。关键词法是将描述主题内容的关键词抽出,不加或加少量规范处理、按字顺排列提供检索的方法。关键词法相当粗糙,但标引容易,报导及时。,2023/3/1,90,引用组织法是运用文献的引用和被引用的规律来组织信息的方法美国“科学引文索引”Science Citation Index-SCISCI是美国信息学家加菲尔德按照美国薛泼德引文法原理编制而成的,它是一种根据被引用文献查找引用文献的方法。SCI所用的方法其实就是一般科研人员所喜爱的“滚雪球式”文献检索方法。SCI有三种类型,即作者引文索引、来源索引和轮排主题索引,3 引用组织法,2023/3/1,91,索引即英语中的“index”,又称为“引得”,有目次表、指南之义。索引作为一种指南系统,是查找信息和组织信息的工具。索引组织法是指将文献中的项目或内容摘记下来,在每条下面注明出处页码,并按照一定的规则排列起来。,4 索引组织法,2023/3/1,92,索引的分类按照索引对象的性质物质系统索引文献系统索引索引法组织文献信息有两种类型按文献外部特征组织索引的有书名索引、著者索引、引文索引等按文献内容特征组织索引的有分类索引、主题索引,2023/3/1,93,文摘法就是用简短精炼的文字编写文献主题内容的摘要,它比主题法、分类法更能对信息内容作深入揭示。文摘是以提供文献内容为目的,不加评论和补充解释,简明、确切地记述文献重要内容的短文,一般要起到报道和检索的双重作用。文摘可按照不同的标准划分为多种类型,如指示性文摘和报道性文摘。,5 文摘组织法,2023/3/1,94,指示性文摘(indicative abstract)是一种简短反映原文献目次或原文献主题范围的文摘,不提供具体事实和结论。它一般不提供信息内容,因而不能够代替原始文献,只起到题解的作用。报道性文摘(informat