欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    信息组织概论第五章.ppt

    • 资源ID:6549760       资源大小:644KB        全文页数:50页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    信息组织概论第五章.ppt

    第五章 信息组织的技术方法主题法,学习要求,主要内容:本章主要介绍主题法的基本知识,主题法的 基本类型,叙词语言的词汇控制,叙词表的 结构,国内外典型的主题词表介绍,主题标 引和主题检索工具以及主题自动标引等。掌握:主题法的类型;词汇控制;叙词表的字顺展开和系统展开;汉语主题词表的结构和使用;主题标引的方法及规则;自然语言标引的形式。了解:国外典型的主题词表;主题自动标引的类型。,第五章 信息组织的技术方法主题法,章节简介,叙词语言的词汇控制,主题法概述,叙词表的结构,第五章 信息组织的技术方法主题法,章节简介,主题标引和主题检索工具,国内外主题词表介绍,主题标引自动化的实践与研究,5.1主题法概述,主题法与分类法,主题及主题词,主题法,主题是指信息资源论述的主要对象,包括事物、问题、现象等。经过选择,用来表达信息资源主题的语词,称为主题词。,主题法是指直接以表达主题内容的语词作检索标识、以字顺为主要检索途径,并通过参照系统等方法揭示词间关系的标引和检索信息资源的方法。,主题法与分类法,直接以语词作为检索标识,以字顺作为主要检索途径,以特定的事物、问题、现象,即主题为中心集中信息资源,通过详尽的参照系统等方式揭示主题词之间关系,主题法特征,主题法的类型划分,标题法,元词法,按照主题法选词方式,A,B,关键词法,D,叙词法,C,主题法的类型划分,标题法,标题词(subject heading),标题法是用规范化的自然语言语词作标题,直接表达文献主题概念,按照标题字顺排列,并用参照系统显示标题之间关系的一种方法。,标题词是标题法表达文献主题的标识,它是自然语言中经过规范化处理的词或词组,通常为比较定型的事物名称。,主题法的类型划分,元词法,元词(uniterm),单元词法又称元词法,它是以取自自然语言、经过规范化处理的单元词作标识,通过单元词的字面组配来表达主题概念的一种主题法。,单元词用来表达文献主题的、最基本的、在概念上不能再分解的词。,主题法的类型划分,叙词法,叙词(descriptor),叙词法是以规范化的自然语言词为叙词,作为文献主题的标识,通过叙词的概念组配表达主题概念的一种主题法。,叙词是取自自然语言,经过规范化处理的,以基本概念为基础的表达文献主题的词或词组。,主题法的类型划分,关键词法,关键词(key word),关键词法是直接以文献中能够表达主题概念的关键词作标识的一种准主题法。,关键词是指出现在文献题名、文摘、正文中,能够表达文献主题,具有检索意义的语词。,主题法的类型划分,按照语词标识的组配,先组定组式主题法,先组散组式主题法,后组式主题法,指复杂主题的标识,在词表中就已经组配好了的,使用时,可以直接从词表的标识中选题。,指复杂主题的标识,在词表中并未组配,而是在标引阶段根据标引文献资源的主题需要进行组配。,指读者检索前,主题检索系统中的主题词是单立的,读者实施检索后,才根据检索需要进行组配。,主题法类型,主题法的类型划分,按照语词使用是否进行控制,非受控主题法,受控主题法,非受控主题法是指直接使用文献或用户检索使用的自然语言语词进行的整序方法。,受控主题法指依据特定词表或类表揭示文献信息的整序方法。,5.2叙词语言的词汇控制,词类和词组控制,从标引和检索的实际需要出发,考虑各学科的发展现状及发展。,选择的语词概念明确,一词一义,符合科学性、通用性等特点,适宜于准确表达文献主题和检索提问。,语词的选择要求既能发挥组配的优越性,又能兼顾词汇的专指性;既考虑单词也考虑具有造词功能的词和词组。,选定的词语要符合汉语的构词特点,在词形上符合作为语词标识的要求,并尽量选用便于字面成族的词。,词汇选择原则,词类和词组控制,词汇选择,词组控制,词类控制,若将词组分解后用于组配会影响用户对其含义的正确理解或不符合用户的使用习惯,就不应该将词组分解,而应选择词组作叙词;反之,就不应该选择词组作叙词。,以名词为主,并少量收入形容词,按照反应事物概念的数量特点,叙词可以分为普通名词和专有名词两种。,词性和词义控制,词形控制主要指对同义不同形的词,优选其中的一种形式作叙词,以避免信息分散而的降低查全率,有利于字顺排列。,词形控制,词形控制的内容词形控制不同拼写形式、单复数的控制外来词的控制符号和数字的控制词序的控制同义词的控制准同义词的控制,词性和词义控制,加限定词或限义符号,词义控制,加注释,主要是对多义词、同形异义词和词义含糊而导致理解不一的词进行处理,使叙词的词义具有单一性和明确性。,词间关系控制,等同关系,相关关系,DY,词间关系控制,FSZ,等级关系,C,5.3叙词表的结构,5.3叙词表的结构,叙词表,叙词表,从其功能来讲,它是将文献著者、标引者和读者的自然语言,转换成规范化的叙词语言的一种术语控制工具;从其体系结构来讲,这种工具实际上是以规范化的、受控的和动态性的叙词作为基本成分,以参照系统显示词间语义关系,并通过叙词的字顺表和辅助索引,用于标引、存贮和检索文献的一种情报语言词汇表。,5.3叙词表的结构,提供一种知识结构,用来揭示概念之间的关系,帮助使用者理解知识领域的结构。,提供一种词汇控制工具,指导标引者和用户使用一致的词进行标引和检索。,提供一种术语参照系统,使得用户可以通过它扩大或缩小查找范围,系统检索。,提供一种动态词汇集合,使得任何新的概念可以以用户能够理解的方式纳入词汇系统中的相应位置。,5.3叙词表的结构,字顺展开,字顺表,字顺表的功能,字顺表是将众多叙词款目和非正式叙词款目按字顺排列的词汇表。,为标引和检索人员提供直接从概念名称的字面形式出发,按字顺迅速查找所需叙词的途径;通过参照系统及有关标注项帮助查词者判定叙词的含义,找到更恰当的词或更多的词。,字顺展开,款目词项,参照项,款目词汉语拼音外语译名,字顺表微观结构,标注项,范畴号序号族首词序号注释,3种词间关系及其显示符号,5.3叙词表的结构,汉表叙词款目样例,字顺展开,字顺索引,入口词表,字顺索引只将叙词、非叙词按字顺排列,而不包含叙词款目中的其他项目,除了非正式叙词含用项参照外。,入口词表是将非正式叙词按字顺排列,并指出其对应叙词的索引。,字顺展开,专有叙词表,专有叙词表的作用,专有叙词表是将专有名称叙词或非正式叙词款目按字顺排列,单独集中展示的词汇表。,缩小主表的篇幅,方便从字顺查词;方便用户从范畴出发对专门领域的叙词进行查检;便于对上述领域叙词及时管理或增补。,字顺展开,双语种对照索引,双语种索引作用,双语种对照索引是将全部或大多数叙词与其外语译名相对应,按外语译名字顺排列的词表,是通过外文译名使用词表的辅助工具。,有助于标引另一语言的文献时选择叙词;便于借助本国叙词表查检其他国家的检索工具;作为中外文对照的规范化术语词典使用。,系统展开,范畴索引,范畴索引功能,范畴索引又称范畴表、分类索引,它是将叙词表正式叙词和非正式叙词表达的概念所涉及的学科或范畴分成若干大类(范畴),大类之下再分出若干二级或三级小类,在小类之下,才将所属的叙词按字顺排列的一种词汇索引。,提供从内容角度查词的途径,便于从分类角度查找与某一范畴有关的叙词;可以作为概略分类的依据,类分信息资源,编制分类检索工具;在叙词表编制工作中发挥积极作用。,系统展开,类目的设置,类目的组织,类目的标记符号,范畴索引中的收入词,范畴索引的微观结构,系统展开,词族索引,词族索引功能,词族索引是将字顺表中具有等级关系的叙词按属分等级构成词族,并按各词族的族首词字顺排列的词汇索引。,提供从族首词出发查找所需叙词的途径;借助上位词、下位词和同位词,明确词义;机检系统中,自动进行上位词登录,满足族性检索要求;方便进行扩检和缩检。,系统展开,收词限制,族首词,词族规模,词族显示,词族索引的微观结构,系统展开,轮排索引,轮排索引作用,轮排索引又称为轮排表,它是将叙词表的全部叙词按其所含的词素的字顺进行排列,使含有相同词素的叙词集中在一起的词汇表,它是一种从词素的角度查找叙词的辅助工具。,提供查找叙词的多个字顺入口;将含有相同词素的词集中在一处,便于用户选准或选全所需叙词。,5.4国内外主题词表介绍,5.4.1美国国会图书馆标题表,复分标题,分类号,注释,正式标题款目的结构,5.4.2医学标题表,NEOPLASMSConsider also terms at CANCER,CARCINO-,ONCO-,and TUMORC4+Avoid:too general;prefer specifics;policy:Manual Section 24;/Chem.Ind permittedBut consider also CARCINOGENS;CATALOG:from qualify permitted/diagnosis was NEOPLASM DIAGNOSIS 1964-65;CARCINOGENESIS was heading 1977Yse NEOPLASMS/CI or NEOPLASMS/ET to search CARCINOGENSIS 1977See relatedDNA,NEOPLASMSONCOGENIC VIRUSESX CANCERX TUMORSXR MEDICAL ONCOLOGY,MeSH款目的结构,5.4.3汉语主题词表,中国编制的大型综合性中文叙词表。中国科学技术信息研究所与北京图书馆主编,1980年科学技术文献出版社出版。共收正式叙词91158条,非叙词17410条,范畴类目分为三级。1991年自然科学部分出增订本,增补新词8221条,删除不适用词5434条。汉语主题词表分3卷10册:第一卷(2册)为社会科学部分,第二卷(7册)为自然科学部分,两部分均包括字顺主表、范畴索引、词族索引和英汉对照索引,第三卷为附表,包括世界各国政区名称、自然地理区划名称、组织机构名称及人物名称。具体实例详见5.3叙词表的结构。,5.4.4社会科学检索词表,社会科学检索词表是中国社会科学院文献信息中心编制的一部供社会科学文献资料标引和检索的词表。该词表采用分类主题一体化的形式,其分类表部分使用与传统分类体系结合的分面结构。词表的编制自1987年立项开始,到1993年12月结束,前后历时7年,期间经过试标引和反复修改、充实。全表共收词23,000个,其中正式叙词18,874个,非叙词4,126个,由分类表、字顺表和英汉译名对照表3部分组成,是国内供社会科学领域文献单位进行多学科标引和检索的工具。,5.5主题标引和主题检索工具,主题检索工具和主题检索系统,4,常见的主题标引方式,整体标引,全面标引,对口标引,综合标引,分析标引,主题标引方式,主题标引方法,查找并利用已有标引成果,主题分析,转换标识,标引记录,审核,查重,查找统一标引成果,查找联合标引成果,查看在版标引成果,标引工作程序,主题标引方法,主题分析是主题标引的基础环节,正确的标引必须以正确的主题分析为前提。,主题分析,主题结构分析,主题类型的分析,根据信息资源的主题数量分为单主题和多主题;根据主题中主题概念的数量及其关系分为单元主题、复合主题和相关主题。,对主题结构分析的目的是,在分析主题类型的基础上,进一步对文献中复合主题的成分进行分析,以便查明主题构成因素及其相互关系,对主题概念进行提炼。,主题概念转换,主题概念的转换就是把用自然语言提炼的主题转换为正式主题词表达的主题。,主题标引方法,自然语言标引,自然语言标引是指采用原文中的信息作为标引源,从中选取能够有效表征信息内容的特征词。,自然语言标引和检索实践,自然语言标引和检索实践,自动标引,关键词法,文本检索,自由标引,自然语言入口词检索,自然语言标引主要方式,关键词法是最早用于计算机情报检索的自然语言形式,早期主要用计算机自动抽取文献题名、文摘或正文中有检索意义的语词,通过轮排生成各种类型的关键词索引,包括题带上下文的关键词索引(内关键词索引和题外关键词索引)、不带上下文的关键词索引(纯关键词索引和词对式关键词索引)等,这是在手工检索工具中。在建立数据库供计算机检索使用时,关键词索引一般以倒排档的方式组织。,自然语言标引和检索实践,自动标引,关键词法,文本检索,自由标引,自然语言入口词检索,自然语言标引主要方式,文本检索是一种不进行标引,直接利用计算机的功能,通过自然语言中的语词或语词组配,对文本形式的信息资源进行匹配检索的方式。优点:不需要标引,对信息资源的处理速度快,可以及时投入运行。缺点:检准率低,自由标引是不依赖词表的一种主题标引法,标引人员在对文献的情报内容进行分析之后,按一定规则自拟标引用词来表达文献主题。优点:标引速度快,成本低;专指度高,检准率高;标引员业务水平高标引质量则高。缺点:不能适应对海量有序化组织的需要。,自然语言入口词检索包括受控系统中使用入口词表检索与后控检索。受控系统的入口词表,由不用作标引的非正式主题词组成,本身不用来标引,只起入口作用。检索时,将入口词转换为对应的标引词进行匹配查找。后控词表中的入口词表既用作检索入口,本身也可以用于标引。在通过后控词表进行检索时,利用表中对词间关系的处理,同时使用检索提问中输入的语词和与该词对应的等同关系的自然语言语词检索查找。,主题标引全自动化研究,自动标引,关键词法,文本检索,自由标引,自然语言入口词检索,自然语言标引主要方式,自动标引是自动标引采用计算机来“阅读”被标引的信息内容(如题名、文摘或全文,并在计算机“读取”关键性词汇时,利用词频统计等测定方法,或者使用同预先存储在计算机中的主题词表中的词进行对比、分析等方法,对信息资源进行主题分析和选定标引词。关键问题:取出关键性词汇;分析确定标引词分成两种形式自动抽词标引自动赋词标引,思考题,1.什么叫主题法?主题法具有哪些特点?2.试比较分析四种主题法。3.采用什么手段对主题词进行词义控制?4.主题词之间存在哪些词间关系?5.主题词表的宏观结构和微观结构都包含什么?熟练识别各种微观结构。6.熟练掌握并使用汉语主题词表。7.简述汉语主题词表的优缺点。8.主题的类型分为哪些种?9.什么是主题分析?10.试论述信息标引工作中分类标引和主题标引的异同。11.信息标引分为哪些方式?12.简述主题分解转换的具体操作方法及其注意事项。13.掌握主题标引的方法与规则。14.什么是自然语言标引?15.自然语言标引包括哪些方式?各主要方式具有什么特点?16.主题自动标引可以通过哪些方法实现?,

    注意事项

    本文(信息组织概论第五章.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开