文献检索课件6文献信息检索及原文获取.ppt
《文献检索课件6文献信息检索及原文获取.ppt》由会员分享,可在线阅读,更多相关《文献检索课件6文献信息检索及原文获取.ppt(50页珍藏版)》请在三一办公上搜索。
1、7 文献信息检索及原文获取,7.1 信息检索基础7.2 信息检索途径、方法与步骤 7.3 一个检索案例7.4 检索效果评价7.5 文献原文获取,7.1 信息检索基础,(1)什么是信息检索(2)信息检索原理(3)信息检索系统(4)信息检索语言,(1)什么是信息检索,信息检索就是在信息的海洋里“大海捞针”。如何捞?利用过滤技术。过滤技术的形式是多样的:筛子:筛沙,筛米,筛面风:如“扬场”利用自然风,风车用人造风。磁场:如用“质子回旋加速器”把质子和其他粒子分离水:利用浮力差别其他条件限制:身高、年龄、体重、学历、相貌、地域、出身、单双号限制等等,案例:李开复从30万图片邮件中找出20封邮件(离开微
2、软到GOOGLE)。方法:把图片转换为文字,再检索。信息检索(Information Retrieval):依据一定方法,从已经组织好的有关大量信息集合中,查出特定的相关信息的过程。按照检索对象的不同,可分为文献检索、数值检索和事实检索。信息检索利用检索词、检索条件实现过滤。,(1)什么是信息检索(续),信息检索包括存储和检索两个方面。A信息存储的过程信息采集:根据一定的规则收集信息。信息标引、著录。对信息的内容特征和形式特征进行揭示和描述。编制检索工具或建立检索系统。,(2)信息检索原理,B信息检索的过程 信息存储的逆过程。用户根据信息需求,选取合适的检索词(标题、著者姓名、主题词、分类号等
3、),利用检索工具或检索系统查找出相关信息。查找的过程实际上是一个匹配的过程,即确定检索词并将检索词与标引词做相符性比较,二者一致,就算找到了符合要求的信息。,(2)信息检索原理,(2)信息检索原理,现举例说明信息存储和信息检索的过程。有3篇文献:文献1:A Model of multimedia information retrieval文献2:The Information retrieval in chemistry WWW server文献3:ERIC resources,(2)信息检索原理:举例,对3篇文献的内容进行分析,并使用检索语言对其进行标引,标引结果为:文献1篇名(title)
4、:A Model of multimedia information retrieval主题(subject):information retrieval,multimedia computer applicatons文献2篇名(title):The Information retrieval in chemistry WWW server主题(subject):chemistry,educational materials文献3篇名(title):ERIC resources主题(subject):educational materials标引后,这3篇文献分别被存储到数据库。,(2)信息检
5、索原理:信息存储过程,如果用户输入“information retrieval”一词,并将检索范围限定在篇名中,则文献1、文献2符合用户要求,成为检索结果。如果用户输入“information retrieval”一词,并将检索范围限定在主题中,则只有文献1符合用户要求,成为检索结果。如果用户输入“educational materials”一词,并将检索范围限定在主题中,则文献2、文献3符合用户要求,成为检索结果。如果用户输入任意其他词汇如“mathematics”,则没有任何检索结果。这里,“information retrieval”、“educational materials”等就是
6、检索语言,即具体的检索词,篇名和主题就是检索语言的标识。检索系统就是通过他们将用户需求与信息内容进行匹配运算,最终找到检索结果的。,(2)信息检索原理:信息检索过程,广义地,信息检索系统是包含了从信息采集到信息检索全过程的服务体系。狭义地,信息检索系统就是指用户查找信息所使用的检索工具或系统。,(3)信息检索系统,(4)信息检索语言,A信息检索语言的含义与作用B信息检索语言与自然语言的区别C信息检索语言的类型,信息检索的实质,就是人们的信息提问与信息的检索标识相比较后决定取舍的过程。一致,就“命中”了信息。不一致,就继续查找。信息的标识用词和检索用词使用共同的语言来表达。这种在信息的存储和检索
7、过程中共同使用的语言,就是信息检索语言。又称为情报检索语言、索引语言、标引语言。,A信息检索语言的含义与作用,自然语言具有多义性信息检索语言是人工语言,具有唯一性。信息检索语言对要对一词多义或多词一义的语词进行规范化处理,例如:自行车、单车、脚踏车;鲁迅、周树人。各种文献分类法,如中国图书馆分类法、国际十进分类法,以及各种主题词表,如中国分类主题词表、工程索引(Ei)叙词表等,都是检索语言。,B信息检索语言与自然语言的区别,信息检索语言按照其构成原理,可分为分类检索语言主题检索语言代码检索语言,C信息检索语言的类型,D-1分类检索语言中国图书馆图书分类法(简称中图法)中国科学院图书馆图书分类法
8、(简称科图法)杜威十进分类法(DDC)与国际十进分类法(UDC)美国国会图书馆分类法(LC),D常用信息检索语言介绍,依据:毛泽东同志在整党的作风中的一段话 什么是知识?自从有阶级的社会存在以来,世界上知识只有两门,一门叫做生产斗争知识,一门叫做阶级斗争知识。自然科学、社会科学就是这两门知识的结晶,哲学则是关于自然知识和社会知识的概括和总结。此外还有什么呢?没有了。设置5大部类22大类,见下表。,中图法,中国图书馆图书分类法,设置5大部类,25大类。科图法五大部类马克思列宁主义、毛泽东思想哲学社会科学自科科学综合性图书,科图法,00 马克思列宁主义、毛泽东思想哲学社会科学 历史、历史学 经济、
9、经济学 政治、社会生活 法律、法学 军事、军事学 文化、科学、教育、体育 语言、文字学 文学 艺术 49 无神论、宗教学,科图法,50 自然科学 51 数学 52 力学 53 物理学 54 化学 55 天文学 56 地质、地理科学 58 生物科学 61 医药、卫生 65 农业科学 71 技术科学 90 综合性图书,DDC:Dewey Decimal Classification UDC:Universal Decimal Classification 杜威十进分类法受美国圣路易斯市图书馆哈利斯分类法的影响,根据17世纪英国哲学家培根关于知识分类的思想,将人类知识分为记忆(历史)、想象(文艺)和
10、理性(哲学、即科学)三大部分,并将其倒置排列,展开为10个大类。国际十进分类法(UDC)又称通用十进分类法,是在杜威十进分类法的基础上发展而成的,使用十分广泛。,杜威十进分类法(DDC)与国际十进分类法(UDC),000总论 100哲学 200宗教 300社会科学 400语言 500自然科学和数学 600技术(应用科学)700艺术、美术和装饰艺术 800文学 900 地理、历史及辅助学科,杜威十进分类法(DDC)与国际十进分类法(UDC),0总类、科学和知识1哲学、心理学2宗教、神学3社会科学4(语言)5数学和自然科学6应用科学、医学、技术7艺术、娱乐、体育8语言、语言学、文学9地理、传记、历
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文献 检索 课件 信息 原文 获取

链接地址:https://www.31ppt.com/p-5986664.html