《信息检索》PPT课件.ppt
《《信息检索》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《信息检索》PPT课件.ppt(137页珍藏版)》请在三一办公上搜索。
1、信息海洋冲浪的基本方法与技巧“掌握”航海工具箱,主要内容,工具箱检索系统,工具箱信息检索,工具箱检索语言,一、信息检索,信息检索的概念,信息的存储过程,信息的检索过程,1 信息检索概念引例,汽车燃料,中国图书馆分类法,交通运输类(U),汽车用燃料、润滑料类(U473),中国图书馆分类法,信息检索概念,广义信息检索:包括信息存储与查找两个过程,狭义信息检索:指信息的查找。,信息检索(information retrieval):是按照一定方式从信息集合中或数据库中查找所需信息的具体过程。,广义信息检索基本原理,引例,U473/12,汽车用燃料、润滑料类 U473,交通运输类U,U473/12,U
2、473,U,例如:,车用替代燃料与生物智能,2 信息的存储,信息的存储过程:按照检索语言(主要是主题词表和分类表)及其使用规则对每条原始信息进行处理,形成一系列信息特征标识,组成一条记录。许多条记录形成有序的信息集合。,标引:为纳入检索工具或系统的每一种期刊或 每一篇文献等标引检索标识。著录:将文献的有关特征标识著录下来,形成一条条文献线索。著录是遵循1983年我国颁布的中华人民共和国检索期刊条目著录规则(GB379383)中的规定对文献的著录项目和格式。排序:将它们系统地排列到检索工具或系统中去供读者查找。,文献存贮过程,信息存储,信息集合,存储标识,3 信息的检索,信息的检索过程:按照同样
3、的主题词表或分类表分析检索需求,形成检索提问标识。依据信息存储时所形成的检索途径,从信息集合中查找与检索提问标识匹配的信息特征标识。,信息的检索,信息集合,检索标识,信息检索原理,文献替代 文献整序 文献特征标识与检索提问标识的匹配,文献替代,一次文献的文献特征标识(外部特征和内容特征)按一定的标准格式著录成它的替代文献(二次文献)的过程。著录项目与格式:中图分类号题名/著者(著者所在单位 邮政编码)/刊名/主办单位.出版年,卷(期).所在页码文摘。图x表x参x(文摘员),将杂乱无章的替代文献(二次文献)按一定的顺序(通常按学科类目)排列,并编制各种索引的过程。经过文献替代和文献整序后,完成了
4、文献存储的过程。,文献整序,信息检索的过程就是文献特征标识与检索提问标识两者匹配的过程为了实现这种匹配,标引人员和检索人员必须采用一种共同的语言,即检索语言。,文献特征标识与检索提问标识的匹配,信息检索的种类,按照检索对象,把信息检索分为:文献检索数据检索事实检索,文献检索,是指查找用户所需文献的线索或者原文的检索。如查找某一主题的相关文献,对某研究课题立项的文献查新,或从事新产品开发时需要查找有关最新研究动态等。文献检索是一种相关性检索,检索结果是某一专题的文献线索(文摘、题录),一般要经过阅读文摘后才能决定取舍。文献检索主要是利用二次文献进行,如各种载体形式的目录、题录、文摘、索引等。文献
5、检索是信息检索中最基本、最重要的类型。文献检索是信息检索的核心和和主体部分,是最常用的一种检索。文献检索分为数目检索和全文检索。其目标是检索出原始文献或原始文献的替代品。,数据(值)检索,是指查找用户所得特定数据的检索。目标是检索出可以直接使用的数据或数值,例如查找各种统计数据、图像、图标、图表、数学表达式、化学分子式、设备型号、技术参数等。譬如,检索“尼罗河的长度是多少”。数据检索是一种确定性检索,主要是利用各种词典、手册、百科全书、年鉴等参考工具书进行也可以利用各种参考型数据库进行检索。,事实检索,是指以特定的事实为检索对象的一种检索。如查找某一名人、机构的基本情况;某一事件发生的时间、地
6、点、过程等。如,检索“长江哪一年汛期的水位最高”。事实检索和数据检索一样,也是一种确定性检索,所不同的是需要对检索出来的数据进行较为复杂的对比、分析、推理后,方可得出结论。可利用百科全书、手册、年鉴、名录及相关数据库等参考工具进行检索。,信息检索的种类,按照计算机检索技术划分联机检索光盘检索网络检索,联机检索,联机检索是以联机检索提供商为中心,提供商研制自己的软件,建立自己的联机检索系统,用户利用检索系统终端,通过专用的或公用的电话线路等数据通讯网络与利用检索系统相连,按照提供商所指定的各项检索规则进行检索。联机检索系统由主机系统、数据库、通讯设备和终端设备组成。著名的联机检索系统有:OCLC
7、、Dialog、STN等。DIALOG系统:目前世界上最大的商业性国际联机检索系统,拥有450多个数据库,其中也包括若干医药卫生数据库。,光盘检索,光盘检索有单机检索和联机检索两种。单机检索系统自成系统,由普通计算机、光驱、数据库光盘以及相应的检索软件和驱动软件构成,提供单个用户使用。联机检索系统在光盘网络的环境下运行,受到光盘塔和局域网的支撑,在局域网内提供多个用户使用,由服务器管理。,网络检索,基于搜索引擎技术的网络检索时随着互联网的兴起和普及而出现的。网络搜索引擎是当今网络检索工具的主流,不仅提供文本检索,还可以提供图像、图形、音频、视频、动画等多媒体检索。,检索种类,计算机检索 指人们
8、在计算机或计算机检索网络的终端机上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出需要的信息,继而再有终端设备显示或打印的过程。,二、检索系统,检索系统的概念,检索系统的分类,1 检索系统的概念,信息检索系统:由一定的设备和信息集合构成的服务设施称为信息检索系统。例如:中国期刊网(CNKI)、在线公共目录检索系统(OPAC)、工程索引(EI),2 检索系统分类,检索系统分类:,2.1目录检索系统,目录检索系统:用于对出版物进行报道和对图书资料进行科学管理。常用目录检索系统:在线公共目录检索系统(OPAC)、中国高等教育文献保障系统(CALIS)联合目录公共检索系统。,目
9、录检索系统,北航图书馆的OPAC(http:/202.112.134.140:8080/opac/),OPAC检索主界面,检索结果,著录信息与馆藏地信息,著录信息,分类浏览书目,点击相关学科,可以查看图书类目,期刊导航,目录检索系统,国家图书馆联机公共目录查询系统(http:/F),目录检索系统,检索结果,多库检索,组合检索,目录检索系统,CALIS(http:/),信息素养,目录检索系统,检索结果,显示馆藏信息,查看第二本的馆藏地,馆藏地信息,其他的目录检索系统,全国联合目录网上系统国家科技图书文献中心中国科学院图书馆http:/159.226.100.4/search*chx/,2.2 文
10、摘检索系统,文摘检索系统:用于对信息题录和文摘的检索,检索结果一般是文献的来源信息。常用文摘检索系统:工程索引(EI)、引文索引(SCI)、科技会议录索引(ISTP),文摘检索系统,EI数据库(图书馆主页-电子资源-文摘数据库-EI),检索词,选择字段,文摘检索系统,检索结果,文摘检索系统,2.3 全文检索系统,全文检索系统:全文也包括内容简短的事实和数据,全文检索系统集文摘检索与全文提供于一体。常用的全文检索系统:中国知网(CNKI)、Science Direct,全文检索系统,CNKI(图书馆主页-电子资源-全文数据库-CNKI),全文检索系统,检索结果,全文检索系统,CNKI 附加的资源
11、,CNKI的期刊导航,核心期刊导航,外语类的核心刊,检索系统小结,三、检索语言,检索语言基础知识检索语言的分类检索运算符,检索语言,信息检索语言是用来描述信息的内容特征和形式特征以及表达信息用户的语言。它是根据文献信息的存储和检索的需要而编制的一种人工语言,又称检索标识。它把信息的存储与检索联系起来使信息的标引者和检索者取得共同理解,从而实现检索目的。是沟通信息存储和信息检索的桥梁和纽带,也是信息用户获取所需信息全过程得以顺利实现的保证。,1 检索语言的基础知识,检索语言,概念,作用,检索原理,检索语言的基础知识,信息检索语言:用于描述信息系统中信息的内容特征和外表特征,并可以表达用户提问的一
12、种专门语言。作用:信息存储 信息检索,检索语言,检索语言的基础知识,文献存储子系统 文献检索子系统,信息群,主题分析,编制目录文摘索引,概念转换,概念转换,主题分析,查找,用户群,信息集合,著录标引过程,检索语言,目录数据,待标文献,特征标识,主题概念,用户提问,主题概念,检索标识,编制检索策略过程,检索原理,信息检索的原理:用检索标识与信息的存储标识相比较,若取得一致,则为匹配,即可得到命中文献。信息存储 信息检索,检索语言,2 检索语言的分类,按照描述信息的特征分,检索语言的分类,按构成原理划分,分类语言,主题语言,分类语言,分类语言:是以号码为基本字符,用分类号和类目表达文献主题概念的检
13、索语言。特点:是用分类号表达各种概念,根据概念之间的关系,把它们组织成一个逻辑体系。,分类语言,作用:,1.反映知识的分类或社会实践活动的职 能分工,具有较好的系统性。2.把同一学科、同一专业、同一职能活 动的文献集中在各个类目之下,满足 族性检索(类检索)需要。,分类语言,分类语言的具体表现形式是分类表,如在国内图书馆常用的中国图书馆分类法。分类表的作用:指导存储文献,正确标引出分类号 适用于从分类的角度检索某一类的文献,分类语言,国内:中国图书馆分类法 科学院图书馆分类法 人民大学图书馆分类法 国外:杜威十进分类法(Dewey Decimal Classification and Rela
14、tive Index)美国国会图书馆分类法(Library of Congress Classification),分类语言,基本大类A 马克思主义、列宁主义、毛泽东思想B 哲 学C 社会科学总论D 政治、法律 TB 一般工业技术E 军 事 TD 矿业工程F 经 济 TE 石油、天然气工业G 文化、科学、教育、体育 TF 冶金工业H 语言、文字 TG 金属学、金属工业I 文 学 TH 机械、仪表工业J 艺 术 TJ 武器工业K 历史、地理 TK 动力工程N 自然科学总论 TL 原子能技术O 数理科学和化学 TM 电工技术P 天文学、地球科学 TN 无线电电子学、电信技术Q 生物科学 TP 自动
15、化技术、计算技术R 医药、卫生 TQ 化学工业S 农业科学 TS 轻工业、手工业T 工业技术 TU 建筑科学U 交通运输 TV 水利工程V 航空航天X 环境科学、劳动保护科学Z 综合性图书,分类语言,分类语言,索书号,TN0308,V24/E:08,(E)V2408,TN03/08,英,日,俄,德,主题语言,主题语言:是一种描述语言,即用自然语言中的名词、名词性词组或句子描述文献所论述或研究的事物概念例如:我们在搜索引擎中查找文献时输入的“汽车燃料”就是主题语言的一种,主题语言,特点:直接用词语来表达各种概念。它以词汇规范化为基础,通过概念组配用以表达任何专指概念。具有较好的专指性,便于特性组
16、配检索。直指性强,专指度高的特点。,主题语言,叙词词表中的关联关系,Y(用)USE 指引正式主题词 D(代)UF 指引非正式主题词 S(属)BT 指引上位主题词 F(分)NT 指引下位主题词 C(参)RT 指引相关主题词 Z(族)CC 指引族首主题词(最上位词),Fei ji zao sheng Wu ran yuan飞机噪声 污染源*Aircraft noise Pollution source D 航空噪声 F 臭气源 F 轰声 点污染源 S 噪声源 电磁污染源 Z 污染源*放射性污染源 C 交通噪声 非点污染源 工业污染源 固定污染源Hang kong zao sheng 农业污染源航空
17、噪声 热污染源(增词时间:1989年)移动污染源 Aircraft noise 噪声源 Y 飞机噪声 C 污染物*Hong sheng Zao sheng yuan轰声 噪声源 Sonic boom Noise source S 飞机噪声 F 电器噪声 Z 污染源*飞机噪声 火车噪声,叙词表编排体系结构举例,非正式主题词,下位词,上位词,族首词,相关词,正式主题词,信息检索方法,1.检索工具法2.追溯法3.分段法4.浏览法,检索工具法,(1)顺查法:以课题研究的起始年代为起点,由远而近按时间顺序逐年查找的方法(2)倒查法:由近而远按时间顺序逐年查找的方法(3)抽查法:针对学科发展的高峰期,选
18、取一定时间段进行查找的方法,追溯法,是指利用已知文献后所附的参考文献入手,逐一追查原文,再从此原文后所附的参考文献逐一查找下去,直到获得满意的结果。,分段法,又称循环法、交替法、综合法。即利用检索工具法和追溯法交替使用的一种方法。,浏览法,指直接在一次文献中查找所需的文献,也称直接检索法。该方法带有盲目性,一般只作为对上述各种检索方法的补充,主要用于查找新近发表的文献。,信息检索途径,1.分类途径2.主题途径3.著者途径4.其它途径,1.分类途径,是从学科分类角度来查找文献的一种途径。利用目次表或目录来查找。检索文献的关键:分析课题,确定课题所属的类目与检索工具目次表中的类目相匹配,才能查准。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息检索 信息 检索 PPT 课件

链接地址:https://www.31ppt.com/p-5464151.html