信息检索工具与方法.ppt
《信息检索工具与方法.ppt》由会员分享,可在线阅读,更多相关《信息检索工具与方法.ppt(32页珍藏版)》请在三一办公上搜索。
1、1,信息检索课件,第二讲 信息检索工具与方法,2,主要内容,1 信息检索的定义 2 信息检索原理 3 检索点(access point)4 信息检索的类型 5 信息检索方法 6 信息检索步骤 7 信息检索手段 8 信息检索语言 9 检索效率评价,3,1 信息检索的定义,信息的无限增长与人类有效利用信息之间的矛盾促使信息检索的诞生和发展。信息检索有广义与狭义之分,狭义的信息检索指从众多信息集合中迅速准确地查寻出用户所需信息的全过程(下图下半部分);广义的信息检索指根据用户的需要找出有关的信息资料的过程和技术,又称信息的存储与检索,或信息的存取。,4,信息存储与检索过程,5,2 信息检索原理,各种
2、检索系统的检索原理基本相同,简单地讲就是对信息集合与需求集合的匹配与选择。信息检索的基本原理如下图所示:,6,外部特征,内部特征,存储过程,检索过程,文献的表面信息,如题名(书名或篇名)、著者、机构、ISBN号、专利号、报告号等。如按照篇名、著者、机构名称的字顺或汉语拼音字母顺序排列;按专利号或报告号的数字顺序进行排列等,就形成了以文献外表为特征的检索途径。,文献内容中所论述的主题、观点、见解和结论等。如分类途径、主题途径等。,把大量的原始文献,根据其外部特征和内容特征进行归类、标引,形成一定的检索系统,如对文献信息进行主题分析,形成主题概念,将主题概念转换成主题标引词,对文献信息中的语言进行
3、规范,形成标准的检索语言,存储在检索系统中。,根据检索需要,对检索课题进行主题分析,把所涉及的检索范围明确起来,形成能代表信息需求的主题概念,并将主题概念转换成信息检索语言标识,然后与存储在系统中的检索标识相比较,两者相一致时,才能达到检索目的。,7,3 检索点(access point),检索入口,检索信息的重要出发点。为了更好的利用信息,人们根据每件信息内部和外部特征而设置了检索点,以此作为检索信息的入口。一般来说,设置的信息检索点主要有分类、主题、名称、著者、代码等。,8,4 信息检索的类型,文献检索,数据检索,事实检索,书目检索,全文检索,按检索对象分,超文本检索,多媒体检索,超媒体检
4、索,按信息组织技术及内容分,9,5 信息检索方法,常规法,追溯法,循环法,顺查法,逆查法,信息检索方法,抽查法,10,6 信息检索步骤,(1)分析研究课题,确定查检要求(2)选择检索工具(3)确定检索途径和方法(根据外部特征、内容特征提供不同的检索途径)(4)实施检索操作,索取原始文献,11,7 信息检索手段,(1)手工检索:手工翻检,利用工具书来检索信息。简单、灵活、容易掌握,但费时费力,容易误检和漏检。(2)计算机检索:检索方便快捷,检索功能强大,获得的信息类型多,检索范围广泛,但不能完全取代手工检索。,12,8 信息检索语言,信息检索语言是受控语言,用来表达信息的概念,有一定的编制规则,
5、用特定的标识符号标引、组织和编排信息,信息检索语言有两大类:,13,期刊的外部特征举例:,期刊的外表特征:期刊名、出版者、出版地、出版日期、卷期号、ISSN(国际标准刊号)、国内统一刊号(CN)、邮发代号、价格等。ISSN号(International Series Standard Number)是国际标准刊号的简称,由 8位数字分2段组成。如英文期刊标准著录格式:Y.Gong.Speech recognition in noisy environments:A SurveyJ.Speech Commum.Vol.16,no.3,pp.261-291,Apr.1995 其中:论文著者;论文题
6、名;刊名(外文期刊多数为斜体);卷、期号;起止页码;出版日期再如中文期刊标准著录格式:胡翠华.证券信息服务商业化运作研究J.情报科学,2005(9):12811286,14,图书的外部特征举例,如图书著录:徐天秀.信息检索M.北京:科学出版社,2006.2参考文献中出现的图书著录格式:C.M Bishop.Neural Networks for Pattern RecognitionM.Oxford,U.K:Clarendon,1995参考文献中会议论文集的论文著录:R.Cole,R.Stern,and M.Lasry.Performing fine phonetic distinctions
7、:Templates vs.featuresJ.in Inference and Variability of Speech Processes.J.Perkell and D.Klatt.New York:Lawrence Erlbaum,1986,pp.325-341.例中:著(编)者;书名(一般用斜体);出版地;出版社名称;出版时间;论文著者;论文题名;起止页码。,15,8.1 分类检索语言,中国图书馆分类法(中国图书馆图书分类法),简称中图法我国大陆地区使用最广泛,使用此法的图书馆占90%以上,5部22大类。类号采用“字母数字混合制”标记,一个或两个拉丁字母和一串阿拉伯数字来代表一个具
8、体的类目。如:F0经济学、TB9计量学层累制,分类号每三位用.空格,标记清晰;辅助符号增强标记功能,如a推荐号,-总论复分号,/起止符号,交替类号,;组配;()国家区分号,=时代区分号等。有单机版和网络版,网络版见,16,8.1 分类检索语言,中国科学院图书馆图书分类法,简称科图法中科院图书馆编制。主要用户为中国科学院系统下属图书馆和资料部门。用户数居全国第二位。类号标记采用纯数字制,5部25大类。如:27.1政治经济学总表见:,17,8.1 分类检索语言,杜威十进分类法 简称DDC。由美国著名图书馆学专家杜威(Mevil Dewey)于1876年编制。目前已出版第21版。在世界上拥有最多的用
9、户。各国的十进分类法基本上以杜威法为参照模式,9类,用19表示,综合性的为0。我国1966年以前亦用于西文图书分类。网上可查到:21版千分表:哈尔滨工业大学(威海分校)图书馆提供20版千分表:一位非专业人员在其个人网站提供13简版:加拿大Near North District School Board图书馆提供据OCLC News Releases1997年7月号说明,13简版(1997年出版)与21版(1996年出版)兼容。但经对比,该13简版内容似乎与20版更相近。特别之处在于,此表提供多至4位的类号,在网上很少见,参考性更高些。网上免费的大概只能详细到4位类号了。如果付费,DDC的东家O
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 检索 工具 方法
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5926455.html