计算机信息检索技术.ppt
《计算机信息检索技术.ppt》由会员分享,可在线阅读,更多相关《计算机信息检索技术.ppt(54页珍藏版)》请在三一办公上搜索。
1、8/25/2023,计算机信息检索技术,武汉大学图书馆 理科学科馆员 欧懿,8/25/2023,计算机信息检索技术检索策略的制定与检索实施步骤检索结果的评价与检索策略的调整,本章主要内容,8/25/2023,在进行计算机检索时,有时有一些比较复杂的课题,如:“计算机信息检索”,既涉及计算机,又涉及信息检索,这时候就要编制出满足要求的计算机检索式,它是机检的基础。布尔逻辑检索 截词检索 位置检索 词组检索 字段限定检索,一.计算机信息检索技术,计算机信息检索技术,8/25/2023,运用布尔逻辑算符(Boolean operators)对检索词进行逻辑组配,表达两个概念之间的逻辑关系。布尔逻辑算
2、符主要有:AND OR NOT 在中文数据库里,布尔逻辑运算符有时用AND、OR、NOT表示,有时用“*”、“”及”“。,1.布尔逻辑检索,计算机信息检索技术,8/25/2023,表示概念的相交、限定,缩小检索范围,提高检准率。用运算符号:AND 或*连接检索词 A B A AND B,逻辑与(逻辑乘),计算机信息检索技术,8/25/2023,A=汽车发动机,B=飞机发动机,汽车与飞机发动机,A,B,A and B 逻辑“与”运算,计算机信息检索技术,8/25/2023,人类活动对群落多样性的影响检索概念:人类活动群落多样性影响检索式 人类活动AND 群落多样性 人类活动AND 群落多样性AN
3、D 影响,计算机信息检索技术,8/25/2023,人类活动 and 群落多样性,计算机信息检索技术,8/25/2023,表示概念的平行、并列,用于扩大检索范围,提高查全率用运算符“OR”或“+”连接两检索词 A B A OR B,逻辑或(逻辑乘),计算机信息检索技术,8/25/2023,逻辑或(OR 或+)乙肝病毒的研究检索词:乙肝 乙型肝炎 HBV Hepatitis B virus 检索式:乙肝OR 乙型肝炎OR HBV Hepatitis B virus OR HBV,计算机信息检索技术,8/25/2023,计算机信息检索技术,8/25/2023,去掉一个主题中某一部分的主题,用于缩小检
4、索范围,提高查准率;用运算符号“NOT”或“-”连接两检索词 例1 查“玉米但不是甜玉米”方面的文献。检索式=玉米-甜玉米 例2 查“国外有关数字图书馆方面”的文献 检索式=数字图书馆-国内,逻辑非,计算机信息检索技术,8/25/2023,运算顺序:NOTANDOR 可通过()来改变运算的优先顺序例:乙肝病毒受体的筛选 检索词:HBV、Hepatitis B virus、receptor、screen 检索式:(HBV OR Hepatitis B virus)AND receptor AND screen,AND、OR、NOT的综合应用,计算机信息检索技术,8/25/2023,计算机信息检索
5、技术,8/25/2023,在实际检索中,常遇到词干相同、词义相近的检索词,或同一词的单、复数形式,动、名词形式,英美拼法等。所谓截词检索,是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中计算机会将所有含有相同部分标识的记录全部检索出来。常用“?”、“*”符号表示。用截词符号“?”、“*”或“$”加在检索词的前后或中间,以检索一组概念相关或同一词根的词。这种检索方式可以扩大检索范围,提高查全率。截词运算符号通常有两个:“?、*”。其在不同系统中表示的含义不同。,2.截词检索,计算机信息检索技术,8/25/2023,按截断的位置分:后截断 前截断 中间截断按截词的字符数量分:有
6、限截词 无限截词,计算机信息检索技术,8/25/2023,在检索词后(右方)截断有限或无限的字母。如:librar*library、librarian、libraries 主要用于词的单复数检索、词根检索(socio*)、年代检索(199*),后截断,计算机信息检索技术,8/25/2023,将截词符号放在检索字符串的左方,以表示其左边不管截去有限或无限个字符,只要数据库中具有与截词符后面部分字符相同的检索词的文献,即为命中文献。这种方式也称为后方一致。如:*chemistry microchemistry、macrochemistry 目前使用较少,前截断,计算机信息检索技术,8/25/202
7、3,又称作“通用字符法”或“内嵌字符截断”。在检索词中间加一个或几个?号,主要解决一些英美拼写不同,单复数形式的不同的词的输入,可简化输入。如:输入wom?n可检出woman,women 输入defen?e可检出defence、defense,中间截断,计算机信息检索技术,8/25/2023,即在检索词后截去有限的字母,如名词的单复数,动词的词尾变化等。例如:输入computer?表示有0-2个字母变化,可检出 computer和computers.输入stud?表示截断处有0-3个字母变化,可检出 study,studies,studied。,有限截词,计算机信息检索技术,8/25/2023
8、,不限制被截断的字符数量。在检索词后加一个“*“,表示该词后可加任意个字符。使用无限截词,所截词根不能太短,否则会输出许多无关文献,造成误检。例如:educat*可检出educator,educators,educated,educating,education 如:输入computer?表示可检出computer和computers.如:输入stud?表示可检出study,studies,studied,studing.,无限截词,计算机信息检索技术,8/25/2023,功能:两词出现在同一自然句中,其词序与词量不受限制(SCI中专用)表达式:Education SAME school 检索
9、结果:Education 和school两词出现在同一句子中即可。特别注意事项:不是所有的检索系统都支持位置算符,不同的检索系统对位置算符有不同的表示符,同一位置算符在不同检索系统中指代的含义可能也不尽相同。,3.位置算符SAME,计算机信息检索技术,8/25/2023,将一个词组或短语用双引号“”括起作为一个独立运算单元,进行严格匹配,以提高检索准确度。如:“Global Positioning System”,只检索出规定字段中包含完整词组的记录。,4.词组检索,计算机信息检索技术,8/25/2023,不加“”,命中13815条,计算机信息检索技术,8/25/2023,加“”,命中8125
10、条,计算机信息检索技术,8/25/2023,组成数据库的最小单位是记录,一条完整记录的每个著录事项为字段。在许多检索检索系统中,为了提高查全率或者查准率,需要将检索过程限制在特定的字段中,即字段检索。,5.字段检索,计算机信息检索技术,8/25/2023,计算机信息检索技术,8/25/2023,8/25/2023,计算机信息检索技术,8/25/2023,检索示例:有关“企业知识产权研究”,检索式 检索结果(*表示AND,+表示OR,限定篇名字段)(2004-2006)1 企业知识产权 191篇(准确度最高漏检大)2 企业*知识产权 404(漏检率较高)3(企业+集团+公司)*知识产权 466(
11、适合综述性文献)4(企业+集团+公司)*(知识产权+专利权 520(查全率查准率较高)+商标权+著作权+名称权)5(企业+集团+公司)*(知识产权+专利权 137(缩小范围效果最佳)+商标权+著作权+名称权)*保护,8/25/2023,检索结果表明:检索词的选择、逻辑算符的使用、同义词近义词的扩展、检索字段的选择等变化,对检索结果数量的多少、检索的查全和查准有很大影响,8/25/2023,分析检索主题,明确检索要求 确定学科范畴,选择数据库(注意数据库所收录文献的学科、文献类型、回溯年代、语种、更新频率等)选择检索字段(您所输入的检索词出现的位置,如:篇名、作者、摘要、作者单位等)限定检索条件
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机信息 检索 技术
链接地址:https://www.31ppt.com/p-5838159.html