《检索式编写技巧》PPT课件.ppt
《《检索式编写技巧》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《检索式编写技巧》PPT课件.ppt(101页珍藏版)》请在三一办公上搜索。
1、检索式编制技巧,检索:有关地震和海啸的相关研究, (earthquak* or tembl* or seism* or earthshock* orearthdin*) and (tsunami* or seismic sea wave orground sea or megatsunami or tidal wave*),分析研究课题,明确检索要求 选择检索工具(或数据库)与检索手段 确定检索途径与拟定检索式实施试检索操作 检索结果的评价与获取原始文献一个好的检索式是最终实现检索策略是否达到预想结果的具体表现形式。,文献信息检索的基本步骤,检索式的定义 百度百科定义:指搜索引擎理解和运算的查
2、词串,由关键词、逻辑运算符、搜索指令(搜索语法)等构成。 关键词是检索式的主体,逻辑运算符和搜索指令根据具体的查询要求从不同的角度对关键词进行搜索限定。 逻辑运算符是表达检索词之间逻辑关系和限制关系的运算符号,它是复合检索式中必不可少的构件。,如何编制检索式,检索词的选择;运算符的使用;编制检索式。,关键词与主题词 关键词即是“自由词”,是信息的提供者各自采用的不经过一定规范化限定的词。检索操作方便,但其专指度差,常需用较高的逻辑匹配、截词符等技能。 主题词即指以自然语言中优选出的,经过规范化处理后的名词术语。检索操作一般需将习惯使用的自然语言与各数据库自编的主题词表对照后方能使用,但专指度较
3、高。,检索词的选择技巧?,关键词的选择,应以课题提供的关键词为参考,选定的关键词应符合主题;确认关键词是否为规范词;并应列出常用中外文同义词、缩写词, 以及核心关键词的上下位类词。,应充分利用词表、辞海、术语标准、词典等工具书,以及从已,检出的文献中,复核、筛选、补充、精炼检索用词。,关键词的选择应注意,(1) 应覆盖检索主题(2) 寻找常用同义词,(3) 词的全称、简称及缩写,(4) 必要时应向上下位类词扩检(5) 合理使用词组或短语(6) 规范词的利用,1. 勿忘检索词的全称、简称、俗称与英文缩写,项目名称:乙型病毒性肝炎的中医药研究篇名=乙型病毒性肝炎*(中医药+中药)乙型病毒性肝炎的同
4、义词: 乙型肝炎 乙肝 HB篇名=(乙型病毒性肝炎+乙型肝炎+乙肝+HB) *(中医药+中药),项目名称:耐高温粘接剂的研究,篇名=高温*粘接剂粘接剂的同义词: 胶粘剂、粘固剂、粘合剂、胶结剂、粘结剂、粘胶剂、粘接剂、粘着剂、黏合剂、胶合剂篇名=高温*(粘接剂+胶粘剂+粘固剂+粘合剂+ 胶结剂+粘结剂+粘胶剂+粘接剂+粘着剂+ 黏合剂+胶合剂),初级检索 高级检索,搜索同义词方法,(1)利用数据库的同义词选择功能(2)利用搜索引擎寻找同义词(3)从数据库检索结果中寻找同义词(4)利用自己的专业知识(5)利用自己平时积累的知识,2. 注意检索词的上下位类扩展,项目名称:电阻焊在汽车生产中的应用
5、篇名=电阻焊 *汽车*生产 电阻焊 F 点焊 缝焊 凸焊 对焊 篇名=(电阻焊+点焊+缝焊+凸焊+对焊) *(汽车+机动车+客车+轿车)*生产,项目名称:苯胺的烷基化反应催化剂研究,文摘=苯胺*烷基化*催化剂烷基化Alkylation F 甲基化 Methylation 乙基化 Ethylation文摘=苯胺*(烷基化+甲基化+乙基化)*催化剂,课题(1)“加氢裂化防污垢的开发与应用研究”,将“加氢裂化”与“防污垢”组配,结果不理想。概念向上位“石油加工与石油炼制”的概念扩大,再与“防垢剂”组配,完成了课题的要求。 课题(2)碳4、碳5馏份工艺情况,(C4 or C5) and distill
6、at*,上位:Petroleum and product* and distillat*下位:(Butene or 1-3 butadiene) and distillat*,3. 注意外来词的译写变化,波尔兹曼 54 欧几里德 290 玻耳兹曼 109 欧几里得 197 玻尔兹曼 214 欧基里德 5 波耳兹曼 12 欧几理德 3 波尔茨曼 2 欧氏几何 135 Boltzmann 659 Euclid 351 注意:上例中用英文名检索出的中文文献最多!,注意检索词的词义变化,汉词与英语等西方语言的词汇相比较: 汉词的字与词界线比较模糊,一个字也许就是一个词,英语基本上没有这种现象。 汉词无
7、固定的词头、词尾和性、数的变化。而英语构词时这种情况很多。 汉语的构词一般与语义有关,一个词后加上一个字就派生出另一个新的词,而英语的情况与此有很大的不同。,4. 深 入 课 题 寻 找 检 索 词项目名称:石油工业的废水处理篇名=石油工业*(废水+污水)*处理,篇名=石油*(废水+污水)*处理,主题=石油*篇名=(废水+污水)*处理,石油工业,燃料工业之一。从勘探、开采到加工石油一系列过程是由石油部门所完成。为国民经济各部门提供各种燃料油,包括天然石油和油页岩的勘探、开采、炼制、储运等生产单位。重新选择检索词 将“石油工业”扩展为“石油”、“油田”、“采油”、“炼油”。进行二次检索,示例:有
8、关“企业知识产权研究”,检索式 检索结果 (*表示AND,+表示OR,限定篇名字段) (2009-2011)1 企业知识产权 191篇(准确度最高漏检大)2 企业*知识产权 404 (漏检率较高 ) 3 (企业+集团+公司)* 知识产权 466 (适合综述性文献)4 (企业+集团+公司)* (知识产权+专利权 520 (查全率查准率较高)+商标权+著作权+名称权)5 (企业+集团+公司)* (知识产权+专利权) 137 (缩小范围效果最佳),5. 少用或不用对课题意义不大的词,不用词义泛指过大的词,如展望、趋势、现状、近况、动态,应用、作用、利用、用途、用法,开发、研究、影响、效率。少用词义延
9、伸过大的词,若一定要用,必须将它们尽可能全地用“或”组合起来,以免漏检,如: “制造”制备(preparation)、生产(manufacture)、合成(synthesis)、加工、工艺; “提炼”精炼、提取、回收、利用、萃取; “性能”Property(ies),Performance,Behavior。,6.多主题概念的课题应以“简”为主,1、课题有A、B、C、D、E、F等主题概念进行组配,其中“C”词建库人员未从原始文献中挑选出来作为标引词时,该“C”主题词则表现为零,则整个检索式等于零。 如:课题“利用基因工程的手段提高植物中淀粉含量”,基因工程*淀粉 基因*淀粉“最专指面优先”(M
10、ost Specific Face First)方法,7.少用无法定性定量的词,课题:冷、温复合挤压连续成形技术 (冷挤压 or 温挤压) and 连续 and 成型(冷or 温) and挤压and 连续 and 成型冷= 常温以下温=45C 600C or 800C 处理结果: 取消:冷、温二词深化处理: 增加:挤压对象的词。如塑料、金属等词或其他如有助于限制范围的有效实词如:挤压时用的润滑材料:石墨。,切忌:把整个题名输入到检索框中,如:网络数据库的安全性研究,应以课题提供的关键词为参考,根据检索要求复核、筛选、补充、精炼检索用词。选定的检索词应符合检索主题;确认检索词是否为规范词;并应列
11、出常用中外文同义词、缩写词,以及核心词的上下位类词。应充分利用词表、辞海、术语标准、词典等工具书,以及从已检出的文献中,扩展检索用词。, 例如 有人提出检索真空碳粉包装机方面的文献, Vacuum Packer* or Vacuum pack* machine* or Vacuum pack*,equipment*,(Vacuum Packer* or Vacuum pack* machine* or Vacuum,pack* equipment*) and carbon powder*, (Vacuum Packer* or Vacuum pack* machine* or Vacuum,p
12、ack* equipment*) and powder*,运算符的使用技巧?搜索指令的使用技巧?,在进行计算机检索时,有时有一些比较复杂的课题,如:“GPS在建筑中的应用”,既涉及GPS,又涉及建筑, 这时候要编制出满足要求的计算机检索式,就必须用到运算符,它是机检的基础。 布尔逻辑、截词检索、字段检索,位置算符 、其它。,1 布尔逻辑检索(Boolean Logic Retrieval) 逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符,即与、或、非三种运算符号,用它们可以表示概念之间的逻辑关系。,2 位置算符(Proximity Operators) 位置算符是表示检索词之间位
13、置关系的一种运算符。由于英文对一句话有多种表达方法,写法可能不同。如:“GPS在铁路桥研究中的应用”这个课题,用英文表达可能是“Using of GPS in Railway Bridge”, 也可能是“Using of GPS in Bridge of Railway”,因而可能编制出这样的检索式,GPS AND (Railway (2N)Bridge)我们可以通过位置检索提高检索的准确率。,8,位置算符,位置算符SAMEuniv tokyo AND dept physuniv tokyo SAME dept phys,IBM SAME NYIBM AND NY,IBM Res Corp,
14、Yorktown Heights, NY 10598 USACornell Univ, Dept Mat Sci & Engn, Ithaca, NY 14853 USA,IBM Corp, Almaden Res Ctr, Div Res, San Jose, CA 95120 USA,3 截词算符(Truncating operators) 在英语词汇中,一个词可能有多种形态,如词的单、复数形式的不同,英美拼写方法不同、词性不同等。如果检索时将这类词全部输入进去,会增加检索时间和费用,采用截词法可解决这一问题。 所谓截词检索,是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检
15、索中计算机会将所有含有相同部分标识的记录全部检索出来。常用“?”、“*”符号表示。,有限截词 即在检索词后后截几个有限的字母,如名词的单复数,动词的词尾变化等。 如:输入computer? ?表示有0-1个字母变化,可检出computer和computers. 输入stud?表示截断处有0-3个字母变化,可检出study,studies,studied,studing.,无限截断 在检索词后加一个“?“,表示该词后可加任意个字符。使用无限截词,所截词根不能太短,否则会输出许多无关文献,造成误检。 如:computer?可检出computers,computering,computered,co
16、mputerization.,中间截断 在检索词中间加一个或几个?号,主要解决一些英美拼写不同,单复数形式的不同的词的输入,可简化输入。 如:输入wom?n可检出 woman,women,各种算符在数据库中的实际应用,位置算符1)EI NEAR Bridge NEAR Piling* 表示这两个词要彼此接近,前后顺序不限 W/n Pig*W/2pine* 表示两个词的距离不能超过n个单词 Adj Channel adj tunnel 表示含有这两个词,两个词相邻,位置一定2)ISI Proceedings 用同句算符(SAME):如Channel same tunnel,表示channel 和
17、tunnel 出现在同一句子中才符合检索条件。,3)Elsevier: ADJ 表示两词相邻,前后顺序固定,与“词检索”的结果相同; NEAR或(N) 表示两词相邻,中间可插入少于或等于n个单词,前后顺序可以发生变化,如果不使用(N),系统默认值为10。 4)PQDD W/n 两词间距小于n个单词,且前后位置任意 Pre/n 两词间距小于n个单词,且前后位置一定,截词符或通配符,如:CSAISI ProceedingsProQuestCA 用通配符“?”和截词符“* ” 输入 “patent*”,可以检索到 patent、patents、 patented等,(无限截断) 输入wom?n,可以
18、检索到woman和women。 输入“fib?”,可检索到fiber和 fibre。(有限截断),4 括号检索(Parentheses) 用于改变运算的先后次序,括号内的内容做优先运算。 用“()”可以表示优先级。如比较 (GPSORGIS)ANDChina GPSORGIS ANDChina EI 中的表示方法:Relevance AND( Aalbersberg WN AU)OR (cool WN AU),逻辑算符的先后次序,当使用多个运算符时可用扩号决定优先顺序,一,个检索式中最多可使用50个运算符,NEAR/x,SAME,NOTAND,OR, (earthquak* or tembl*
19、 or seism* or,earthshock* or earthdin*) and,(tsunami* or seismic sea wave orground sea or megatsunami ortidal wave*),搜索指令1 字段限制检索 组成数据库的最小单位是记录,一条完整记录中的每一个著录事项为字段。,字段限定检索, 字段检索即指定检索词出现的字段,包括前缀限制符,和后缀限制符。, 常用前缀限制符:AB、AU、ISSN、SO、KW、LA 、PY,、TI;后缀限制符将字段代码放在检索词后。, EG:SONature,TS=“electromagnetic field”,
20、搜索引擎常用字段限定检索, Title,Subject,Keywords,Summary等; Image,Text、,url、link等, site:C查找名为C的WWW服务器。 image:mao.jpg查找名为mao.jpg的图像文件。 url:datamining.html 查找含有,datamining.html的URL,注意:作者检索的缩写形式、机构定义 在SCI中, 姓 (全称)空格 名(首字母并且连写)如:LI DR;GONG JY;在EI中, 姓名就比较复杂,一般有以下几种情况:姓名都用全称(姓前名后);姓全称名缩写(或名之间用连字符);名前姓后全称 机构检索中,SCI中有多个
21、作者单位, 在同一字段中,EI 只收入第一作者的单位。 多字段检索时要选所有字段(all field),2 短语检索(phrase search)即精确检索 短语用“”表示,检索出与“”内形式完全相同的的短语,以提高检索的精确度和准确度。,Exact Search 精确检索,词组检索,如果希望精确地检索某个短语,应将其放置在引号内。,范例: “stem cell” Topic: electromagnetic field Title: Mathematical model of electromagnetic elimination intubule with high frequency m
22、agnetic field Topic: “electromagnetic field” Title: Reproduction of lightning electromagnetic fieldwaveforms by engineering model of return stroke,3 自然语言检索(natural language search) 直接采用自然语言中的字、词、句进行提问式检索,同一般口语一样。这种基于自然语言的检索方式又被称为“智能检索”,适合不太熟悉网络信息技术的人员使用。支持自然语言检索的有中文的悠游,英文的AltaVista, Excite,Infoseek,
23、HotBot,AskJeeves等,4 模糊检索(fuzzy search) 又称概念检索。当我们输入一个检索词时,搜索引擎不仅反馈包括了该关键词的网址,同时也发来与关键词意义相近的内容。比如:我们查找“查询”一词时,模糊检索会反馈来包含了“查询”、“查找”“查一查”、“寻找”、“搜索”等内容的网址。反馈网址的排列,一般是完全符合关键词的在最前边,其次是相近的。现在大多数搜索引擎都有这种功能,只是模糊的程度不同。,5 字母大小写检索 如果用户的检索式用小写字母表示,搜索工具既匹配大写又匹配小写,如:china(瓷器),china(中国);如果用大写字母表示,搜索工具认为用户指定了只要大写,就只
24、会查找那些与用户键入的输入形式完全相同的结果,如:china,只检索出china。Alta Vista等搜索引擎支持区分大小写的检索。,注 意 自然语言检索、模糊检索和区分大小写的检索是网络检索所特有的。 实际检索中,往往将多种检索技术混合使用。如:查找标题中含有“网络营销”的资料,它的计算机检索提问式(表达式)可以是: TI(Web OR WWW) AND market*,Tips:, 几乎所有的检索系统都支持“”、布尔逻辑、截词和字段检索,使用的截词和字段表示方法不尽相同,或各自有一些特殊的检索技术;, WOS:ultraso* Irradiat* and (nanocomposite*
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 检索式编写技巧 检索 编写 技巧 PPT 课件

链接地址:https://www.31ppt.com/p-1396986.html