第6章联机信息检索.ppt
《第6章联机信息检索.ppt》由会员分享,可在线阅读,更多相关《第6章联机信息检索.ppt(35页珍藏版)》请在三一办公上搜索。
1、第6章 联机信息检索,6.1 联机信息检索的含义、构成及原理含义:是信息用户使用检索终端设备通过通讯网络与存储信息的联机检索中心相连,进行人机对话,从联机检索中心的数据库中查获所需信息的过程构成:联机检索中心、通讯网络、检索终端、和系统关联的人原理:用户通过检索终端,将信息需求按一定的查询语言和检索命令经通讯网络传至系统的主机及其控制的数据库,系统将用户的提问与数据库中存储的数据进行匹配运算,并把检索结果立即通过网络返回给终端,实现人机实时对话,这种交互作用可能要进行多次,直至完成检索任务,6.2 联机信息检索的特点检索速度“快”检索范围“全”检索命中文献“准”检索方法“便”例1:某医学院要查
2、找建校50年来在国外刊物上发表的该校学报的文章例2:有人联机查找溶氧分析课题,用ESA系统的CHEMABS数据库。经分析课题题意,确定检索词为DISSOLVED、OXYGEN、ANALYSIS,填写提问单,要求文献量不超过100篇,最好检出文献的题目中都包含检索词,?b2File 2:CHEMABS:Vol66-102,14(COPR.1985 BY THE-AMER.CHEM.SOC.)?S dissolved1 7480 DISSOLVED?S Oxygen2 117304 OXYGEN?S Analysis3 362391 ANALYSIS?C 1*2*34 241 1*2*3,?L4/
3、ti,ct,ut5 142 4/TI,CT,UT?L5/ti6 46 5/TI?t6/1/1-46上例说明,联机检索不仅快、全、准,而且检索深度可根据需要控制,可指定任意信息属性为检索途径,并可通过人机实时对话,扩大或缩小检索范围。它还具有检索的灵活性,可选择不同的输出方式和格式,可以显示阅读、联机或脱机打印,可以输出完整的记录(如文摘),也可输出部分记录(如题目和作者等),总的说来,联机检索具有检索速度快、检索功能强、检索途径多、收录文献信息数量大、范围广、更新快、使用灵活方便等优点。但也存在检索费用高、容易泄露研究机密等缺点。6.3 联机检索的沿革与发展计算机检索经历了脱机检索(1954-
4、1964)、联机检索(1965-1972)、网络化联机检索(1973-现在)三个阶段的发展。目前,联机检索已与 Internet融为一体,进入信息通讯计算机三位一体的新阶段,呈现出联机检索产业化、系统发展大型化、服务方式多样化、联机系统网络国际化和标准化等趋势。80年代后期,购并风行,更促进了联机检索的商业化发展。90年代以来,随着多项技术和检索软件的发展,系统功能不断增强,费用成本不断下降。预计将有更大的普及。,6.4 DIALOG系统简介目前世界上最大的国际性联机检索服务机构1998年拥有900多个数据库,内容涉及自然科学、工程技术、社会科学、商业新闻和工业分析、公司信息和金融数据、报纸新
5、闻等等方面,用户遍及120多个国家和地区的2万多个机构。其数据库类型有:书目数据库,全文数据库,指南数据库,数值数据库,复合数据库。现在其联合数据查询目录量是WWW网总量的50多倍,占世界机存文献总量的50%以上,向全世界提供最全面、最权威的信息资源。1998年1月,在中国开设第一间办公室,其网址是:http:/,DIALOG系统提供八种服务:(1)商业信息的菜单检索服务(2)电子邮政服务(3)定题检索服务(4)联机文献订购服务(5)数据库总索引(6)一次性检索(7)KR光盘(8)联机检索通信软件DIALOG系统目前有四种检索模式:(1)菜单式检索(2)命令检索(3)目标检索(4)WWW上运行
6、的检索界面KR Science Base,6.5 Dialog联机检索基础6.5.1 数据库索引DIALOG系统的每个数据库都有两种索引:基本索引(BASIC INDEX)和辅助索引(ADDITION INDEX),前者主要反映文献的内容特征,后者则仅表明文献的外表特征。在命令检索中,它们用后缀代码(Suffix Code)和前缀代码(Prefix Code)来区别后缀代码主要有四种:/TI(Title)、/AB(Abstract)、/DE(Descriptor)、/ID(Identifier)有的数据库还有其他一些基本索引的后缀代码,详见各数据库蓝页(Database Bluesheets)
7、,前缀代码的基本种类有:AU=著者 LA=文种AN=文摘号 RN=报告号CC=分类代码 PY=出版年份CS=机构来源 UD=更新日期DT=文献类型 JC=杂志代码PA=专利代理人 DC=标识代码PN=专利号 PC=产品分类JN=期刊名 EC=销售事态分类代码,6.5.2 禁用词(Stop Word)词表AN FOR THEAND FROM TOBY OF WITH在检索时碰到禁用词时处理方式有2种:(1)当检索字段是用单元词标引的,检索时用位置算符(W)或(N)替代词间的禁用词,如检索 ORBITS AND TRAJECTORIES方面的文献,用如下检索式:S ORBITS(1W)TRAJEC
8、TORIES(2)当检索字段是用词组标引的,检索时用双引号将词组引起来,如检索刊名为JOURNAL OF PHYSICS AND CHEMISTRY OF SOLIDS的文献,用如下检索式:S JN=“JOURNAL OF PHYSICS AND CHEMISTRY OF SOLIDS”,6.5.3 逻辑算符(Logical Operators)NOTAND*OR+如要检索关于“计算机动画电影”方面的非俄文文献,其检索策略(检索式)如下:S COMPUTER AND(ANIMAION OR CARTOON OR GRAPHIC)AND(MOVIE OR MOTION(W)PICTURE OR
9、CINEMA OR FILM)NOT LA=RUSSIAN或S COMPUTER*(ANIMAION+CARTOON+GRAPHIC)*(MOVIE+MOTION(W)PICTURE+CINEMA+FILM)NOT LA=RUSSIAN,6.5.4 位置算符(1)(W)或()算符表示相连两词必须按次序连接,中间不能插词,但两词间可以有标点、连字符或空格等。例:S COMPUTER(W)ANIMATION(2)(nW)算符表示相连两词之间可插入最多n个单词,但相连次序不变。例:S COMPUTER(1W)ANIMATION,(3)(N)算符表示相连两词位置可以互换,但两词中间不能插词。例:S C
10、OMPUTER(N)ANIMATION(4)(nN)算符表示相连两词间最多可插入n个词,且词序可互换。例:S COMPUTER(1N)ANIMATION(5)(L)算符要求相连两词必须在同一主题词(DE)字段中例:S SOLAR(L)ENERGY,(6)(S)算符表示相连两词必须在同一子字段中,一般是用句号、分号作为该子字段的结束符。例:S COMPUTER(S)ANIMATION命中的一篇文献中两词的位置如下:Abstract:.Topics discussed include computer graphics,complexity,animation,image processing,c
11、omputer simulation.(7)(F)算符表示所连两词必须在同一字段中出现,如题目或文摘字段等。例:S COMPUTER(F)ANIMATION,(8)(NOT)位置算符一共有五种:(NOT W)、(NOT N)、(NOT L)、(NOT S)、(NOT F),分别表示相连两词不能以W、N、L、S、F位置相连,此位置算符一般不常用。主要位置算符按照检索精确度排序为:W nW N nN S F 渐弱 同时出现位置算符和逻辑算符及括号,优先级排序为:括号中检索词 高(W),(N),(S)或(L),(F)NOT AND OR 低,6.5.5 截词符?(1)中间截断在词间加一个或几个?,如
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 联机 信息 检索

链接地址:https://www.31ppt.com/p-5652046.html