《文献检索》课件.ppt
《《文献检索》课件.ppt》由会员分享,可在线阅读,更多相关《《文献检索》课件.ppt(156页珍藏版)》请在三一办公上搜索。
1、计算机信息检索 原理与技术,计算机信息检索 原理与技术,3.2 文献信息数据库原理,3.3 计算机信息检索技术,3.4 检索策略及其设计,3.1 计算机检索基础,检索系统的构成,硬件,软件,数据库,系 统 软 件,应用系统软件,3.1 计算机检索基础,3.2 文献信息数据库原理,计算机贮存信息就是生成数据库。数据库中文献的某一特征,如:题名、作者、关键词等是为用户提取信息设计的。称之为“检索点”,数据库的类型,文献型数据库,文献型数据库也称书目数据库主要是书本式文摘索引等文献检索工具的机读版,如EI的书目数据库为COMPENDEX,数值数据库,主要包含的是数字数据,如化学物质毒性数据库、人口统
2、计数据库、化学结构图数据库等。,事实数据库或词典数据库,直接提供科学依据或事实。,数据库的结构,数据库是由若干记录(Record)组成 每条记录由若干字段(Field)构成。,文档(File),文档也称之为数据库中。一个大数据库可分为若干个子库如CA数据库根据年代被分为6个子库。,记录(Record),记录是构成数据库的最小单元,每条记录都描述了一条原始信息。文献型数据库中的一条记录通常是一篇原始文献包括题录、文摘、主题词等。,一条记录由各数据项组成字段。包括篇名、作者、作者单位、来源、文摘、主题词等字段。每一个字段通常由两个字母所组成的代码表示,如TI(Title),AU(Author)等。
3、,字段(Field),通常字段分为基本索引字段及辅助索引字段,基本索引字段“字段(field)”是“记录”中的基本单位 记录中用来描述文献内容特征的字段叫基本索引字段。它的表示方法为:,/TI(题名字段:title field)/AB(文摘字段:abstract field)/DE或/DF(规范词字段:descriptor field或controlled term field)/ID或/IF(自由词字段:identifier field),辅助索引字段 记录中用来描述文献外表特征的字段叫辅助索引字段。它的表示方法为:,AN=(文摘号:Abstracts No.)AU=(著者:Author)D
4、T=(文献类型:Document type)PA=(专利代理人:Patent assignee)PN=(专利号:Patent No.)LA=(文种:Language)PY=(出版年:Publication year),文献记录样例(SAMPLE RECORD),3.3 计算机信息检索技术,计算机检索:计算机将人工输入的检索式(检索策略)与数据库中的检索点进行比较匹配,得到结果 以命令检索为例介绍检索技术,(易熔玻璃 or 低熔玻璃 or 封接玻璃)and(等离子显示器 or PDP or 显象管),(automobil?+vehicle?+car?)()bod?*vibrarion?/de*(
5、finite(w)element()method+computer?(w)aided()analysis)/de,ab*PY=1990:2000,检索项也称作:检索词或检索点,检索项是构成检索式的基本单元,是概念词。准确选择至关重要。,检索项,检索项可以是单词、词组、数字、化学分子式等,布尔逻辑检索,布尔逻辑检索有三个基本运算符:逻辑与(积),逻辑和,逻辑非。,逻辑与,计算机运算符为:A and B 或 A*B在命中结果中同时出现A和B两个检索词。,A,B,逻辑和,计算机运算符为:A or B 或 A+B 逻辑和是指命中结果无论论及A或B均为命中。,B,A,逻辑非,计算机运算符:A not B
6、 或 A and not B 或 A-B 逻辑非是指一个命中结果中去除含有另一主题的文献。A not B表示在A文献中去除论及B的文献的文献。,A,B,字段限制检索,指定检索提问在特定字段中出现,只有在指定的字段中出现与检索提问相同的记录才被检索出来。如要求检索的内容在题目中出现。如:computer/ti and py=1999,截词检索,截词(Truncation)检索就是把检索词截断,取其中的一部分片段,再加上截词符号一起检索。截词符号有问号?、星号*、井字符#等。,*可代表多个字符,如果输入 instruction*instruction,instructions,instructio
7、nal,#代表单个的字符 如果输入wom#n woman,women一个?或者n?代表0个到9个额外的字符。如果输入colo?r,包含 color,colour或colonizer comput?则可检出含有computers,computing,computered computer?表示“?”可以有0-1个字母变化,检出带有computer和computers的文献;输入stud?,表示截三个字母,可检索出带有study,studies,studied和studing,概念:车 automobile vehicle car 身 body body bodies(bod?),*vibrari
8、on?/de,*(finite(w)element()method+computer?(w)aided()analysis)/de,ab,*PY=1990:2000,概念:振动 vibration,概念:有限元法 finite element method computer aided analysis,检索词的选取方法,检索词有时决定着检索结果的满意程度,应重视对检索词的研究。,(2)异称法:不同地区、时代、职业和不同场合下,对于同一种东西会产生出不同的称呼。例如:“马铃薯”与“土豆”;“电动机”与“马达”;“逻辑代数”与“布尔代数”等等。,(1)命名法:每个事物都有多种属性,因此可以产生多
9、种名称。例如:“计算机”与“电脑”;“人造金刚石”与“合成金刚石”;“X射线”与“伦琴射线”等等,(3)内容分析法:内容分析就是具体说明事物的组成部分。a)以“发电厂烟气净化”来作内容分析。烟气中含有:灰尘、二氧化硫、氮氧化物;净化操作则由:除尘,脱硫,脱硝组成,与除尘有关:静电除尘,脉冲除尘,脉冲放电,布袋除尘,过滤;与脱硫有关:洗涤塔,碱性吸收剂相关词。,b)“声纳技术”为例 其内容包括有:发射换能器,接收换能器,信号处理,终端判决与显示技术,声纳自动化技术等。了解的内容越多,检索的收获就越大。,(4)变体分析法:变体分析即找出词或词组的各种变化形式。常见形式有:拼写变体及不同语种文字,如
10、center+centre;program+programm;;disk+disc;sulfone+sulphone;,单数加上复数,如 car+cars,分离式加上复合式,如:book case+bookcase;gas dynamic+gasdynamic,课题名称:氨基硅油织物柔软剂检索词:(1)氨基硅油(2)制备(3)纺织(4)乳化(5)织物柔软剂(6)表面活性剂(7)有机硅,例1,课题检索词选取实例,课题名称3:快速高强度耐磨釉检索词:(1)高强度(2)耐磨损(3)快速烧(4)玻璃陶瓷(5)陶瓷(6)微晶玻璃(7)乳浊(8)析晶(9)主晶相(10)硅灰石(11)无光釉(12)釉,例3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文献检索 文献 检索 课件

链接地址:https://www.31ppt.com/p-5031482.html