信息检索基础知识研究生.ppt
《信息检索基础知识研究生.ppt》由会员分享,可在线阅读,更多相关《信息检索基础知识研究生.ppt(84页珍藏版)》请在三一办公上搜索。
1、医学信息检索Medical Information Retrieval,河北联合大学医学信息检索教研室,第二章 信息检索基础知识 主讲教师:谈伟文图书馆信息咨询部 电话3725914/6576,Chapter 2 Information Retrieval Theoretical Knowledge,Database Knowledge Computerized Retrieval Language Computerized Retrieval Techniques Approach,steps and effectiveness evaluation,Chapter 2 Informatio
2、n Retrieval Theoretical Knowledge,基础概念信息检索:是指通过一定的方法,从任一信息 集合中查出特定信息的过程。检索手段:手工检索 计算机检索检索对象:文献、事实、数值数据等,Chapter 2 Information Retrieval Theoretical Knowledge,手检VS机检(馆藏书目),手工检索,计算机检索,手检VS机检(文献检索-手检),检索工具书,检索工具书,手检VS机检(文献检索-机检),Section Database knowledge,Chapter 2 Information Retrieval Theoretical Kno
3、wledge,Section Database knowledge,是指一定专业范围内的信息记录及其索引的集合体。是计算机信息检索系统的重要组成部分。是信息资源,是检索的对象,一次文献,二次文献,信息记录,索引,一、数据库的类型(Database Type)按检索对象划分 1.文献数据库(literature Database)又分为书目数据库、全文数据库 2.数值数据库(numeric database)3.事实数据库(fact database)4.多媒体数据库(multimedia database),Section Database knowledge,二、数据库的结构 1.记录(Re
4、cord)是构成数据库的一个完整的基本信息单元,每条记录描述了一原始信息的外部特征和内容特征。2.字段(Field)是比记录更小的信息单元,是组成记录的数据项目。3.文档(File)两重含义 4.索引(Index)为便于检索而建的倒排文档,Section Database knowledge,CBM记录样例,MEDLINE记录样例,专利数据库记录样例,科技名人数据库记录样例,SERLINE记录样例,文档的两重含义,数据库中部分记录的集合,文档的两重含义,指数据库的结构分为 顺排文档(又称主文档)倒排文档(又称索引文档),主文档与索引文档图释,001 微量元素与老年人肺心病关系的探讨 王书钧;汤
5、兵祥;杜鹃;王国琳 河南医科大学第一附属医院 中华老年医学杂志 1993;12(4):247 肺心病;痕量元素002 慢阻肺的新进展与临床 黄桂平 江西省大吉山钨矿医院 医学综述 2000;6(4):164-165 肺疾病,阻塞性;慢性病003 超声乳化白内障摘除术 施玉英 北京同仁医院 中国医刊 2001;36(7):11-13 超声乳化白内障吸除术,主文档(顺排文档),索引文档(倒排文档),杜鹃 001黄桂平 002施玉英 003 汤兵祥 001 王国琳 001 王书钧 001,Remember the commonly used fields,字段名称AbstractAffiliatio
6、nAuthor Source TitleLanguage,字段标识符ABADAU SOTILA,中文释义文摘/摘要著者单位/地址著者/作者 来源/出处篇名/题名/标题语种,题录的构成,Author,Title,Source,题录(citation),题录的格式,作者、篇名、出处(刊名、年、卷、期、页码)格式:作者.篇名.刊名,年,卷(期):起止页码例如:姜春林,刘则渊,梁水霞.H指数和G指数期刊学术影响力评价的新指标J.图书情报工作,2006,50(12):63-65.Chler MW,Binder M,Friess H,et al.Potential role of somatostatin
7、 and octreotide in the management of acute pancreatitis.Digestion,1994,55:16-19.,Section Computerized Retrieval Language,Chapter 2 Information Retrieval Theoretical Knowledge,检索语言(Retrieval language)是根据文献信息存储与检索的需要而创造的人工语言。又称标引语言或索引语言。,Section Computerized Retrieval Language,计算机匹配运算的特征是机械匹配(或字符匹配),而
8、非概念匹配例如:输入finding,检出finding 输入findings,检出findings又如:输入“儿童生长发育”,检出“儿童生长发育”输入“儿童发育”,检出“儿童发育”,Section Computerized Retrieval Language,第二节 信息检索,机械匹配或字符匹配举例,多词一义,艾滋病爱滋病获得性免疫缺陷综合症AidsAcquire Immunodeficiency Syndrome,检索语言是根据文献信息存储与检索的需要而创造的,用来描述文献的内容特征、外表特征和表达检索提问的一种人工语言。,Section Computerized Retrieval La
9、nguage,文献的特征,特征1,特征2,特征3,特征4,特征5,特征n,文献的外部特征:与文献主题内容没有关系或关系不大的信息称为文献的外部特征,包括作者、作者工作单位,发表时间、专利号、报告号等。文献的内容(主题)特征 与文献主题内容密切相关的信息称为文献的内容特征。文献信息内容特征主要有主题词和分类号。,(一)描述信息外表特征的检索语言 文献题名、作者、作者工作单位、文献发表时间、出处(刊名、卷、期、页)等 专利专利名称、专利号、发明人、申请时间等 歌曲曲名(字数、拼音)、歌手姓名等 药品商品名、化学名称、生产厂家等,Section Computerized Retrieval Lang
10、uage,(二)描述信息内容特征的检索语言 1.分类检索语言 2.主题检索语言 3.代码检索语言,Section Computerized Retrieval Language,1.分类检索语言 用分类号来表达各种概念,将各种概念按学科性质进行分类和系统排列。等级体系分类检索语言(体系分类法)中图法 分析综合型分类检索语言(组配分类法),Section Computerized Retrieval Language,A 马克思主义、列宁主义、毛泽东思想B 哲学C 社会科学总论D 政治、法律E 军事F 经济 G 文化、科学、教育、体育H 语言、文字I 文学 J 艺术K 历史、地理,N 自然科学总
11、论O 数理科学和化学P 天文学、地球科学Q 生物科学R 医药、卫生S 农业科学T 工业技术U 交通运输V 航空、航天X 环境科学Z 综合性图书,中图法简表,Example,图书期刊排架,中目的分类目次例:R775眼压与青光眼,该期R775类中共4篇,2.主题检索语言 用于表达文献主题内容的语词标识系统。(1)主题词:严格规范化处理的表达文献主题概念的语词。是人工受控语言。(2)关键词:从文献的题名、摘要、章节标题或正文中抽取出来的具有实质意义,并能表达文献的主题内容,未经严格规范化处理的语词。属自然语言的范畴。,Section Computerized Retrieval Language,E
12、xample,非主题词:单车、脚踏车主题词:自行车用“单车”检索:会漏掉所有有关“脚踏车”和“自行车”的文献用“脚踏车”检索:会漏检所有“单车”和“自行车”的文献用“自行车”检索:可查到所有相关文献,自行车单车脚踏车,MeSH,美国国立医学图书馆,中国中医药学主题词表,中国中医科学院中医药信息研究所,放大这4篇,主题索引中同上,主题索引的分在R779.66,青光眼外科学2篇#254、#256,放大这2篇,3.代码检索语言 根据文献信息中论述事物的代码作为标识,加以标引和排列。如用化合物的分子式编排而成的索引。专利号、标准号等。属于自然语言的范畴。,Chapter 2 Information R
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 检索 基础知识 研究生
链接地址:https://www.31ppt.com/p-5229997.html