研究生信息检索概论.ppt
《研究生信息检索概论.ppt》由会员分享,可在线阅读,更多相关《研究生信息检索概论.ppt(77页珍藏版)》请在三一办公上搜索。
1、医学文献检索与利用范晓磊,教学进度:课程安排教学大纲:课程性质和特点、要求与目标、教学法等,信息检索基础学习目标1.掌握信息、情报、文献、知识的基本概念2.了解文献的类型、特点3.知道数据库的类型与结构4.掌握信息检索的途径、步骤5.理解检索式的编写与检索策略的调整6.熟悉信息网络技术与网络信息检索,1.信息概论人类在经历了农业社会、工业社会后,已经步入信息化社会。物质、能源与信息已经成为社会发展的三大资源,人类开始从主要依赖物质和能源的社会步入物质、能源和信息三位一体的社会。信息的概念信息的特性信息的作用,1.1 信息的概念信息information定义1:信息是物质运动规律总和,即不是物质
2、,也不是能量。定义2:信息论的创始人申农(Shannon)认为:“信息是能用来消除不确定性的东西”或“信息是确定性的增加”。定义3:信息是客观事物状态和运动特征的一种普遍形式。信息的定义和分类都不确定,不同的定义从不同的角度帮助,理解信息。,1.2 信息的特性信息区别于物质与能量,并具有与物质及能量同等的重要作用,是因为其特性。物质与能量在使用过程中会被消耗,但又遵守守恒定律;而信息在传递和使用过程是,可反复使用,并可通过信息的加工处理而产生信息增值。普遍性:信息是事物运动的状态和状态变化的方式。只要有事物的地方,就必然的存在信息。信息在自然界和人类社会活动中广泛、普遍存在。传递性:信息在事物
3、之间的相互联系必定在信息流动中发生。信息的传递性表现在人与人之间的信息交换,人与机器、机器与机器之间的信息交换,动物与植物间的信号交换。信息的传递和流通过程是一个重复使用的流通过程,信息的占有者不会因传递信息而失掉信息,也不会因多次使用改变信息的自身价值。这一点与信息的共享性相关。同时,信息的传递,在广义上来讲,包含反馈。(例),依存性:信息总是依附于一定的物质载体而存在,需要某种物质承担者。信息必须依附于一定的物质形式上(如声波、电磁波、纸张、化学材料、磁性材料等),不可能脱离物质而单独存在。相对性:客观上信息是无限的,但对于信息用户来说,人们实际获得的信息问题有限的。同一信息对不同认知水平
4、的用户所产生的作用和有效性也不同。可加工性:信息可以加工处理,可以压缩、扩充和叠加,也可以变换形态。在流通和使用过程中,经过综合、分析、再加工,大量的原始医药信息可以变成医学文摘数据库和,时效性:由于信息的动态性,那么一个固定的信息的使用价值必然会随着时间的流逝而衰减。在现代社会中,信息的使用周期迅速缩短,信息的价值实现也很大程度上取决于及时把握和运用信息(天气预报、经济信息、股票大盘等)。不能及时地使用最新信息,信息的价值就会随其滞后使用的时差而差值或贬值。可共享性:信息与物质,能量显著不同的是。信息在传递过程中并不是“此消彼长”,同一信息可以在同一时间被多个主体共有,而且还能够无限的复制、
5、传递,它可以共享。,1.3 信息的作用信息在人类社会和科技发展中具有重要作用。信息是人类认识客观世界及其发展规律的基础。信息的基本功能,主要表现为信息的认识功能。信息是科学研究的必要备件。信息是管理和决策的主要参考依据。信息是社会发展的资源。,2.知识、情报和文献知识:来源于信息,存储于人类的大脑中。现代汉语词典:知识是人们在改造世界实践中所获得的认识与经验的总结。知识包括:技术知识、科学知识、经验知识,关于知识的知识,及对面临的问题做出判断并提出解决方案的知识。OECD的四类知识:what,why,how,who显性知识(科学理论、数据公式、自然规律等)与隐性知识(外科医生的经验、领导的决策
6、能力、“我爸是李刚”),情报:是指传递着的在特定效用的知识。辞源:“定敌情如何,而报于上官者”为情报。辞海:“战时关于敌情之报告,曰情报。知识性:根据知识的定义和特性,知识去除了糟粕的信息,并且具有可实践性。传递性:没有被激活的知识只能发挥知识的价值,而不能体现情报的价值。效用性:情报最大的特点是可以发挥比其作为知识,更为巨大的作用。,文献:记录有知识的一切载体。文献本身并不是知识,其包含的内容才是知识。文献要素:知识内容、信息符号、载体材料。信息符号、载体材料和记录方式都影响知识内容的获取和利用。,概念间的关系:知识来源于信息,情报是特定的知识。,情报,知识 信息,信息、知识、情报、文献四者
7、的关系,认识,激活,信息,知识,情报,检索 记录文献,3.信息源,个人为满足其信息需要而获得信息的来源,3.1 信息类型保存性:正式与非正式时间:先导(天气预报)、实时(现场直播)、滞后(报纸)表现形式:文字、图像、数值、语音出版类型:图书、期刊论文、科技报告、专利文献、会议文献政府出版物、学位论文、标准文献、产品样本、科技档案产生次序和加工程度(重要):零次、一次、二次、三次信息理解各层次信息的含义,根据各层次信息的特点能够判断不同出版类型的信息、文献分别属于什么层次的信息和文献。,4.信息交流和信息素养4.1 信息交流噪音 去除噪音信源信道处理与控制信宿反馈,4.2 信息需要指人们在从事各
8、项实践活动的过程中,为解决所遇到的问,题而产生的对信息的需求。是信息行为发生的基础。,信息需要的特征,信息需要的层次(重要):未知的信息需要、潜在的信息需要,和现实的信息需要。通过对信息需要层次的理解,能够判断自己或他人的信息需要的层次。,4.3 信息行为:信息的检索、选择和利用。4.4 信息动机:是信息行为发生的根本动力。在信息交流中,信息需要和信息动机促使信息行为的发生,并完成信息的交流。,5 信息素养5.1 信息素养(information literacy)概念是指判断何时、何地需要信息,并有效的定位、获取、评价和利用信息的一系列能力的总和。包括:计算机素养、因特网素养、媒体素养、图书
9、馆素养、研究素养、批判性思考的能力。,信息素养主要体现在:信息意识:是人们对信息需求的自觉反映,即对信息的捕捉、分析、判断和吸收的敏感性。信息能力:是人们有效快速的获取加工存储利用和传递信息的能力。信息道德:是指在整个信息活动中,信息创建者、信息服务提供者和信息使用者所必须要遵守的社会法律法规和行为准则。,5.2 美国大学与研究图书馆协会(ACRL)制定的高等教育信息素养五大标准1)能够独立决定所需要的信息种类和程度独立意味着在获取信息资源的过程中个人可以决定所需要的信息种类和程度,表现为主动学习、自主吸纳知识的过程。书、刊、学位论文、会议论文、专利、标准背景信息概念、事实、数据摘要信息题目、
10、标题、文摘、参考文献,全文信息观点、方法、结论、理论(电子、印刷的),2)能够高效地获取所需信息高效意味着能选用最适当的查找方法或检索系统来建构完善的检索策略,获取所需信息。分类法、主题法、题名法、关键词法、作者法、机构法、组配法综合性、专业性、单一性 熟悉所在学科领域的主要信息源,3)能够根据现有的知识背景和评价标准对信息及其来源进行评价及遴选在分析信息的基础上熟练地、批判性地评价信息,有效吸收、存储和快速提取信息,能从所收集的信息中概括出信息的中心思想,并能依据研究问题的要求来评价信息及其来源,提取出权威性的、经典的和具有创新理念的观点及其它发现,同时能在构建新的假设中查找补充所需信,息,
11、对新旧信息进行整合和综述。,4)能有效地利用信息达到某一特定的目的有效地利用信息意味着为达到某一特定的目的,在信息查找、获取、评价、补充的知识积累基础上,将文献中的主要观点、思想及相应事实数据等应用于自己有利于目的实现的表现形式,如学位论文、调查报告等,以此来与他人进行有效的交流。,5)能够在信息利用过程中遵守相关的法律法规具备信息素养能力的人应了解与信息利用有关的道德、法律和社会经济问题,并能遵守法律、规章制度和有关获取与使用信息资源的行为规范。知识产权与版权、信息法、电子资源恶意下载与非法使用、正确引用、信息的无偿服务与有偿服务。,6 信息检索6.1 信息检索概念是从任何信息集合中识别和获
12、取所需信息的过程及其所采取的一系列方法和策略。,广义的信息检索包含信息存储与检索,6.2 信息检索类型存储及内容:文献信息检索、数据信息检索、事实信息检索。组织方式:全文检索、超文本检索和超媒体检索。,7 信息检索系统7.1 信息检索系统信息检索系统是信息检索的本质。信息检索系统根据文献特征信息(题名、著者、出版者、出版年、文献来源信息、文献原始编号、主题内容)按照一定的逻辑组织文献。检索系统对包含的信息进行描述,形成记录,通过这些描述提供检索途径,并使记录有序化。检索途径的两个因素:检索标识和可检序列,检索标识:自然语言与情报语言自然语言:情报检索中指文献作者或文摘提要的作者原来使用的语言。
13、不足之处:由于是日常口头、书写所用的各种语言。所以(1)不能简洁与专指地表达概念(2)语词与概念不能一一对应(3)不能反映概念之间的关系(4)无法进行系统排列(5)标引用语与自然语言的相符性差。,7.2 情报检索语言是一种人工语言,根据规则编制而成,规则预先明确规定。由词汇和语法组成。分类检索语言:中国图书馆学分类法,科图法主题检索语言:MeSH,EMTree代码检索语言,情报检索语言的特点(对比自然语言)对文献内容加以标引,主题概念表达规范。对相同及相关内容加以集中或揭示其相关性。对大量情报加以系统化或组织化。便于将标识用语和检索用语进行相符性比较。,7.2.1 医学主题词表常用美国医学主题
14、词表MeSH荷兰医学文摘的主题情EMTree中国中医药学主题词表情报检索语言的特点(对比自然语言),组成字顺轮排表(索引)是将主题词表中主题词和入口词按一定顺序(字顺等)排列而成。入口词:款目词,包括主题词的同义词、近义词、缩略语、不同拼写方式,倒装或顺装以及已经取消而意义相近的主题词。树状结构表(范畴表)将全部主题词按内容分为15个类目,各类主题词按各主题词内涵范围的大小逐级排列,形成树状结构。上下位概念:上位词的范围大,下位词的范围小,扩展检索是指某主题词所有下位主题词标引的全部文献都检出。,副主题词(关联词):使用时有明确规定,必须遵循其定义与使用范围。副主题词也有上下位关系,使用时应选
15、择恰当,以提高检全与检准率。,7.2.2 检索结果评价检索效率,是概括表示情报检索系统质量的概念,可以说明对情报检索系统各项性能的满意程度。包含检准率(查准率)与检全率(查全率),它们之间的关系是互逆相关的。检全率检准文献/(检准的献漏检文献)漏检率漏检文献/(检准的献漏检文献)检准率检准文献/(检准的献误检文献)误检率误检文献/(检准的献误检文献)其他:检索速度、检索方便性与检索成本也是需要,考虑的因素。,8 文献数据库与计算机检索技术手工检索基本上用于对纸质文献的检索。而随着技术的发展,文献被组织成各类型的数据库,计算机检索技术也随之成为主流。文献数据库:是指记录各种文献信息的数据库,计算
16、机可读、有组织的相关文献信息的集合。在文献数据库中,文献信息以数字化方式,按一定的数据结构,有组织地存储在计算机中,使计算机能够识别和处理。,8.1 文献数据库类型根据收录性质可分为:文献型、全文型、事实型。文献数据库按内容分:书目数据库(Bibliographic Databases):存储文摘、题录、目录等书目数据的一类数据库,又称为二次文献数据库。全文数据库(Full Text Databases):以一次文献形式直接提供文献全文。混合数据库:即包含书目记录又包含有全文记录的文献数据库。,其他类型参见教材P31,几种主要的文献数据库P3236题录数据库文摘数据库图书馆馆藏目录数据库全文数
17、据库光盘数据库多媒体数据库网络数据库(重要),文献数据库结构,文档(File)顺排文档:主文档,以文献记录作为信息存储单元,按文献记录入藏的存取号从小到大顺序排列而形成的目录式文档,它存储有关于每篇文献的最完整信息。检索结果的信息来源于顺排文档。例:主题词索引、著者索引、刊名索引等倒排文档:就是把记录中一切可检字段或属性值抽出,按某种顺序重新加以组织后所得到的一种文档.倒排档从主文档中派生出来,所以,又叫做辅助文档。,记录(Record)是构成数据库的完整的信息单元,每条记录都描述了一原始信息的外表和内容特征。例:书目数据库中的一条记录通常代表一篇文献。字段(Field)是记录的下级数据单位,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 研究生 信息 检索 概论
链接地址:https://www.31ppt.com/p-5806221.html