信息检索ppt课件.ppt
《信息检索ppt课件.ppt》由会员分享,可在线阅读,更多相关《信息检索ppt课件.ppt(92页珍藏版)》请在三一办公上搜索。
1、信息检索,课程性质,文献信息检索课就其实质来说,是一门方法课, 即通过讲授信息检索基础理论、信息检索方法和各种中外文数据库的使用,提高同学们获取信息的能力,主要是培养学生的情报信息意识和提高检索技能。,一、信息素质,信息素养的概念,To be information literate, a person must be able to recognize when information is needed and have the ability to locate, evaluate, and use effectively the needed information. 具有信息素养的人
2、能够知道什么时候需要信息,能够有效地获取、评价和利用所需要的信息。 美国图书馆协会ALA, 1989,信息素质,信息素质(Information Literacy 简称IL),又称信息素养,简单地讲,信息素养是指个人“能认识到何时需要信息,和有效地搜索、评估和使用所需信息的能力”。它包含了三个层面: 信息意识、信息能力、信息道德。,信息素质的内涵:,信息意识对各种信息自觉的心理反映信息能力信息技术的应用能力 信息查询、获取的能力 信息组织加工、分析能力 信息的有效利用、评估、传播能力信息道德整个信息活动中的道德规范,学术道德规范 (学术规范的核心部分,具体包括: )学术研究应坚持严肃认真、严谨
3、细致、一丝不苟的科学态度。不得虚报教学和科研成果,反对投机取巧、粗制滥造、盲目追求数量不顾质量的浮躁作风和行为。学术评价应遵循客观、公正、准确的原则, 如实反映成果水平。 学术论著的写作应树立法制观念,保护知识产权,要充分尊重前人劳动成果 。,信息道德,学术法律规范: 中华人民共和国著作权法 合作创作的作品,其版权由合作者共同享有。 未参加创作,不可在他人作品上署名。 不允许剽窃、抄袭他人作品。 禁止在法定期限内一稿多投。 合理使用他人作品的有关内容。 学术不端检测系统,信息道德,第三层次:信息选取与综合利用 (信息增值)第二层次:从检索系统中检索出信息 (检索技术)第一层次:知道什么信息在什
4、么地方 (熟悉了解信息源),如何具备信息素质,如何判断自己已具备了信息素质?,1、能够独立决定所需信息种类和程度。2、能够高效地获取所需信息。3、能够根据现有的知识背景和评价标准对信息 及其来源进行评价及遴选。4、能够有效地利用信息达到某一特定的目的。5、能够在信息利用过程中遵守相关的法律法规。,二、信息源,信息的来源叫做信息源。 信息源可按不同的方法分类描述,比较常见的分类方法有如下三种:1、按信息的载体形式划分(电子文献等);2、按信息加工的级别划分(四次文献);3、按信息的发布形式划分(十大文献信息源等),(1)、按信息的载体形式划分信息源,1)印刷型(Printed form)(书本型
5、) 以纸张为载体2)缩微型(Microform) 以缩微胶片、平片等感光材料为载体3) 声像型(Audio-Visual form)(视听材料) 以磁性和感光材料为载体4) 电子型(Machine Readable form) 以计算机信息存储设备为载体,以数字代码将图、文、声、像等信息存储到介质上通过计算机阅读。,(2)、按信息加工级别划分信息源,信息出版量的急剧增长,信息类型的多样化和信息分布的离散状态,获取相关信息犹如大海捞针。利用信息的可塑性,将信息处理为不同等级。通常文献学上将其称为“三次文献”:一次文献 primary document二次文献 secondary document
6、三次文献 Tertiary document零次文献 最原始的资料,文献,零次文献:普通网页,电子邮件等一次文献:正式在期刊上发表的论文等二次文献:数据库中的题录、目录等三次文献:文献综述、进展报告等,(2)按文献加工深度划分,1)图书(book) 2)期刊(journal) 3)科技报告(report) 4)会议文献(proceeding) 5)专利文献(patent) 6)学位论文 (dissertation) 7)政府出版物 (government publication) 8)标准文献(standards) 9)产品资料(product literature) 10)科技档案(scie
7、ntific and technical archives),(3)、十大信息源按出版形式划分,特种文献,三、网络检索的六大方面,一个原则:选择合适的关键词,制定正确的检索策略。两类搜索引擎 三大系列中文网站 四次文献 五大多媒体技术 十大文献信息资源,一个原则 两类搜索引擎:全文搜索引擎(FullText Search Engine) 百度搜索引擎 、Google搜索引擎 分类目录( Directory ) 雅虎中国、搜狐、新浪、网址之家、 网易分类目录等三大系列中文网站 四次文献 五大多媒体技术 十大文献信息资源,一个原则 两类搜索引擎 三大系列中文网站: 三大中文门户网站新浪、搜狐、网易
8、 三大中文期刊数据库清华库、维普库、万方库 三大中文数字图书馆超星、方正、书生之家 四次文献 五大多媒体技术 十大文献信息资源,一个原则 两类搜索引擎 三大系列中文网站 四次文献: 零次文献 一次文献 二次文献 三次文献五大多媒体技术 十大文献信息资源,一个原则 两类搜索引擎 三大系列中文网站 四次文献 五大多媒体技术:素材下载技术 素材转换技术 多媒体制作技术 素材发布技术 网页制作和网站发布技术十大文献信息资源,十大文献信息资源 科技图书 科技期刊 特种文献( 科技报告 政府出版物 会议文献 标准文献 专利文献 科技档案 学位论文 产品样本 ),四、信息检索,什么是信息检索?,信息检索(I
9、nformation Retrieval) 指对文献信息资料的查找与获得。 检: 即查找, 索: 即获得与索取。 也就是说,检索者利用检索工具按照文献编排的特点,采取一定的途径、方法和步骤,将所需文献资料查找出来,并加以利用。 前提:必须有检索工具 其次:途径和方法桥梁、纽带 最后:检索者,信息检索活动的功用,一、利用信息检索工具,全面细致地搜索前人的工作经验与成果,及时掌握事物的最新动态及发展趋势;二、提高工作效率,提高人们的自学能力、科研能力、鉴赏能力;三、避免重复劳动,规避风险,维护正当权益;,信息检索活动的功用,四、节省检索文献的时间 文献检索在科研中所占时间的比例: 开展思考计划文献
10、查找科学实验编写科研报告 8% 48% 35% 9%五、有利于专题文献查准和查全 检索工具原始文献(线索)六、克服专业语言和自然语言的障碍,五、检索语言,检索语言,是根据检索的需要而创造的人工语言,用于描述检索系统中信息的内部特征和外部特征并能表达用户信息提问的一种专门语言。,标引文献与揭示文献内容的两种基本方法:,、分类法:按照文献资料的学科属性(分类法最有利于查全)分类法的特征在于知识的系统性,不仅揭示图书的学科知识内容,而且把有关同一学科内容的文献资料集中在一起,使学科临近的文献排在相近的位置,根据各类图书之间的亲疏关系将藏书组织成一个系统、主题法:按照所论述的事物 将文献所论述的事物按
11、照规范化的语言(主题词)的字顺进行排检,从本质上讲,是用词语来揭示文献所阐释或研究的对象、事物和问题。与分类法相比,从不同角度来揭示文献。,分类法,世界上有代表性的分类法:1、杜威十进制分类法(Dewey Decimal Classification and Relative Index 简称DDC)2、国际十进制法(Universal Decimal Classification,简称UDC)(被广泛应用于科学论文的分类 )3、美国国会图书馆图书分类法(Library of Congress Classification,简称国会法或LC)(目前广泛应用于北美大中型图书馆,特别是大学等学术性
12、图书馆 )4 、中国图书馆分类法,中图法中国图书馆分类法,以学科来组织知 识,将全部知识领域划分为5个基本部类,22大类。 马克思主义、列宁主义、毛泽东思想、邓小平理论(A) 哲学(B) 社会科学(C) 自然科学(N) 综合性图书(Z)在5个基本部类的基础上,按照从总到分,从一般到具体的编排原则进一步展开,组成了22个基本大类:A、B、C、D、E、F、 Z(L、M、W、Y)这就是俗称的中图法五部二十二大类。,中图法介绍,主 题 法 1、自然语言(非规范语言):信息检索系统中使用的标引词直接来自文献和用户提问而不加控制的一类检索语言,主要有关键词语言。 自然语言的应用以计算机为前提,否则,自然语
13、言检索将难以实现。 2、受控语言(规范语言或人工语言):标引词来自文献或者用户,并受到信息检索系统的控制的一类检索语言的总称,又叫规范化语言。 受控词在检索实践中具体体现为词表。词表在网络检索工具中的应用主要体现在辅助选词以及检索式的扩展。,汉语主题词表,汉语主题词表是我国第一部大型综合性主题词表。1979年出版,自然科学部分1991年修订收录正式主题词91158条,非正式主题词17410条。 全表共分3卷10分册,由主表、词族索引、范畴索引、英汉对照索引等组成。 是我国应用最广的一部主题标引和检索的工具。,六、检索工具,目录型检索工具 目录是图书、期刊等出版物外表特征的揭示和报道。它以完整的
14、出版物(如一本书、一种期刊)作为著录的基本单位,所以也可以说它是按某种顺序编排的文献清单。是指导阅读和科学管理文献的重要手段。 目录的著录对象一般是整本书或整种刊物,全国总书目揭示每年国内图书出版情况 每个图书馆的OPAC(联机公共目录)揭示该馆的馆藏 联合目录揭示许多家图书馆出版物收藏情况。,题录型检索工具题录的含义题录是描述文献外部特征的文献条目。文献的外部特征包括题名、著者、出处、卷期、页码、时间、文献类型、语种等著录项目。题录的著录对象一般是单篇文献。,文摘型检索工具文摘的定义我国国家标准GB 3468-1983; 检索期刊编辑总则说明定义:“除题录部分外还对文献内容作实质性描述的文献
15、条目称之为文摘”。文摘是文献原文浓缩后的产物,是忠实于原文内容的简要记录单元。揭示文献的内容特征,在文摘的编写中不能加入编写人员的主观见解和任何解释性说明,也不能对原文作任何修改。,全文型检索工具 全文也包括内容简短的事实和数据。全文性检索系统集文摘检索和全文提供于一体,是近年来发展较快和前景较好的一类数据库。 优点: 一、可以直接获取全文。 二、多数全文数据库提供全文字段检索,这个有助于文献的查全。,手工检索工具索引: 将文献中具有检索意义的事项(可以是人名、 地名、词语、概念、或其他事项)按照一定方式有序编排起来以供检索的检索工具。 相对于目录,题录、文摘等类型的检索工具,索引深入到文献的
16、细节,涉及到具体的知识点。 常用的印刷版的工具书都有索引,以便检索。,其他类型的手工检索工具工具书年 鉴查找事实或统计数据百科全书查找不熟悉的知识手 册成熟稳定的知识,查找参数,公式等辞 书词典或辞典,查找科技词汇的解释,或汉外 对照辞典 ,缩略语辞典。还有大量的专门性辞典。年 表查找一些历史大事记录,七、计算机检索,1、机检包括以下几个主要过程:,1、识别用户:帐号密码、IP地址2、接收提问:接收输入的检索词3、提问校验:语法检查(布尔逻辑组配)及用词检索4、转化提问式:将用户的原始提问式 转化成计算机处理的目标提问式5、检索:进行匹配选择的过程6、结果输出:按照相关性的大小等顺序 进行排序
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 检索 ppt 课件

链接地址:https://www.31ppt.com/p-1314138.html