信息源、信息检索原理与信息检索技术.ppt
《信息源、信息检索原理与信息检索技术.ppt》由会员分享,可在线阅读,更多相关《信息源、信息检索原理与信息检索技术.ppt(76页珍藏版)》请在三一办公上搜索。
1、信息源、信息检索原理与信息检索技术,基础知识:,目录,信息源及其识别*信息检索原理信息检索技术 检索效果评价,1 信息源(信息资源)及其识别,随着科学技术的发展,(文献)信息源的表现形式呈现多样化态势。了解信息源的不同形式,有助于加深对信息内涵及其特征的认识,为信息的利用打下坚实的基础。,信息源(信息资源)划分示意图,1.1 按照载体形式分,印刷型缩微型 声像型 机读型,1.1 按照载体形式分-印刷型,印刷型即书本型,也称纸介型是一种以纸介质为载体、以书写或印刷方式为记录手段而形成的文献类型。它是一种技术含量低、对个人使用相当方便的一种文献,人们对它司空见惯,是最常用的一种文献载体。上千年来它
2、在人类的阅读、信息的流通中功不可没。优点:缺点:易携带性 信息密度低 易阅读性 容量小 易标记 体积庞大 个人可支付 占有大量存储空间 可存档 不易长久保存 可占有可保存,1.1 按照载体形式分-微缩型,微缩型,以光学材料和技术生成的文献形式,经历了一百多年的历史。在全息照相技术出现之前,一般只是将文字、图象等信息符号进行一种等比的缩放。缩微媒体还可作为计算机数据的存取载体,分别有输入胶卷和输出胶卷。缩微图象可复制,传送设备能将扫描的缩微图象在异地的打印机或传真机等设备上输出。缩微型资料本身的数字化被认为是一种趋势。,1.1 按照载体形式分-声像型,声像型,也称视听型,它使用电、磁、声、光等原
3、理、技术将知识、信息表现为声音、图象、动画、视频等信号,给人以直观、形象的感受。比起文字信息来,人们更乐于并容易接收视听信息,它是人们认知、学习、文化娱乐的重要来源。在科学技术领域中,它在描述自然现象和实验现象方面具有不可替代的表现力,比如大至天体星云,小至原子结构。在语言学习方面,这类文献也有其独到之处。声像文献有许多制品,从唱片、录音带、录像带、电影胶片直至当前风云市场的唱盘和视盘(audio disc&video disc)。利用计算机对音像信息的处理,使声像型文献更丰满、诱人,也声像文献与电子文献浑然一体。,1.1 按照载体形式分-电子型,电子型,也称为机读型,所谓“机”现指的就是计算
4、机、微机。通过计算机对数据的存取与处理,完成文献信息的数字化,形成电子型文献及形形色色的电子出版物,它们包括电子图书、电子报刊、电子新闻、电子会议录等等。机读型的版本也是多样的,有磁带版、磁盘版、光盘版、联机版以及最新的网络版。电子型文献不仅具有存储密度高、存取速度快的特定,而且具有电子加工、编辑、出版、传送等种种功能。它有如下特点【了解】:可存取性、可获得性、即时性、及时性、可检索性、可研究性、学科交叉性、动态性、合作性、可链接性、交互性、广博性、多媒体性。,1.2 信息处理级别(又称文献深度),一般说来:一次信息是基础,是检索的对象;二次信息是检索一次文献的工具;三次信息是一次、二次信息的
5、浓缩和延伸。,1.一次信息(文献)一般指以知识的直接生产者记录的最初发现、发明、新理论、新方法、新见解为内容出版的原始文献,包括期刊论文、研究报告、会议录、专利说明书、学位论文等。2二次信息(文献)二次文献是将大量分散、零乱、无序的一次文献进行整理、浓缩、提炼,著录其特征(著者、篇名、分类号、出处、文摘等),并按照一定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用。其主要类型有目录、索引和文摘等。,3.三次信息(文献)是选用大量有关的文献信息,经过综合、分析、研究而编写出来的文献信息。它通常是围绕某个专题,利用二次文献信息检索搜集大量相关文献,对其内容进行深度加工而成。属于这类文
6、献的有综述、评论、评述、进展、动态、手册、指南、年鉴、百科全书等。这些对现有成果加以评论、综述并预测其发展趋势的文献,具有较高的实用价值。在学习和学术研究中,可以充分利用反映某一领域研究动态的综述类文献信息,在短时间内了解其研究历史、发展动态、水平等,以便能更准确地掌握学习和学术研究领域的技术背景等。主要分为:综述研究和参考工具两类。,1.2 信息处理级别(加工深度)示意图,俗称全文,信息,1.3 信息的出版形式,十大传统文献信息源,常见文献信息1.图书2.期刊3.报纸,特种文献信息4.学位论文5.会议文献6.专利文献7.标准文献8.科技报告9.技术档案10.产品资料,多种信息源的载体:A 网
7、络信息源B 数据库,1.3.1 信息的出版形式-图书,论述或介绍某一领域知识的出版物。图书又可分为三类:一类是消遣、教科书、科普读物和一般生产技术图书,属阅读性的图书;一类是辞典、手册和百科全书等,属工具性的图书;另一类是含有独创性内容的专著,它属原始信息(文献)。图书往往是著者在收集大量第一手资料基础上,经分析归纳后编写而成的。其特点是内容比较系统、全面、成熟、可靠,但出版周期较长,报道速度相对较慢。图书主要用于需对大范围的问题获得一般性的知识或对陌生的问题需要初步了解的场合。图书的著录特点是:有书名,有著者,有的还有编者;必有出版地、出版社名和出版年份;非第一版的图书有版次;有的图书还给出
8、国际标准书号(ISBN)。这四点中第2点较重要。,补充:什么是著录,著录就是把文献信息的各种内部、外部特征记录下来的过程,其结果就是形成一条目录信息。文献信息被著录后能有利于被识别、交流和传播。通过著录的目录信息能方便地指向原始信息。,下列情况会用到图书1.系统地学习知识;2.了解关于某知识领域的概要;3.查找某一问题的具体答案。,识别信息源-图书,关于图书的线索有的来源于参考文献、也有的来源于数据库的检索结果。比如下面的记录:钱军,周海炜.知识管理案例M.南京:东南大学出版社,2003.103-115“103-115”表明了作者引用的内容所在的页码范围。请记住:图书最显著的特征是有出版社信息
9、,文献标识符是M,1.3.2 信息的出版形式-期刊,一般是指名称固定、开本一致的定期或不定期连续出版物。期刊论文内容新颖,报道速度快,信息含量大,是传递科技情报、交流学术思想最基本的文献形式。据估计,期刊情报约占整个情报源的60-70%,因此,受到科技工作者的高度重视。大多数检索工具也以期刊论文作为报道的主要对象。对某一问题需要深入了解时,较普遍的办法是查阅期刊论文。,下列情况会用到期刊 1.当做学术研究时,了解与自己的课题相关的研究状况,查找必要的参考文献;2.了解某学科水平动态;3.学习专业知识。,期刊论文的著录格式识别作者(多作者用逗号分开,超过3个者用et al).文章题目.刊物名称,
10、年代,卷数(期数):页数【英文】H.Tohyama,A plasma Image bar for an electrophoto-graphic printer,Journal of the Imaging Science,Vol.35 NO.5,330-3(Sept-Oct 1991)【中文】赵洗尘.数字图书馆资源组织.图书情报工作J,2003(3):7680,杂志,杂志,像期刊和报纸一样,是连续出版物的一种,但是它的内容一般是通俗性的,或者娱乐、新闻等。下列情况会用到杂志 1.寻找关于流行文化的信息和观点;2.得到当前事件的实时信息;3.寻找供某一领域非专业人士阅读的文章。,电子杂志,强调
11、互动性充分利用多媒体利用平台发送电子杂志涵盖从娱乐、运动休闲、语言学习、消费到商业财经等不同领域!基于宽带的内容和集Flash动画、视频短片和背景音乐、声音甚至3D特效等各种效果于一体的多媒体表现形式令他们完全摆脱了传统杂志的束缚,并且具有了更多的互动性。信息源:ZCOM Xplus 猫扑电子杂志 P电子杂志 龙源期刊网 Dmad 酷乐互动 MeMail 希网网络 VIKA DigiBook iebook 妙想互联,期刊与杂志的区别,杂志适合普通读者阅读,内容涉及到生活的方方面面,体育或电影明星,生活、娱乐、故事等 杂志往往有许多照片和广告 杂志上刊登的文章一般不长 杂志的出版周期通常比学术性
12、期刊短-学术期刊适合学者、研究人员及教授们阅读 刊物名称中一般有“学报”等字样,容易辨认 学术期刊中较少照片或广告,封面严肃 学术期刊刊登较长、有深度的研究文章 学术期刊通常由学术或专业机构主办,1.3.3 信息的出版形式-报纸,连续出版物的一种,通常每天或每周发行,它收集了时事和新闻和相关评论的各种文章。特例:还有一天出版5次的报纸。报纸最大的优势是时效性强。下列情况会用到报纸 1.找关于国际、国内和本地事件的最新消息;2.找社论、评论、专家或者大众的观点。报纸著录:国务院新闻办公室.中国的粮食问题.人民日报,1996-10-25(2),1.3.4 信息的出版形式-学位论文,是指为申请学士、
13、硕士、博士等学位而提交的学术论文。学位论文的质量参差不齐,但都是就某一专题进行研究而作的总结,多数有一定的独创性。学位论文是非卖品,除极少数以科技报告、期刊论文的形式发表外,一般不出版。学位论文的获取一般通过专门的数据库或学位授予单位的图书馆。学位论文著录的特点是:通常有表示学位论文的词,如Thesis,Dissertation等;有的有论文作者所在学校的校名。下列情况会用到学位论文1.科学研究开题前的文献调研;2.博硕士研究生撰写开题报告时。3.自己写毕业论文或毕业设计时。4.追踪学科前沿发展、研究研究过程,学位论文著录格式识别(学位级别和机构)1.朱建立.面向对象的分布式知识处理系统:硕士
14、论文.北京:中国科学院计算技术研究所,1987 2.P B Bishop.Computer system with a very large address space and garbage collecti:Ph D dissertation.Cambridge,MA:Massachusetts Inst Technol,1997,1.3.5 信息的出版形式-会议文献,是在学术或专业会议上交流的论文和会议资料编辑出版的信息。特点:内容新颖、专业性和针对性强,传递信息迅速,能及时反映某个专业领域的研究水平,新发现、新成果、新成就以及学科发展趋向,是了解有关学科发展动向的重要信息源。会议文献包
15、括:会前文献,如会议日程预报和会议论文预印本;会中文献:开幕词、讨论记录和闭幕词等;以及会后文献,会议录(Proceedings)、会议论文集(Symposium)、会议论文汇编(Transactions)。会后文献是主要的会议文献。,会议文献的识别,会议文献著录的特点是:有表示会议的专门用词,如Conference,Workshop,Meeting,Congress,Assembly等;有表示会议录的一些词,如Proceedings of.,Collection of.;有的有会议召开的地点、届次、时间,以及会议录的出版社、出版地、出版时间等。这三点中第1点最为重要。惠梦君,吴德海,柳葆凯,
16、等.奥氏体-贝氏体球铁的发展.全国铸造学会奥氏体-贝氏体球铁专业学术会议,武汉,1986,下来情况会用到会议论文1.当做学术研究时,了解与自己的课题相关的研究状况,查找必要的参考文献;2.了解某学科水平动态。,1.3.6 信息的出版形式-专利文献,主要由专利说明书构成。所谓专利说明书是指专利申请人向专利局递交的有关发明目的、构成和效果的技术文件。它经专利局审核后,向全世界出版发行。专利说明书的内容比较具体,有的还有附图,通过它可以了解该项专利的主要技术内容。由于只有符合新颖性、创造性和实用性的发明创造才能获得专利权,所以专利说明书对于工程技术人员,特别是产品工艺设计人员来说,是一种切合实际、启
17、迪思维的重要情报源。,专利文献由于有等同专利,所以重复量大,更具这一特点,可以通过不同途径获得专利全文。专利说明书著录的特点是:通常有表示专利的词(Patent);有专利号。专利号按国际规定由两个字母表示的国家名称和其后的顺序号构成。姜锡洲.一种温热外敷药制备方法.中国专利,881056073.1989-07-26,下列情况会用到专利文献1.在申请专利前,检索相关的专利文献,确定该项发明创造是否能被授予专利权;2.开发新产品,投入新项目,先查专利文献,寻找技术方案;3.从专利文献中了解某领域的技术水平及发展的最新动态;4.开发新产品前,检索专利,了解现状,避免侵权;5.利用权利情报,参谋进出口
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息源 信息 检索 原理 技术
链接地址:https://www.31ppt.com/p-5230067.html