数据事实信息检索.ppt
《数据事实信息检索.ppt》由会员分享,可在线阅读,更多相关《数据事实信息检索.ppt(112页珍藏版)》请在三一办公上搜索。
1、第四章 数据、事实信息检索,第一节 参考工具书书第二节 边缘性工具书,数据、事实信息的检索主要利用参考工具书以及边缘性检索工具。参考工具书具体包括字词典、百科全书、类书、政书、年鉴、手册、名录、表谱、图录等类型。,一、字词典,说文解字 尔雅 辞海 Oxford English Dictionary 缩略语词典 网上的词典,字词典具有典范、简明、索解的特征分为语言性、知识性两大类字词典的发展历史在参考工具书中是最长的,1、说文解字,我国第一部正规字典,(东汉)许慎撰。许慎首创的按字的形体结构分部归类的方法。该字典分为540个部首,汇集9353个当时通用汉字。每字下先说解字义,然后分析文字形体构造
2、,最后注音。说文解字是我国系统分析字形从而考究文字本义的重要著作,至今仍是研究古文字学和古汉语重要的工具书。,许慎是东汉著名经学家、文字学家。他根据先秦经传及秦汉字书,探讨字源,分析汉字形体结构,说明古人造字本意,从而撰成说文解字。,2、尔雅,中国最早的一部词典,也是中国训诂学史上的开山之作。在唐宋时期,尔雅被列为十三经之一。尔雅的问世对后世汉语词汇的研究与词书的编纂有很大的启发作用。该书总结和整理了汉代以前历代不同的词语,辨别了许多义同而词异的词,保存了许多周秦时期的古语词和专科名词资料,是研究先秦汉语词汇、考证古词义和古代名物不可缺少的参考资料,并能帮助了解古代社会和自然状况,提供有关的科
3、学知识。,尔雅的具体内容,据后人考定,系秦汉间学者递相增益而成。汉书艺文志著录尔雅3卷20篇,今本共19篇,分别是:释诂、释言、释训、释亲、释宫、释器、释乐、释天、释地、释丘、释山、释水、释草、释木、释虫、释鱼、释鸟、释兽、释畜。收录词条近2100条,词语4300个。,前3篇解释一般字词。解释的方法主要是采用通训法,即把许多意义相同或相近的字词类集在一起,解释它们基本的、通用的意义。如:朝、旦、夙、晨、睃:早也。其他16篇分类解释各类百科词语。如释亲主要解释有关家族、亲属、婚姻等方面的词语。释宫主要解释有关宫室建筑方面的词语等等。解释的方法主要是“释雅以俗、释古以今”。,3、辞海,中国现代著名
4、的辞书。依照10年修订一次的惯例,1999年版是继1979年、1989年之后第三次修订。1999年版收词12万条,近2000万字,有彩图本、普及本、缩印本等多种版本。彩图本是标志性版本。彩图本总计5卷,图片达16000幅,为全彩色印刷,完成了从原先“以文为主、以图为辅”的旧模式到“图文并茂、文图互倚”的转变。,4、Oxford English Dictionary,牛津英语词典,简称OED。原名为New English Dictionary On Historical Principles。初版于18841928年,共125分册,装订成10卷。初版是一部包括414825个词目、1827306条
5、例证的巨型词典。它收录了12世纪中期以来见于文献记载的几乎全部英语词语,包括只出现一次的罕见词、现代书面和口语中的普通词汇、主要专业词汇、大量的方言、俚语和稳定的科技用语,通过定义和例证追溯英语发展的历史。例证出自不同时期5000多位作家,包括16世纪前所有作家以及16世纪后的重要作家的作品,甚至包括未曾印刷过的著作和文献,1928年牛津大学通告说:“本词典的准确性与完备性优于其他所有词典。牛津词典是最高权威,是无与伦比的。”http:/arts.uwaterloo.ca 语言学家门肯(H.L.Mencken)誉之为“词典之王”。1989年,出版经过全面修订的第2版(OED2),共20卷,所收
6、词条总数达50万个,例证2412400条,全书达5900万字,内容更为博大精深。OED2光盘版已于1991年问世,新编New Shorter OED的两卷本和机读本于1993年问世。,5、缩略语词典,英语缩略语词典很多,有综合性的,也有大量专科性的,而且修订、更新也较频繁。较重要的综合性英语缩略语词典有:Acronyms,Initialisms,and Abbreviations Dictionary(首字母和缩略语词典,21st ed.Detroit:Gale,1997.3V.)收词50万条,内容广泛,包括从古罗马到现代各知识领域所出现的首字母和缩略语。,缩略语,缩略语包括缩写词(abbre
7、viation)和略语(acronyms或initialisms)。缩写词是以部分字母代替原来完整的词,如“Eng”代替“English”,“Co”代替“Company”等。略语亦即是首字母缩略词,如“Unesco”表示“United Nations Educational Scientific and Cultural Organization”。,6、网上的词典,YourD(你的词典网,),收录230多种语言的1500多种词典,分为词典使用导航、多语种词典、翻译,各种专门用途的词典,如用法词典、成语词典等。中文词典:IT词典()中外文对照词典:词霸在线()等。,二、百科全书,中国大百科全书
8、 The New Encyclopedia Britannica The Encyclopedia Americana Colliers Encyclopedia 知识在线 搜索引擎的百科,1、中国大百科全书,(),我国第一部具有权威性、世界性、综合性的大百科全书。全书内容包括哲学、社会科学、文学艺术、文化教育、自然科学、工程技术等66个学科和知识门类。共74卷(含总索引1卷),共收77859个条目,约12568万字,总插图49765幅,其中彩图15103幅。,中国大百科全书采用了分类与字顺相结合的编排方法,即全书按学科分类分卷,同一卷别内的条目按条头的汉语拼音字母顺序并辅以汉字笔画、起笔笔形
9、顺序排列。全书各卷的整体构成,一般包括前言、凡例、学科的概观性文章、条目分类目录、正文、彩图插页、大事年表、索引。其中有特色的是列于正文前的学科的概观性文章和条目分类目录。前者一般由该学科最具权威性的专家撰写,后者具有分类索引的功能。,中国大百科全书在内容上具有如下显著特点:一是对有关中国的内容作了比较充分、权威的反映。具有悠久历史或取得突出成就的学科,均单独设卷,比如“中国文学”、“中国历史”、“传统医学”、“航空航天”、“中国地理”等。一般卷别中也比较充分地反映了该学科或知识门类在中国的发展概况、主要成就。对中国历史上重要的人物、著作、事件、地名以及当代中国重要的在世人物,收录比较完备。,
10、二是自然科学与技术方面的内容所占比重较大。目前,世界上主要的大型综合性百科全书大都以社会科学方面的内容为主,自然科学和技术方面的内容最多占全书的40%左右中国大百科全书中自然科学与技术的内容则占到50%。从所设卷目来看,纯属自然科学与技术的卷几乎占半数,而某些属于社会科学范畴的卷中对自然科学理论的交叉渗透、现代技术手段的引进应用,也有较多的反映。从条目内容看,自然科学与技术各卷中那些在整个知识体系中处于第三、四层位的条目,其内容的知识深度一般都超过了国外的综合性百科全书,更接近于专业性百科全书。中国大百科全书从全书来看是综合性的,若以单卷来看,又兼有专业性百科全书的性质。,存在问题,分科分卷的
11、编纂体例带来了某些具有多重属性的知识主题或重复、或遗漏、或片面的结果;某些检索系统设计不妥,比如规定纯中国内容的条目标题不译出外文,这样也就没有条目外文索引,以致于像中国文学、中国历史这样重要的学科卷的国际性有所降低。,不同版本,中国大百科全书出版了光盘版中国大百科全书图文数据光盘,用24张光盘容纳了正文73卷的全部内容。在查考检索的便捷性方面,光盘版显示出了巨大的优越性。1996年,中国大百科全书出版社又推出了以中国大百科全书为基础,经增补、改编、浓缩而成的中国大百科全书(简明版)。简明版共12册,其中正文11册、索引1册,设有条目31000多条,插图、表格11000幅,总字数2000多万。
12、简明版具有简明实用、以概述古今中外各学科、各领域一般知识为主的特点。,2、The New Encyclopedia Britannica,新不列颠百科全书(),简称EB,15th ed.,Robert McHenry ed.-in-chief,Chicago:Encyclopaedia Britannica Educational Corp.1997.32V.)EB是西方世界最著名的百科全书。初版于19631771年,3卷;18751889年出版的第9版引起了世界普遍的重视,该版共25卷,因为有一批当时的著名专家学者所撰写的长篇论文作为它的专题大条目,被人们称为“学术版”,奠定了EB的学术地位
13、。,1911年出版的第11版标志着EB进入新的演变阶段,由于和美国芝加哥大学挂钩建立了英、美合编的关系,内容初具国际性,全书规模从第9版的25卷增加到29卷。真正使EB赢得世界威望的是1929年出版的第14版,无论在内容范围、修订方法及编排体例上都很有特色。1974年出版的第15版标着EB又进入一个完全崭新的演变阶段。书名加上了一个“New”字,表示它的内容和形式都是全新的。内容上沿用第14版原有条目不足1/10;编排体例上的变动更大。,第15版 的特色,EB15开创性地将全书分为三个部分:第一部分为百科简编:便捷参考和索引(Micropedia;Ready reference and ind
14、ex),12卷。正如其副标题所示,“简编”既是一套简明百科全书,又是全书的索引。它采用小条目编纂法,可独立使用。第二部分为百科详编:知识深义(Macropedia:Knowledge in depth),29卷,是EB15的主体部分,由大条目组成,其内容的学术权威性为西方所公认。第三部分为百科类目:知识纲要和不列颠百科指南(Propedia;Outline of Knowledge and Guide to the Britannica),1卷。既是人类知识的分类纲要,又在一定意义上对全书起着分类索引的作用。后来,加编了2卷索引。,年度补篇出版的不列颠世界资料年鉴(Britannica Wor
15、ld Data Annual)。EB15除印刷版外,还有机读磁带版,可通过联机检索系统进行全文检索。1992年制作了光盘版索引,名为Britannica Electronic Index。可以登录,进行Encyclopedia Britannnica Online 的搜索,该电子版增加了许多新的功能。,3、The Encyclopedia Americana,The Encyclopedia Americana(美国百科全书,简称EA),美国第一部大型综合性百科全书。在英语百科全书中,其权威性仅次于EB。于18291833年问世,至今已有180年历史。,4、Colliers Encyclope
16、dia,(科利尔百科全书,简称EC)。该书为20世纪中叶才问世的一部大型综合性百科全书。初版于19491951年。EC属成人通俗百科全书,以非专业人员、青年学生等广大普通读者为对象,选材广泛,尤为注重广大读者感兴趣的实用性材料。条目大小并举,以中小条目居多。条目的撰写通俗、简练,为普通读者所喜爱。此外,EC在内容新、插图质量好、索引与条目完善方面都优于EA和EB,因此,EC广受欢迎,跃居著名三大英文百科全书之列。每年出版Colliers Yearbook以弥补百科全书内容更新的不足。,除上述三大著名英文百科全书之外,现有较重要的英文百科全书是:Chambers Encyclopedia(钱伯斯
17、百科全书)Academic American Encyclopedia(美国学术百科全书)World Book Encyclopedia(世界图书百科全书)等。,5、知识在线,知识在线(),面向华人的在线中文知识库,包括北京百科全书网、奥林匹克百科全书网、国家百科全书网等。,三、类书 政书,(一)类书 1.类书的含义及特征 2.类书的发展简史(二)政书 1.政书的含义及特点 2.政书发展简史 3.政书的类型及功能,1、类书的含义及特征类书是辑录多种文献中可供参考的资料,按类或按韵编排,以供寻检、征引的工具书。这是我国古代颇具特色、影响深远的一种百科全书式的资料汇编。,(一)类书,特征,内容上广
18、采博收,包罗巨富类书的收录范围非常广泛,特别是古代一些综合性类书,经、史、子、集四部皆收,史实典故、名物制度、诗赋文章、丽词骈语、天文地理、飞禽走兽、草木虫鱼、服饰器物及其他事物都收录,可以说是百科具备。编排上以类相从,便于检索古代类书分类体系大致相同,一般按事物性质分类法,分为“天、地、人、事、物”五大类,在每大类下再划分小类。各类部序清晰,便于查检。也有少数类书按韵部编排,具有汇编性。类书只是辑录原书原文,按类堆砌,仅注明出处,不加以解释,以客观反映古籍原貌和事物本来面目,具有资料汇编的性质。类书收录范围广泛,往往成为一定时代或一定范围的知识总汇;又由于按类编排,便于检索,故被称为“古代的
19、百科全书”。,四部分类法,四部分类法分为经、史、子、集四部,是一种粗约的学科分类体系法。经部收录儒家经典著作十三经及其解释性著作;史部收录历史、地理及目录方面的著作;子部收录诸子著作、古代笔记小说及科技著作,包括农学、医学、天文、数学等内容的著作;集部收录的多为文学作品及文学理论著作,包括历代诗文总集、别集、诗文评论、词典集等。,我国古籍书目一般采用四部分类法。四库全书总目、贩书偶记、中国丛书综录、中国古籍善本书目等古籍书目采用四部分类法,反映了古代知识及古籍的分类情况。,事物性质分类法,事物性质分类是把知识内容按事物属性类分的一种排检方法。类书、政书、年鉴、手册等类工具书,多采用这种排检方法
20、。,古代类书、政书的分类是以伦理为原则、事物形态为依据,把众多的知识材料归纳在“天、地、人、事、物”等类目体系中,大类之下再区分为若干小类。如艺文类聚分46部727小类,太平御览分55部5426小类,古今图书集成分6汇编32典6117部。,其中古今图书集成分类最为严密,三级类目另加复分。历象汇编、方舆汇编、明伦汇编、博物汇编、理学汇编、经济汇编为一级类目。每个汇编分为若干典,如历象汇编统摄乾象、岁功、历法、庶征4典,典为二级类目。,典又细分部,如乾象典分为天地总部、天部、阴阳部、五行部、七政部、日月部、日部、月部、星辰部、天河部、风部、云霞部、雾部、虹霓部、雷电部、雨部、露部、霜部、雪部、火部
21、、烟部等21部,部为三级类目部下再按内容多少复分为汇考、总论、图、表、列传、艺文、造句、纪事、杂录、外编。分类很严密,政书的类目,按典章制度内容归纳为一定的门类,再细分为若干小类和子目。如通典分为8典,包括食货、选举、职官、礼、乐、兵、兵刊、州郡、边防;文献通考分为24考,大类之下分别再细分。年鉴、手册等类工具书,都是根据其性质特点及内容材料的具体情况进行分类。,事物性质分类法由于是以事物性质、形态进行分类,一般比较具体、直观,便于排检。但古今的分类方法及类目概念有很大的不同,具体检索时,先要弄清分类体系及类目含义,并注意使用辅助索引。,时序排检法地序排检法字顺法:汉语(形序法、音序法、号码法
22、)英语(word by word,letter by letter),类书和现代的百科全书有本质上的区别类书是辑录前人的文献资料,只编不述,且不加修改补充,检索途径比较单一;百科全书则是条目撰写者吸取前人的知识成果,以撰写词条的形式予以表述,以述为主;百科全书为了使其内容能跟上学科和社会的发展,一般都有计划地修订再版,并编有多种辅助索引。,2、类书的发展简史,类书起源的原因:政治上,为了显示文治之盛,或者为了平息国内怨言、转移视线;学术上,从汉代兴起的抄撮之学;文体“赋”的兴起;科举考试的需要。中国第一部类书是皇览,公元220年编成。该书40余部,800多万字,收集了古籍中大量的诗文资料,历经
23、数年编成,可惜于隋末失传。继皇览之后,较著名的有华林遍略等,但都已亡佚。,唐朝初年,受南北朝的影响,文章讲求辞藻典故,盛行骈俪,所以供作诗取材之用的类书逐渐产生。这些类书“事”与“文”并重,形成类书新的体例。这种新体例的第一部类书便是唐初的艺文类聚,也是我国现存最早而完整的类书。,宋代编撰类书的风气更盛于唐代。著名的有太平广记、太平御览、文苑英华、册府元龟,后来统称它们为宋代“四大书”。宋代私撰类书也很盛行,著名的有玉海、锦锈万花谷、事物纪原、全芳备祖。,明清时期,类书的编纂达到顶盛。明代编纂出了我国历史内容最广博、卷帙最庞大的一部综合性类书永乐大典,它全书共22937卷,3.7亿字,可惜存世
24、的已不多。清代最著名的类书是古今图书集成,它是我国现存最大的一部类书,共1万卷。清代编撰的著名类书还有渊鉴类函、佩文韵府、骈字类编、子史精华。根据历代艺文志、经籍志著录,自魏至清千余年间,我国编纂的类书有六七百种之多,现尚存200余种。,类书分类按内容范围分,有综合性类书和专门性类书;按材料性质分,有记载史实的类事类书,有收集诗赋文章的类文类书,还有事文兼备的类书;按编排体例分,有分类排列的类书和按韵部排列的类书;按功能用途分,有查考事物起源的类书,有查考岁月典故的类书,有供辑佚和校勘古籍的类书。,古代类书保存了丰富的文化遗产,可提供各种原始资料,可以用来查考史实、搜集参考文献、检索诗词文章典
25、故的含义以及校勘古籍、辑录已散失的古籍遗文。,(二)政书,1、政书的含义及特征政书是记载历代典章制度的工具书。它主要收集我国历代或某一朝代的政治、经济、军事、文化等制度方面的史料,分门别类,按时代先后次序汇编成书,叙述历代或某一朝代典章制度的沿革和发展,因此它具有制度史、文化史和学术史的性质。,政书和类书区别,编纂方式不同。类书的编纂是“述而不作”,只是摘抄汇编原始材料,按类堆砌,不加改动。而政书则将史料加以组织提炼,使之成为整体。有的还对重要问题加入按语,多为作者精辟独到的见解,所以政书的编纂是“有述有作”。,内容不同。类书取材广泛,经、史、子集无所不收,记载的多为史实典故、名物制度、诗赋文
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 事实 信息 检索

链接地址:https://www.31ppt.com/p-5985367.html