欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > DOCX文档下载  

    出版信息组织与利用.docx

    • 资源ID:1726953       资源大小:199.03KB        全文页数:72页
    • 资源格式: DOCX        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    出版信息组织与利用.docx

    出版信息组织与利用第一章 信息与信息资源概说 § 第一节 信息与文献信息概念解释: 信息、文献、知识信息:是物质的一种基本属性。它是自然和人类社会中一切事物自身运动状态与方式,是事物的内在联系和含义的表征。 知识:是人类实践经验的总结,是人的主观世界对客观世界的如实反映和概括,是认识的结果。知识是信息的一部分,是由信息提炼,转化而成的是经过人类认识,挑选,系统和深化了的信息。文献:记录有知识的一切载体。信息包括知识,知识包括文献。(三圈图) 文献信息n 文献信息就是以文献形式记录人类知识的信息。文献信息资源是人类信息资源的主体。n 文献信息既具有物质的属性,又不是物质;既属于意识范畴,又不是纯意识的。n 它是用文献形式把客观事物的属性再现出来,因而它既有物质的属性,又是意识的存在形式。物质和意识在一定程度上可以是统一的,文献信息正是体现这种统一性的事物。 人们需要各种文献信息§ 例1、文献查找:在论文写作或编辑过程中需要“出版业产业化、集团化改革”方面的资料。§ 例2、数据或事实查询: “我国印刷术的起源与发展”中韩之争;肖东发教授的例子 在工作中需要核实:1998年我国出版业的规模和利润各是多少亿元? § 例3、生活中的信息查询 报考研究生,需要对高校及研究生硕士点的情况进行了解,进行决策。 当代大学生需要较高的信息素质n 信息素质:“信息素质”(Information literacy)也称信息素养,这一概念最早由美国波尔(Paul Zurkowski)于1974年提出。信息素质包括图书馆素质、计算机素质、媒体素质、技术素质等。目前,国内信息管理行业对“信息素质”的定义趋于多样化。综合起来,可得到一种共识:信息素质是人认识、创造、利用信息的品质和技能。信息素质包含信息意识、信息能力和信息道德三方面的内容。n 信息素质是创新人才应具备的基本素质之一。 中场第二节 文献信息的类型(文献的分类)一、根据文献载体和信息记录形式划分 1.手写文献 2.印刷型文献 3.缩微型文献 4.视听型文献 5.机读型文献(电子文献)二、根据文献编辑出版的特征和 _范围划分1.正规文献: (1)图书 (2)期刊 (3)报纸2.非正规文献(也称灰色文献): (1)会议资料 (2)学位论文 (3)内部刊物 (4)档案文献 (5)政府出版物1.正规文献:通常指正式的、公开出版发行的文献。n (1)图书:形式特征是完整固定,有封面、书名页、目次、正文及版权页,并都装订成册。内容特征是主题突出、论述完整、内容成熟。出版周期较长,一般不反映最新的知识信息。n (2)期刊:又称杂志,是指具有一个稳定的总名,有一定的卷期或年月标志,定期或不定期连续出版的文献形式。主要特点是出版迅速、内容新颖广泛、系统连贯。n 核心期刊:指那些信息密度大,具有代表性和权威性,使用寿命长,反映学科发展最新动向和科学研究的最新成果,受到专业读者重视的期刊。核心期刊是一种重要的科学文献信息源。n 例如:中国核心期刊指南、中文核心期刊要目n (3)报纸:也是一种连续出版物,出版周期短,时效性最强;形式简单,一般以单张出版;内容包罗万象,汇天下之精华,具有广泛的使用价值。2.非正规文献:也称灰色文献,专指非公开发表,通过正规渠道无法获得,有重要参考价值的文献。(1)会议资料:指在国内外各种学术会议上交流的论文。 (2)学位论文:即高等学校、研究机构的学生为取得某种学位而撰写的论文。(3)内部刊物:指政府机关、高等院校、研究机构、出版发行等单位非公开出版的刊物。(4)档案文献:指国家机构、社会组织以及个人在从事各项实践活动中直接形成的具有保存使用价值,经过立档归档,集中保管起来的各种文件。(5)政府出版物:指各国政府及其所属部门发表的文件。三、根据文献的加工程度划分1.一次文献2.二次文献3.三次文献1.一次文献: 指以科学研究、工作实践中的新成果、新知识和经验总结为依据而创作产生的文献。这是最基本的文献信息源。 主要包括学术专著、报刊论文、文学作品、科研报告等。2.二次文献: 指根据实际需要,按照一定的科学方法,将特定范围的分散的一次文献进行加工整理而形成的文献。它能较为全面系统地反映某学科某专业的线索,是检索一次文献的工具。 主要包括书目、索引、文摘、图书馆目录等。3.三次文献:指通过二次文献提供的线索,选用一次文献内容,进行分析综合后而编写的文献。 包括综述研究和参考工具两类。综述研究类如专题述评、动态综述、进展报告等;参考工具类有百科全书、年鉴、手册等。 三次文献的特点在于高度浓缩和深度加工,是知识在更高层次上的网络化和综合化。 第三节 电子信息源§ 电子信息源是以电子数据的形式,把文字、声音、图像等形式的信息存储在光、磁等介质上,以电信号、光信号的形式传输,并通过计算机和其它外部设备再现出来的一种新型信息源。因此电子信息源实质上是一类机读型信息源。 § 电子信息源按其载体形态可分为两大类:有形电子信息源,即封装型电子信息源;网络电子信息源。§ 网络电子信息源又分为联机网络信息源和Internet网络信息源。音像信息资源§ 音乐§ 视频§ 多媒体电子信息源的特点 n 文献信息载体方面,电子信息源以磁性介质和光介质作为信息存储载体n 文献信息表现形式为文本、超文本、多媒体和超媒体,使文字、图形、声音、动画、三维图像等相结合电子信息源的特点§ 电子信息源较易共享 § 电子信息源时效性强 § 知识的类聚性 第二章 信息检索原理 § 第一节 信息检索基本原理§ 信息检索(Information Retrieval)广义上是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出相关信息的过程和技术,又叫“信息存储与检索”(Information Storage and Retrieval)。§ 狭义的信息检索则仅指该过程的后半部分,即从某一信息集合中找出所需的信息的过程,相当于人们通常所说的信息查询(Information Search)。§ 如不加特别说明,本处提到的“信息检索”是狭义的信息检索,即信息查询。 信息检索的意义和作用§ 1. 信息检索是获取知识的捷径§ 2. 信息检索是科学研究的向导§ 3. 信息检索是终身教育的基础信息检索的类型(一) n 按照存储与检索的信息类型不同,信息检索可以分为数据检索、事实检索、文献检索n 数据检索是以数值或图表形式表示的数据为检索对象的信息检索。数据检索的对象是具有数量性质,并以数值形式表示的数据。 n 事实检索是以从文献中抽取的事项为检索内容的信息检索。事实检索以事项为检索的目的和对象,检索的结果是有关某一事物的具体答案,既包括非数值信息,也包括一些数据信息,针对查询要求,由检索系统进行分析、推理后,再输出最终结果。 n 文献检索是以文献为检索对象的信息检索。它为用户提供的是与用户的信息需求相关的文献信息,文献检索的目的是提供相关文献的出处、收藏处所或者文献原文。信息检索的类型(二)n 按信息存贮和检索手段,信息检索可分为手工检索、机械化检索和计算机检索n 手工检索就是用人工来处理和查找所需信息的检索方式。 n 机械化检索是利用探针或检索器件等机械装置来处理和查找文献信息的检索方式,是介于手工检索和计算机检索的一种半自动化检索。n 按机械化检索使用的设备和信息载体机械化检索又可以细分为穿孔卡片检索和缩微品检索。 n 计算机检索是利用计算机和一定的通信设备查找所需信息的检索方式。n 它需要计算机、通信硬件设施、系统软件和应用软件。n 目前,广泛使用的计算机检索系统包括因特网上检索系统、联机检索系统和光盘检索系统。信息检索系统n 信息检索系统是拥有一定的存储、检索技术装备,存储有经过加工的各类信息,并能为信息用户检索所需信息的服务工作系统。n 信息检索系统是连接信息用户和信息资源的必要中介。 n 信息检索系统是由信息资源、设备、方法(信息存储和检索方法)、人员(系统管理人员和信息用户)等因素有机结合而成的复杂系统,具有信息采集、整理加工、存贮、查询、显示传递等功能。 信息检索系统n 根据信息检索系统使用的工具、载体和技术方法的不同,信息检索系统可分为手工检索系统(印刷型检索系统)、缩微检索系统和计算机检索系统。 n 手工检索系统由手工检索设备(如书本式目录、检索性工具书、文摘、索引、卡片柜等)、检索语言、文献库等构成。n 它具有使用方便,成本低廉等特点,但检索效率和响应时间均较差。 n 缩微检索系统是一种机械检索系统,随着计算机检索系统的推广和完善,目前应用日渐稀少。 n 计算机检索系统主要由计算机检索设备(联机检索设备、光盘检索设备、微机检索设备、缩微品机检设备等)、检索语言、文献库等构成。n 计算机检索系统具有检索效率高,响应速度快等特点,但是成本和检索费用较高。信息检索系统n 计算机检索系统又可分为一次性信息检索系统和二次性信息检索系统。n 前者适合于信息量不大而需要经常修改的情况,如航空订票系统;n 后者适用于信息量大而不需修改的情况,如图书或文献检索系统。 信息检索工具 n 信息检索必须要借助于一定的检索工具。n 信息检索工具是指用以报导、存贮和查找文献信息线索的工具。n 它是附有检索标识的某一范围文献条目的集合,是二次文献。 n 检索工具具有广义和狭义之分。n 广义的检索工具是指用来报道、存贮、查询文献信息的一切工具与设备,可分为手工检索工具、机械检索工具和计算机检索工具。n 广义检索工具与检索系统的含义是一致的,彼此并没有严格的区分界定。n 狭义的检索工具则主要指手工检索工具,也称印刷型检索工具或书本式检索工具。n 我们这里的检索工具是广义的检索工具,任何具有信息存贮和检索功能的工具和设施均可称为检索系统或检索工具。n 但手工检索的时候,多使用检索工具一词;而计算机检索时则更多使用检索系统一词。信息检索工具n 检索工具应具备以下四个条件:n (1)明确的收录范围;n (2)完整明了的文献特征标识;n (3)提供多种必要的检索途径检索点;n (4)全部条目科学地、按照一定规则组织成为一个有机整体。信息检索工具n 手工检索工具一般分为以下几大类:n (1)目录:目录是图书、期刊或其它出版物外表特征的解释和报道。n (2)题录:题录是以单篇文献为基本著录单位来描述文献外表特征(如文献题名、著者姓名、文献出处等)的检索工具,题录没有内容摘要,是快速报道文献信息的一类检索工具。 n (3)文摘:文摘是指不加解释和评论的、对信息资料进行准确简化的再现。文摘的基本作用是用来判别或代替阅读原文。n 按照编写人的不同,文摘可分为著者文摘和非著者文摘。n 就其摘要的详简程度,可分为指示性文摘和报导性文摘两种。信息检索工具n (4)索引:索引本意为指点。索引型检索工具是根据一定的需要,把特定范围内的某些重要文献中的有关款目或知识单元,如书名、刊名、人名、地名、语词等,按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具。n 人们可借助索引的指点,找到隐藏于众多而庞杂的资料中有关信息的出处。在检索工具中,常用的索引类型有分类索引、主题索引、关键词索引、著者索引等。n (5)信息资料指南:这是一种新的检索工具,目前正在陆续出现。如,“xx省党政信息指南”、“手表行业指南” 等类型的小册子,其中既有历史资料,又有近期信息。n 除了上述几种检索工具外,还有“工具书指南”、“书目之书目”等检索工具,它们是检索工具的检索工具,对于我们掌握使用检索工具具有重要的指引和帮助作用。电子版检索工具n 电子版检索工具是手工检索工具的延伸;n 从载体形式上说,有光盘版和网络版之分,早期还有软盘版; n 从检索方式上说,有单机检索工具、联机检索工具和网络检索工具之分。 电子版检索工具的类型划分n 数值型数据库:存贮并提供数值型数据信息的数据库。n 事实型数据库:存贮并提供对基本知识和事实的历史、现状、进展进行记录、描述信息的数据库。 n 文献型数据库:存贮并提供文献性、资料性信息的数据库。电子版检索工具的主要优势n 具有强大的检索功能;n 检索工具和文献信息资源本身二位一体,一次文献和二次文献零距离;n 强化了对文献信息资源内涵和内在联系的深度揭示;n 提供全方位、立体化的信息;n 内容更新周期短、速度快。第二节 信息检索的方法与步骤n 信息检索的途径 n 检索途径,顾名思义,就是信息检索的路线和出发点。n 信息检索的途径取决于信息存贮过程中各种检索系统(工具)对文献信息处理的方式和内容。n 检索途径大多来源于文献信息的外部特征(如题名、著者)和内部特征(如所属学科)。 信息检索的途径n 分类途径 对信息检索而言,分类途径就是根据文献的内容特征,利用分类目录或分类索引查找文献的检索途径。 n 主题途径 主题途径是以表达文献内容的词、词组或短语为检索点查找文献信息的途径;n 主题检索途径是信息检索中最重要的检索途径之一。 n 责任者途径 责任者是指对文献信息内容负责或作出贡献的个人或团体,包括著者、编者、译者等。n 责任者途径是根据文献的外部特征,利用著者(个人或单位著者)目录和著者索引进行检索的途径,习称著者途径。信息检索的途径n 题名途径 文献题名是表达、象征、隐喻文献内容及特征的词、短语或句子。题名是文献的标题或名称,包括书名、刊名、篇名等。n 题名途径就是根据文献名称来查找文献的检索途径。n 通过题名途径可以利用书、刊、杂志、文章的名称查找文献,原理简单、简便易行,题名途径是最直接、方便的检索途径。n 序号途径 序号途径是借助某些文献所特有的编号来检索文献信息的检索途径。许多文献具有唯一性或一定的序号,如专利号、科技报告的报告号、合同号、资助号、文摘号、国际标准图书编号、标准文献的标准号、电子元件型号等等。这些序号都可以用来检索某一类文献。手工信息检索的一般方法 n 常用的手工信息检索方法有四种:直接检索法、间接检索法、追溯法和循环法。其中后三种检索方法是信息检索的基本方法,又以间接检索法最常用。n 计算机检索可利用的检索方法更多,如关键词法、逐词分割法等。 n 直接检索法又称直查法,是指不利用检索系统或检索工具,通过直接浏览或阅读原始文献检索获取信息的方法。n 间接检索法也称常用法或工具法,就是利用文摘或题录等各种文献检索工具查找文献的方法。n 常用法根据时间范围又分为顺查法、倒查法和抽查法。信息检索的方法n 顺查法是以所查课题起始年代为起点由远而近地按时间顺序的查找方法。 n 与顺查法正好相反,倒查法(也称逆查法、回溯性检索)是由近及远,由新到旧的顺序查找检索文献信息的方法。 n 抽查法是指根据检索课题的实际情况,着重查检某个时期文献信息资料的一种方法。n 抽查法根据课题研究的特点,抓住检索课题研究发展迅速、出版文献较多的年代,抽取一段时间(几年或十几年)或一段时间内的几个点,再进行顺时查找或逆时查找。信息检索的方法n 追溯法也称引文查找法、跟踪法,是指利用已经掌握的文献末尾所列的参考文献,通过文后参考文献进行追溯查找“引文”的一种简便的扩大信息来源的方法。n 它还可以从查到的“引文”中再追溯查找“引文”,像滚雪球一样,依据文献间的引用关系,获得越来越多的内容相关文献。 n 综合法又称为循环法,它是上述追溯法和间接检索法的结合并加以综合运用的方法。n 具体地说,采用这种方法查找文献时,既要利用一般检索工具书刊,又要利用文献后附的参考文献进行追溯,分期分段地交替使用,知道获得满意的相关文献为止。 信息检索语言 信息检索语言是根据文献信息检索的需要创造出来的一种人工语言。人工语言也称受控语言。是依据一定的规则对自然语言进行事先规范,将其编制成表,以供文献标引和检索时使用的语言。 检索语言的基本要求n 保证较高的检全率和检准率。 n 能满足多种检索要求。 n 易于标引,易于检索。 n 具有兼容性和通用性。 n 具有不断进行现代化改造的可能性。 信息检索语言的功能 n (1)对文献的信息内容(及某些外表特征)加以标引。要求利用检索语言能够正确标引文献信息内容及其外表特征;n (2)对内容相同及相关的文献信息加以集中或揭示其相关性,提高信息检索效率;n (3)对大量文献信息加以系统化或组织化,使文献信息的存储集中化、系统化,便于信息检索者按照一定的排列次序进行有序化检索;n (4)便于将标引用语和检索用语进行相符性比较,保证不同检索人员表述相同文献内容的一致性,以及检索人员与标引人员对相同文献内容表述的一致性;n (5)保证检索者按不同需要检索文献时,都能获得最高的查全率和查准率;n (6)在文献信息标引者和检索者之间发挥桥梁和纽带作用,使二者在理解和表达文献信息主题方面达到一致,提高信息检索的准确性。 n 检索语言可分为分类检索语言、主题检索语言和代码检索语言三种。n 在信息检索系统中,常用的是分类检索语言和主题检索语言。功能上各有优势,也各有不足。n 随着计算机检索技术的发展,直接来自文献本身、未经规范化处理的自然语言以其标引检索简便快捷又受到人们的广泛关注。分类主题一体化语言和自然语言代表了未来检索语言的发展方向。第三节 使用检索工具的基本技术 方法 检索词的遴选n 检索词可分为:n 字段词(如题名字段、著者字段、主题字段、摘要字段、时间字段、语种字段等)n 任意词字段词检索(1)字段词检索(2)字段词检索(3)字段词检索(4)字段词检索(5)遴选检索词的“循环衍生法”n 通过对一个词的定义、语素、语境(上下文)进行分析获得具有同义或相关关系的衍生语词。 n 通过对衍生语词进行反复检索尝试来确保检索词的全面与准确。 循环衍生法的理论基础n 定义词与被定义词往往关系密切;n 含有相同语素的词往往具有语义上的联系;n 意义相关的词在同一语境中出现的概率更大。定义衍生法-1n 从一个词的定义中寻找它的同义词或相关词;对找到的语词再定义、再寻找;不断反复,使衍生的结果不断扩大。 定义衍生法-2 文化社会学:亦称“社会学文化学派”。西方社会学理论和流派之一。形成于19世纪末。代表人物有美国社会学家萨姆纳等。认为“风俗决定文化”、“社会是文化的产物”。其特点是用文化因素来解释各种社会现象。 辞海1989年版第1736页定义衍生法-3 萨姆纳:一译孙末楠。美国社会学家。1907年当选为美国社会学会会长。对“习俗”和“道德规范”两个概念进行了论述。著有民俗论、社会的科学等。 节选自:辞海1989年版第677页定义衍生法-4n 习俗:风俗习惯。n 道德规范:人们在道德生活中应当遵循的行为准则的总和。是一定社会或阶级对人们提出的道德要求,也是道德原则的具体体现。 辞海1989年版第108、1196页定义衍生法-5 语素衍生法-1n 分析一个词的关键语素,由语素出发寻找该语素的同义词或相关词;再从找出的语词中确定新的关键语素,寻找该语素的同义词或相关词;不断反复,使衍生的结果不断扩大。语素衍生法-2 语境衍生法-1n 先将一个词作为检索词,检出包含该词的上下文,然后在该词的附近寻找它的同义词或相关词。 语境衍生法-2语境衍生法-3 康雍乾三帝倡导并亲自参与一系列文化创造活动,吸收大批学者加入,直接推动学术发展起来,出现学派纷立,俊采星驰的繁荣景象。尤以考据学即乾嘉学派的形成为其大宗,如顾炎武、阎若璩等为考据学的开山鼻祖,其后,有惠栋创“吴派”;再稍后,有戴震创“皖派”,其他如任大椿、庄存与、纪昀、王念孙、彭元瑞等一大批学者,都是乾嘉学派的主要代表人物。 李治亭清代逊国90年祭社会科学战线,2001(3)语境衍生法-4考据学 惠栋 吴派 戴震 皖派顾炎武 阎若璩 任大椿 庄存与 纪昀 王念孙 彭元瑞二次检索n 又称再次检索。在已有检索结果中的进一步检索。n 二次检索使用的检索词必须与前次检索的主题相关,如包含关系、下位关系、并列关系等。 二次检索(1)二次检索(2)二次检索(3)二次检索(4)二次检索(5)二次检索(6)布尔逻辑检索n 逻辑“与”(and):“同时包含”关系 。n 逻辑“或”(or) :“分别包含”关系。n 逻辑“非”(not) :“排除其他”关系。布尔检索法§ 用布尔逻辑算符来表达检索词间的逻辑组配关系,是最基本、最常用的检索技术。§ 布尔运算符有三种,分别是逻辑或 OR、逻辑与 AND、逻辑非 NOT。§ 1)逻辑或OR:也可写作“+”、检索词A和检索词B若用“OR ”组配,则提问式可写为“A OR B”或者 “A+B”,表示要检索含有A、B词之一或同时包含AB两词的文献。§ 逻辑或表达检索词间的并列关系。可扩大检索范围,提高查全率,如“鲁迅 OR 周树人”逻辑或: A+B、 A OR B§ 2)逻辑与 AND:也可写作“×”,检索词A与检索词B若用“AND”组配。则提问式可写为“A AND B”或者“A×B”,表示要找出含有这两个词的文献集合。§ 表达检索词间的交叉关系。可缩小检索范围,提高查准率。§ 如:“印刷*学院”,表明结果必须同时含有”印刷”和“学院”才为命中,则“北京印刷厂”排除。逻辑与:A×B 、A AND B§ 3)逻辑非 NOT:也可写作“ - ”,检索词A和检索词B若用“NOT”进行组配,则提问式可写为“A NOT B”或“A - B”,表示要找出含有检索词A而不含检索词B的文献。§ 表达检索词间的排除关系。可缩小检索范围,提高查准率,但要慎用。§ 如:A - B,表明结果是A中不包含B的那部分。n 如“北京站 北京西站”表示检索结果要含有“北京站”而不含“北京西站”逻辑非:A- B 、A NOT B布尔逻辑检索举例-1n 查找19802000年间出版的季羡林先生所写的有关“东方文化”的著作。布尔逻辑检索(1)布尔逻辑检索(2)布尔逻辑检索举例-2n 查找19802000年间出版的季羡林先生所写的有关“东方文化”论题以外的著作。布尔逻辑检索(3)布尔逻辑检索(4)截词检索n 截词检索是利用检索词的词干或不完整词形进行检索的方法。 n 截词的形式主要有任意截断和嵌入截断。 截词检索法§ 截词检索检索时,只需用词干加截词符号,凡是含有与该词干相同内容的文献均能被检出。§ 该方法能很好解决中西文单词的派生形式,避免漏检现象的出现。§ 检索系统不同,截词符也不同,常用的有:#,?,*等。 n 根据截词符出现的位置不同,可分为:n (1)后截词:将截词符放在词根后面,前方一致。 是最常用的截词方式。主要用在词的单复数、年代、作者、查同根词等情况。n 如:王伟?(可查出所有名字中含“王伟”的作者的文献)n Social* (可代替social, socialist, socialization等检索词) (2)前截词:将截词符放在词根的前面,后方一致。多见于复合词较多的文献检索,也可进行一个学科的不同应用领域的检索。但有此功能的系统不多。 (3)中间截词:将截词符置于检索词中间,词的前后方一致。又称“通用字符法”或“内嵌字符截断” ,该方式能解决英美拼法不同单词的书写或有些词在某个元音位置上出现的单复数的不同拼写。 如:wom?n(可代替woman, women) 社会科学?发展(可代替社会科学的发展,社会科学研究的发展等)嵌入截断 n 在检索词的中间嵌入截断符号。n 符号所代表的字的数量是规定的,但表达的意义是随意的。n 一个“?”代表嵌入一个汉字,最多可以嵌入9个“?” 。n 一个“!”代表嵌入01个汉字,最多可以嵌入9个“!”,代表嵌入的字数是09个。 位置检索 n 是一种对多个检索词在源文献中相对位置进行限定性查找的方法。n 例如,要求不同的检索词在同一篇文献中出现,或在同一自然段中出现,或在同一句中出现等。 自然语句检索 n 允许以自然语言中的任意短句作为检索语言,不一定非得是严格意义上的关键词。 相关检索 n 当无法准确确定检索词时,首先输入一个简单的、模糊的语词执行检索;n 这时,搜索引擎会自动提供出一系列别人搜索同方向问题时使用过的相关语词;n 以此作为参考,引导你作进一步的搜索。 内容类聚n 不管整个网络资源中有多少内容相同的网页,在检索结果中,只保留相关程度最高的一篇,其余的则被隐去。n 来自不同站点的同一内容的网页在检索结果中只出现一次。站点类聚n 不管同一站点中有多少内容相同的网页,在检索结果中,只保留同一站点中相关程度最高的一篇,其余的则被隐去。n 来自同一站点的同一内容的网页在检索结果中只出现一次。相关度n 检索结果与输入的检索词在内容上关联的疏密程度。影响相关度的主要因素n 在数据库中匹配到的关键词数量的多少;n 关键词在网页中出现的位置;n 关键词在网页中出现的频率;n 关键词本身的词义和系统定义的权值大小等 。第三章 信息分类检索 § 第一节 分类法概述§ 第二节 中图法简介§ 第三节 分类检索第一节 分类法概述n 分类法的意义 分类:按事物性质将客观事物加以区别,并按逻辑顺序将其排列,用以区别事物、认识事物的一种方法。 信息资源分类:根据信息资源的内容属性和其它特征,将信息资源分门别类、系统地组织和揭示的方法。信息分类是信息组织的基础n 信息分类说明信息量的增长 军队是按照一定的体系组织起来的,信息也一样:军、师、团、营(清朝:镇、协、标、营)n 我国图书起源早,数量大,很早就开始了图书分类的活动: “邺侯家多书,插架三万轴”韩愈 我国历史上的图书分类n 汉朝刘向:七略将当时的图书分七种,分别是:辑略、六艺略、诸子略、诗赋略、兵书略、术数略、方技略n 四部分类法:自唐至清,我国通行四部分类法,图书分为经、史、子、集四部,如水经注入史部地理类,佛经入子部。 信息分类的特征n 按照内容特征的相互关系进行信息组织 (形成具有等级性、次第性的系统)n 从一定的角度出发组织和揭示信息资源 (一般是科学体系,导致同一主题信息资源分散)n 采用一定的标记符号作为排序工具n 通过类目索引提供从字顺角度查找类目的途径信息分类的作用n 进行信息资源组织 (惟有有序方能利用)n 建立分类检索工具 (查找信息)n 分类统计n 兼容工具分类法的类型n 聚类归类 聚类形成类目体系 归类按照类目体系进行信息组织n 信息分类法按其编制方式,可分为三类:等级列举式、分面组配式和列举组配式等级列举式分类法n 将所有类目组织成一个等级系统,并采用尽量列举的方式编制的分类法。如中图法: O4 物理学 O41 理论物理学 O42 声学 O44 电磁学、电动力学 O441 电磁学 O442 电学分面组配式分类法n 依据分析兼综合的原则编制,由概念组合而成:n 地区 体裁 时代 题材E1中国 D1中国画 C1古代 B1人物E2朝鲜 D2油画 C2近代 B2山水E3韩国 D3水彩画 C3现代 B3花鸟则“中国现代花鸟水彩画作品集”的分类号:E1D3C3B3列举组配式分类法n 上述两种编制方式的组合,在详尽类表的基础上,广泛采取各种组配方式的分类法,亦称半分面分类法。n 著名的列举组配式分类法有欧洲各国使用的国际十进分类法(Universal Decimal Classification,简称UDC)分类法结构剖析n 类目体系 按照类目关系建立起来的类目集合,即类目表。n 主表 基本部类、基本大类、简表、详表、复分表n 标记符号 号码种类、编号制度第二节 中图法简介n 我国的分类法:建立在学科分类体系上,属于体系分类法。n 它是将全部文献按其性质分为几个主要大类,把相同的文献集中在一起,相近的文献连接在一起,并将它们按由一般到具体的逻辑顺序加以排列,从而组成一个系统。n 换句话说,先将文献归入某一大类,然后按第二级类目、第三级类目、第四级类目层层划分下去,直至划分到能准确反映文献内容的那一级类目为止。n 文献分类的依据:是“图书分类表”,根据文献各级类目之间的逻辑关系(如从属关系、并列关系、相关关系、交叉关系等)编排而成的一个逐级展开的排列表,并用标记符号(分类号)代表各级类目的前后次序,从而使文献的学科知识、内容特征和形式特征得到充分地揭示。n 分类法的主要特点:n 按学科、专业集中文献;n 按学科体系进行系统排列;n 以分类号标示文献主题概念;n 用等级结构、逻辑关系显示文献主题概念之间的关系。 n 分类法的优点在于知识的系统性。n 它用等级结构显示主题概念间的关系,按学科体系排列类目,直接体现了知识分类的要求,既能揭示出某一学科门类所包含的文献,同时又能显示出各个学科,门类之间的逻辑关系,反映一系列的相关文献,从而提供了从学科专业检索文献的途径,满足族性检索的需求,所以具有较强的系统性。中国图书馆分类法 (简称“中图法”)n 中国图书馆分类法是我国用户最多、应用最广泛的一部大型综合性分类法,简称中图法。n 中图法是1971年由北京图书馆倡议,全国36个单位组成的编写组集体编制的,于1975年正式出版,1980年、1990年、1997年先后修订三次。 1999年北京图书馆出版社出版了第四版。自第四版起更名为中国图书馆分类法,简称不变,英文缩写为CLC。n 中图法是我国当代具有代表性的图书分类法,被推荐为我国标准图书分类法广泛使用于图书馆和情报部门。n 中图法是为实现全国图书资料统一分类而编制的,是一部大型的综合性的图书分类法。n 目前,中图法已普遍应用于全国各类型的图书馆,国内主要大型书目、检索刊物、机读数据库以及中国国家标准书号等都采用了中图法。n 中图法将学科分为五大部类,22个大类,共有5万多条类目。台湾的分类法n 中国图书分类法,简称台湾中图法,第一版原由刘国钧主编,1929年由南京金陵大学图书馆出版。n 现台湾中图法由赖永祥修订、至今已经修订八版,由三民书局出版。台湾中图法的体系结构以杜威十进分类法为基础,参照台湾图书馆图书分类的实际情况,扩增有关中国图书的类目,总共分为10个大类,共有2万多条类目。主要用于台湾各大图书馆及信息单位。中图法的结构体系为: 5个基本部类(基本部类:如中图法分五大类部:马列毛邓;哲学;社会科学;自然科学;综合性图书。),22个基本大类 n 马克思主义列宁主义毛泽东思想邓小平理论是指导我们的理论基础,作为一个基本部类,列于首位。n 哲学是关于自然科学和社会科学的概括和总结,因此把它作为第二部类,排在社科、自科之前。n 此外考虑到图书本身的特点,对一些内容庞杂,类无专属,无法按某一学科内容性质分类的图书,作为一个基本部类置于最后。n 由于社会科学和自然科学内容多,发展快,如不再细分,不仅不能满足图书分类上的需要,而且也不便于读者查找图书资料,因此在“社科”部类下再分九大类,在“自科”之下再分十大类。中国图书馆分类法§ 基本部类§ 基本大类(一级类目)§ 二级类目、三级类目、四级类目、五级类目§ 中图法的标记符号§ 中图法通用复分表和专用复分表返回根据图书资料的特点,按照从总到分,从一般到具体的编制原则,确定分类体系,在五个基本部类的基础上,组成二十二个大类。中图法的标记符号采用汉语拼音字母与阿拉伯数字相结合的混合号码。即用一个字母表示一个大类,以字母的顺序反映大类的序列。字母后用数字表示大类以下类目的划分。数字的编号使用小数制。现将五个基本部类及下设的二十二个大类列表如下: A 马列主义、毛泽东思想、邓小平理论A 马克思主义、列宁主义、毛泽东思想 1 马克思、恩格斯著作 11 选集、文集 12 单行著作 121 马克思主义形成时期( -1847年) 122 革命风暴的高涨与低落时期(1848-1863年) 123 第一国际和巴黎公社时期(1864-1872年) 124 马克思主义广泛传播和各国建立社会主义政党时期(1873-1889年6月) 125 第二国际时期(1889年7月-1895年) 13 书信集、日记、函电、谈话 14 诗词 15 手迹 16 专题汇编 18 语录 2 列宁著作 21 选集、文集 22 单行著作 23 书信集、日记、函电、谈话 25 手迹 26 专题汇编 28 语录 3 斯大林著作 31 选集、文集 32 单行著作 33 书信

    注意事项

    本文(出版信息组织与利用.docx)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开