探究改进大专院校图书馆书目数据库质量之我见毕业论文.doc
探究改进大专院校图书馆书目数据库质量之我见目 录1 大专院校图书馆书目数据库存在的问题31.1 不完备著录41.1.1 编码信息块41.1.2 著录信息块41.1.3 附注块41.1.4 知识责任块41.2 错误著录41.2.1 著录格式方面的错误4 1.2.2 著录内容的错误42 大专院校图书馆书目数据库质量问题的影响因素2.1 内部影响因素42.1.1 人员因素42.1.2 标准因素42.1.3 系统因素42.1.4 管理因素42.2 外部影响因素42.2.1 著录规则变化因素42.2.2 套录数据质量因素43 改进大专院校图书馆书目数据库质量的措施43.1 调整人员结构,提高人员素质43.1.1 调整编目人员结构4 3.1.2 提高编目人员素质43.2 及时完善编目规则43.3 严格控制套录数据质量43.4 加强编目工作的过程控制43.5 优化系统功能43.5.1 修正系统错误43.5.2 更新系统功能。44 总结20参考文献20致谢21 摘要文献资源共享是图书情报界多年来的追求,而书目数据库质量的高低影响着文献资源共享的可实现性和有效性。本文就大专院校图书馆书目数据库存在的质量问题进行了探讨,并分析了影响大专院校图书馆书目数据库质量的内外因素,最后提出了改进大专院校图书馆书目数据库质量的几点措施。1 大专院校图书馆书目数据库存在的问题尽管整个图书馆界已基本上实现了自动化、 网络 化管理,书目数据库建设也取得了不小的成就,但仍存在着不尽人意的地方。就大专院校图书馆来说,其书目数据库的质量普遍不太高,存在大量的不完备著录和错误著录等问题(1.1 不完备著录不完备著录主要体现在对某些必备字段、有则必备字段或其子字段不予著录。具体情况如下:1.1.1 编码信息块(Coded information block)中,100、102字段及101字段中的$b、$c子字段常被编目人员所忽视。实际上100、101对所有的在编文献来说,均为必备字段,而101的$b、$c子字段则为“有则必备”,102字段也是体现文献重要著录内容的字段,不能随便省略。1.1.2 著录信息块(Descriptive information block)中,缺少著录比较频繁的有:200字段中的$f、$z等子字段,205字段中的$a和$b子字段,225字段中的$f子字段等。200字段中,漏著最频繁的是$f子字段中有关外国责任者的国别或中国古代著者的朝代;205字段中,多数记录中只著录文献的版次,对于修订本、增订本、重印本以及手抄本、刻本、影印本等附加版本说明则未予著录;而225字段中$f著录内容在各馆书目数据库中很难找到。1.1.3 附注块(Note Block)中,由于大专院校图书馆一般对此块中的有关字段未作具体的硬性规定,编目人员几乎很少进行相关著录。而实际上,诸如300一般附注、305版本与书目沿革附注、330提要或文摘附注等字段非常重要,都不同程度地对文献的有关信息进行揭示,最好予以著录(管理学/公共管理/图书馆管理论文 1.1.4 知识责任块(Intellectual Responsibility Block)中,701字段中的子字段通常只著$a、$4,而无$c(国别、朝代)、$f(年代)等相关内容的著录,702字段也是如此。此外701、702均可重复,但编目人员经常没有进行重复著录,这使得第三责任者之后的其他责任者未能得到体现。1.2 错误著录1.2.1 著录格式方面的错误(1)数字、字母、符号等字符的输入状态错误。如205字段中的版次应著录为“2版”“3版”“4版”等形式,却被著录为“二版”、“三版”、“四版”。在数据录入时,对于书名号、双引号、分号等符号,则不太注意区分半角与全角。(2)数据的著录形式不一致。如010中的子字段$d,有的数据中著录到元,有的则著到角如CNY12.5,还有的著到分如CNY39.00等;210中的子字段$d,有的数据中著录到年如$d1987,有的则著录到月如$d1999.4。(3)语言的繁简著录不一。对于含有繁体或异体字的文献,有的馆采用简化字著录,有的馆采用繁体字著录,还有的馆在实际操作中繁简兼用,致使同书异名,不便于用户的检索与利用。1.2.2 著录内容的错误(1)责任方式著录错误。如“编著”著录为“著”、“主编”著录为“编”、“主译”著录为“译”,更有甚者,把第一责任者与其他责任者相混,这种错误常出现在中译本中,具体表现为将译者著录于200字段的$f子字段,而原著作者却不予著录。(2)205版本项著录错误。主要出现在中译本的版本著录上。比如有许多中译本图书是根据原版图书的第二版翻译过来的,但却是中译本的第一版,这种情况下,205字段不能著录为2版。(3)606主题和690分类标引错误。主题标引错误主要包括主题词错误、不规范、子字段的指示符使用错误等,而分类标引错误主要体现为分类不到位、仿分复分错误等。2 大专院校图书馆书目数据库质量问题的影响因素2.1 内部影响因素影响大专院校图书馆书目库数据质量的内部因素主要包括馆内的人员因素、标准因素、系统因素和管理因素。2.1.1 人员因素人员因素,是影响书目数据质量的最主要因素。笔者所说的人员因素主要包括人才结构和人员素质两个方面。人才结构主要是指构成人才整体的各要素之间的组合联系方式。包括要素的数量、配置以及在整体中的地位等。人才结构的合理与否,将影响人才整体功能的发挥。人才结构是否合理,主要取决于“量”和“质”两个方面。人才结构的“量”主要指人才的数量,“质”主要指人才的配置。要使人才整体功能达到最大值,既要保证人才的充足,又要达到人才的合理配置,二者相辅相成,互相制约,缺一不可。对于图书馆来说,要想保证书目数据库的高质量,首先必须保证一定数量的编目人员,不能因为人数的不足而降低书目数据制作的质量;另外,还应该做到编目人员的合理配置,各馆应根据各自的购书情况、学科特点等,将不同层次不同专业的人员有效配置,发挥人才的最大效能。人员素质包括思想素质和业务素质,作为书目数据的生产者,编目人员素质的高低直接决定着书目数据库的质量高低。编目人员能否自觉地提高建库质量,与其思想素质密切相关。举个简单的例子,在进行主题标引时,如果编目人员思想上不重视,就很容易仅从标题入手进行浅标引,影响主题标引的深度。而编目人员的业务素质是影响书目数据质量的关键因素,编目人员对文献著录标准与原则的把握程度、对机读目录格式的熟悉程度、对分类法和主题词表的掌握程度、对标引方法和规则的熟练运用程度、以及相关学科知识的具备程度等都将直接影响到在编书目数据的质量高低。2.1.2 标准因素标准因素主要指书目数据著录的标准化、规范化问题。目前我国高校主要以中国文献编目规则或CALIS联机合作编目手册为著录规则,以中国机读目录通讯格式(CNMARC)为数据著录格式进行书目数据的著录。但由于各馆对著录标准、规则的理解有所不同,致使各馆的文献著录细则有不少出入甚至存在一些错误规定,直接影响书目数据著录的规范化和一致性。例如我馆的中文图书著录规则中,对200字段是这样规定的:“$a正题名原则上按照规定信息源所载题名著录图书的上下册、卷数、戏曲的幕数都是书名的一部分,与正题名之间用“.#”连接,有分卷(册)次的分卷(册)书名前用“,#”连接。如:20010$a世界史#第一卷,#亚洲$f”很显眼,这一规定混淆了文献著录规则与著录格式的区别,在一定程度上误导了编目人员,造成同书异号、一书多条记录现象的普遍存在,从而影响了书目数据的标准与规范、交换与共享。2.1.3 系统因素大专院校图书馆多使用中小型的图书馆自动化管理系统(金盘、妙思、金蝶、金思维、索菲特等),这些系统比较简单易用,费用也比较低,但其系统自身却存在不少问题,成为影响书目数据库质量的因素之一。如我馆使用的“图腾”系统就存在不少问题:在采访、编目子系统中,无法串查各个数据库的数据,容易产生漏查、重购、重编现象,影响采编工作的效率与书目数据的质量;系统的自动生成,种次号功能程序不太稳定,常常存在跳号重号现象,容易导致索书号重复问题的出现;系统为了简化书目数据的著录过程,提高工作效率,对CNMARC中指示符的规定不予采纳,致使书目数据交换格式不一致,不利于书目数据资源的共享等。2.1.4 管理因素影响书目数据库质量的因素除了人员因素、标准因素、系统因素,还包括管理因素,即对编目流程的控制管理。一般来说,一个完整的书目数据生产流程包括数据查重、制作工作单、核对、计算录入机、校对、数据形成并交送中央数据库,但在实际的工作中各馆的编目流程多有不同。以我馆为例,对到馆图书校对、基本加工(夹磁条、贴财产号、盖馆藏章、抽取样本)之后,才真正进入书目数据加工生产阶段,主要包括五个环节:书目查重文献标引数据著录数据审核送交中央数据库。这五个环节环环相扣,只要忽略某一环节的控制管理,就会产生一系列的问题,从而影响书目数据的质量。2.2 外部影响因素2.2.1 著录规则变化因素数据库中的文献著录是根据一定的编目规则及格式(统称规则)进行的,规则由于修订或改版所引起的内容变化,势必会引起数据库中数据标准化和规范化的相应变化。而规则的修订和变化是客观存在的现实情况,从这个角度来看,数据库质量存在一定的问题也是在所难免的。以我国实行标准化著录以来常见的欧美国家的个人责任者著录为例,就经历了由著录中文姓氏,或依据相关工具书将姓氏原文翻译为中文,修改为按文献实际情况客观著录的变化过程。规则中的类似变化还有很多。因此,规则的变化是影响数据库质量的重要因素之一。 2.2.2 套录数据质量因素套录数据质量不高也是影响书目数据质量的一个重要因素。由于人力、财力方面的不足,大多数专科院校还没有真正实行联机编目。为了减轻编目工作量、提高工作效率,专科院校多使用书商提供的免费套录数据,但我们在套录的过程中发现书商提供的书目数据存在着分类不准确、标引不规范等问题。若本馆的编目人员不对套录数据进行细致审核与修改,照搬照录,必然会降低书目数据的质量。3 改进大专院校图书馆书目数据库质量的措施3.1 调整人员结构,提高人员素质3.1.1 调整编目人员结构由于种种原因大专院校图书馆的人员来源相对比较复杂,具有图书情报、信息管理或背景的人员比较少,更不用说是复合型人才。相当一部分的编目人员没有系统学习过现代文献编目理论,对文献著录、标引及机读目录并不熟悉,还有一部分人员在 计算机 编目中,仍停留于传统编目,采用表格著录形式。因此当务之急,应该及时调整人员结构,适时引进文献编目专业人才,补充到编目工作中来。3.1.2 提高编目人员素质图书馆首先要对编目人员进行职业 道德 教 育 ,培养编目人员严谨细致的工作作风和良好的质量意识。其次,要提高编目人员的业务素质。对拟上岗的编目人员进行上岗培训,使上岗人员在尽可能短的时间内基本达到编目岗位上质和量的要求;对在岗的编目人员,选派参加各种与编目有关的培训活动,参加国内外学术交流活动,及时了解国内外编目工作的动态,不断更新知识。另外,还应定期或不定期地开展业务讨论,加强编目人员之间的交流,促进编目人员整体业务水平的提高。3.2 及时完善编目规则为了保证书目数据质量,保证书目数据的统一性与规范性,各馆应不断完善本馆的编目规则。尽管大专院校图书馆都有各自的文献编目规则,但这些规则大多是对国家标准的简单摘录,未能就标准、规范条款所未能涵盖的编目问题做出具体规定,这使得编目人员在实际工作中也往往无据可依,很难就某些具体方面进行准确著录。因此,各馆应改变现状,根据国家标准著录规则,制定相应的编目细则,具体规定标准、规范所未涵盖方面的处理办法,供编目人员使用,减少因无据可依而造成的错误著录问题。另外各馆要随着现行标准、规范的变动及时更新本馆编目标准及细则,做到始终与现行标准、规范的一致性。3.3 严格控制套录数据质量大专院校图书馆套录数据的来源主要是书商,为了确保套录数据的质量,图书馆应对书商数据的来源提出合理的建议,要求书目数据最好来自大型书目数据中心。并要求书商在自己编目时严格按照各馆的编目规则和具体要求进行,尽可能不依赖CIP数据。另外对于套录数据中频繁出现的错误要求书商及时修正,只有这样,才能保证外来数据的质量。3.4 加强编目工作的过程控制编目工作一环扣一环,只要某一个环节出了差错,就会前功尽弃。因此,我们必须严把质量关,加强编目工作的过程控制。首先要严把“书目查重关”,查重是编目工作中的第一步,是保证馆藏图书分类一致的主要办法,编目人员应通过书名、著者和ISBN号等步骤来确保同书同号,避免同书异号等现象的发生;其次要严把“文献标引关”,文献标引包括分类标引与主题标引,编目人员应运用分类法、主题词表等标引工具,依据文献的主要内容,参考网上权威书目中心数据进行文献的标引;第三要严把“数据著录关”,编目人员应严格按照文献著录规则、CNMARC著录格式进行数据的著录输入工作;第四要严把“数据审校关”,制定严格的审核制度和适量的质量指标,设立专门的审校岗,对各编目人员制作的书目数据进行质量校验,不符合要求的要及时进行修改。3.5 优化系统功能3.5.1 修正系统错误系统的不足是编目人员所无法克服的,但由于系统的不足而产生的错误数据是可以修正也必须修正的。为了避免和减少系统带来的错误,首先应对编目人员进行有关系统使用的技术培训,力争使每一位编目人员能够对系统的运行环境、功能特点、不足之处了如指掌;其次,编目人员要时刻留心编目系统容易产生错误的地方,一旦发现错误,及时运用技巧予以修正,对于情况比较复杂的可进行商讨,最好将解决办法以文字的方式呈现,便于以后参考之用。3.5.2 更新系统功能。尽管编目人员可以人为地减少系统的一些错误,但系统功能的不足确是我们无法克服的。这就要求图书馆及时就使用过程中发现的系统问题与不足,以及对系统的新要求与系统开发方进行沟通,尽可能要求开发方对系统做出相应的优化和升级。如果所用的系统已没有太大的升级空间,图书馆可以考虑更换新的自动化系统,来降低原有系统本身不足带来的书目数据质量问题。