机构知识库系统软件现状及评价方法.doc
机构知识库系统软件现状及评价方法杨思洛韩淑娟1湘潭大学管理学院 湖南 湘潭411105 2浙江师范大学教育学院 浙江 金华321004摘要文章分析了国内外机构库系统软件的使用现状;对已有机构库软件比较研究,进行总结;分析具体机构库系统建设步骤,对评价、选择一个机构库软件的主要因素进行详细阐述。关键词机构库 系统软件 数字图书馆The Present Situation and Evaluation Method of Institutional Repository SoftwareYang Siluo1, Han Shujuan21The Management College of Xiangtan University,Xiangtan, Hu抧an 411105 2The Education College of the Zhejiang Normal University, Jinhua, Zhejiang 321004AbstractThe article analyses the present situation of institutional repository(IR); reviews the comparison research of IR software; analyzes the construction step of IR, carries on the detailed elaboration to the primary factor of evaluating, choosing IR software.KeywordsInstitutional repository; System soft;Digital library作为开放获取的一种主要形式,机构知识库对学术信息交流模式有着重要影响,目前国内外众多的机构正在进行研究与实践,许多国家和项目也提供资助,并且受到了作者、图书馆、用户等相关对象的积极参与和支持。机构库系统软件是机构库运行的基础系统平台,在机构库的应用与建设中占有重要地位,对机构库的其它方面有着重要影响。1机构库系统软件使用现状目前,机构库系统软件主要可以分为4类1:专用系统,这类系统是机构库研究项目的成果,如eScholarship、JISC IE、Knowledge Bank等;开放源码和免费的系统,如Dspace、Fedora、Archimede、CDSware等;商业系统,如Documentum、Bepress、UMI / ProQuest 研制的DigitalCommons、DiMeMa公司研制的CONTENTdm、Innovative公司的DRM、BioMed中心的Open Repository等;混合型的系统,如VTLS公司的Vital等。根据信息系统的一般选购经验,用户数量与情况是评价和选择系统软件的重要因素。2005年5月,CNI、ISC以及SURF基金会举办了名为“创建机构知识库的战略”的研讨会。在会议期间,组织者对欧美13国的机构库软件使用的数量与种类的不完全统计,发现不同国家之间软件使用的多样性,也存在着相当大的差异;只有少数软件在不同的国家得到了应用,其中最重要的是Eprint软件,13个国家中至少有7个使用该软件。除了DSpace、Eprints、DIVA、ARNO、iTOR等常用软件外,还有很多机构使用地方性的系统或内容管理系统来创建机构知识库。值得注意的是,在德国OPUS软件有着强大的基础,拥有44个站点;在澳大利亚“维吉尼亚技术包(Virginia Tech package)”支持了27个站点2。根据2007年1月发布的美国机构库普查报告3,美国现有超过20个机构库软件在使用,其中使用最多的为Dspace,其它Bepress、ContentDM等也有较多用户。现在全球机构库统计网站主要有开放获取库名录4(The Directory of Open Access Repositories,OpenDOAR,由英国诺丁汉大学建立)和开放获取知识库登记5(Registry of Open Access Repositories,ROAR,由英国南安普敦大学建立)都提供对机构库的国家、地区分布、类型分布、内容分布以及使用软件情况进行详细的组合统计分析,并可以各种图表方式予以展示。目前OpenDOAR 、ROAR分别统计了925和910个机构库,具体的系统软件种类见表1和表2。目前国内在OpenDOAR 、ROAR中分别登记有3个和8个机构库(见表3)。根据以上统计情况,目前机构库系统软件种类繁多,在各个国家的使用情况也很不一样,使用的软件为专用系统或情况不明的机构库众多;但也形成了一些常用软件(DSpace、EPrints、Bepress、OPUS等),它们在各统计中使用数量都较多,大都是开源免费软件(除Bepress外),这与传统图书馆集成系统很大不同。而在国内,除了少数使用不明的其它软件外,几乎是清一色的使用DSpace系统(据了解除以上机构库外,国内还有厦门大学学术典藏库和清华大学机构库都使用DSpace)。通过统计网站数据,无论是从数量,还是从内容、功能等方面,国内机构库系统建设与英美等发达国家差距很大,与台湾、韩国和印度等地区也有很大差距,国内机构库发展任重道远。2常用机构库系统软件比较为了便于选择现有的机构库解决方案,美国开放社会研究所(Open Society Institute,OSI)在其2004年8月发布的指南第三版中,列出了Archirnede、ARNO、CDSware、DSpace、Eprints、Fedora、i-Tor、MyCoRe、OPUS共9个机构库6。在介绍各软件总体情况基础上,将技术细节、仓储和系统管理、内容管理、用户接口和检索功能、存档、系统维护等6个方面再分为22个部分,然后列出103个比较点对这些系统进行了对比研究,并附上了详细的细节说明。结果表明,Archimede的设计特别适合多语言的操作;ARNO提供了集中管理元数据的功能;CDSware适合处理具有多类型资料的大型数据库;DSpace支持基于团体的内容政策和提交过程,提供支持对提交数据长期保存的工具;Eprint提供一个简单、实用的机构库系统,有数量众多且活跃的用户群体;Fedora具有数字图书馆系统的所有功能,能适应大规模的机构库;i-Tor提供工具包构建一个环境,在此环境中多种数据库内容能以集成的方式被获取或展示;MyCoRe强调具有灵活性,具有配置软件支持不同类型数字图书馆和机构库的能力;OPUS在德国具有数量众多、类型各异的使用者。William Nixon对代达罗斯项目(DAEDALUS,由JISC资助)中EPrints和DSpace软件使用经验进行介绍,决定在项目中同时使用两个系统7。具体对使用两个系统的原因,二软件的基本情况、系统安装和配置、递交的程序、系统管理等方面进行了介绍与比较。得出结论:机构库的建设不仅仅是系统的安装,更重要的是内容的收集。两软件总体上相同,无所谓谁好谁差,选择两软件或其中之一,还是其它软件取决于特定机构库因素(机构库目的与内容,是免费获取资源还是长期保存数据或者两个都有)。Richard Jones评价了用DSpace和ETD-db进行在线学位论文提交和存档服务8。具体从功能支持、安装、用户管理、递交程序、存档、浏览与检索、系统管理与安全等方面进行比较分析。得出结论:在大多数方面,DSpace要领先于ETD-db,DSpace对未来发展的支持性较好,它也有更多的如系统安全与管理这样的功能。另一方面两软件也有一些相似之处,如浏览与检索工具、递交功能。还有,由于未来发展的不确定性,很难肯定某些方面哪个软件更优(如长期保存)。ETD-db专门设计用于学位论文递交,而DSpace则支持功能较普遍。结果表明,对于一般机构库建设,在ETD-db增加新功能比在DSpace中扩充功能更有难度。Marion Prudlo论述了LOCKSS、EPrints和DSpace这三个常见的机构库管理工具,详细介绍了各自的用户、使用成本、基本支持技术、必需的知识、功能等内容9。得出结论:虽然电子存档还处于起步阶段,但已有许多软件工具可供选择。任何存档项目需要一定时间、详细规划和技术的专门知识,机构库应该根据自身的需求与资源选择软件。LOCKSS比其它两软件在管理上更容易,也更便宜,但其保存功能有限,近来正通过格式移植解决这一问题。如果机构不仅仅是想对期刊论文进行存档,则可选用EPrints和DSpace。它们适合对机构内产生的各种资料进行存取,要使用它们,也需要应用更多的专门技能。EPrints适用于存取特定主题的材料,而DSpace可以处理几乎任何种类资料,更适合大型机构库存档(机构由众多院系、实验室或其它部门组成)。2003年2月香港科大图书馆筹建机构库时对众多软件评估后,剩下Eprints与Dspace10。他们对软件系统评估所采用的标准与评估引进数据库的标准类似,包括软件的结构、操作界面、检索能力特点、软件所需的硬件要求、是否支持多语言(特别是中日韩语言CJK)、速度与可靠性、输出的选择等。通过评估,发现Eprints 提供高级检索与结果排序选择功能,Dspace具有支持多个检索字段的浏览功能,Dspace 是吸取Eprints的经验开发的。另外当时的Eprints不完全支持统一的字符编码标准UNICODE,也不是基于Java和servlet制作而成的。最后他们选择了Dspace,并进行本地化维护和服务工作。在国内,董丽等从数字资源管理角度对DSpace和Fedora进行了比较分析11。首先介绍了两软件的体系结构和主要功能特点,然后对二者的异同进行详细对比。得出结论:作为流行的两个开放源代码数字资源管理系统,DSpace和Fedora都提供了丰富的功能,可以满足许多馆藏数字资源的提交、保存、管理和发布中的一般需求。在部署本地应用系统时,应该根据实际需要,选择合适的系统作为基础平台。对于一般的简单应用,不需要扩展特殊功能的情况下,可以选择DSpace作为应用的基础,利用它的快速开发支持解决一些常见的资源保存和发布的问题。对于一些复杂的应用需求,比如对用户的授权控制方面有特殊的需求,对元数据的支持方面有特殊的需求,需要对功能上作较大的改进,这种情况下,可以考虑以Fedora为基础扩展实现。3机构库系统软件的评价方法建议由于机构库的兴起与发展时间较短,国内尚无成熟的选购与评价标准,这又是迫切需要的。一方面目前国内尚无专门的机构库软件,且机构库软件有自身的独特性;另一方面更重要的是各机构库要选用机构库软件。目前机构库建设中国外特别是发达国家的大学研究机构已得到普及(据统计在2005年,德国、荷兰、挪威等国家几乎所有研究大学都建有机构库),相信在未来一段时间内,国内也会掀起建设与应用的热潮。选购和建设一个具体机构库系统要考虑的问题和做的工作有很多,一般有以下几个步骤:成立选购小组,了解当前机构库软件进展。广泛地收集信息,这是前提也是基础。可通过专业期刊、网站、论坛或与软件发布者联系。进行可行性研究,熟悉本机构的现有条件和需求,形成需求文档。要通过对机构库的深入认识,确定该系统的目标,弄清规划决策所涉及的范围、所要采取的措施方案和政策、实现目标的准则、策略和各种约束条件等。请各厂商演示或提供详细资源,熟悉系统,还可与已用该系统的用户联系,听取其意见。评价各软件,并拿出最终方案。可通过作者、工作人员、专家提出意见为决策提供参考。有多种评价方法可单独或综合使用:通过专家,如头脑风暴法、特尔菲法;指标权重法,比较常见的有层次分析法、主成份分析法、聚类分析法、模糊综合评价法等。安装试用,包括主要步骤有:选定软件平台,装配安置必要的硬件,安装配置软件,建立系统的演示版,根据需要个性化界面,员工培训,建立正式的内容管理流程,装载内容,系统测试。评价、选择一个机构库软件的主要因素包括12:功能:产品的发行。是开源软件还是私有软件,或者可以远程主机托管(由软件商拥有和构建软件平台,对数据进行托管,分为三种情况:系统在机构库本地运行与管理、系统运行在本地通过软件商远距离管理、系统运行与管理由软件商远距离进行)。设计与定制。API(application programming interface),可根据需要定制和扩展软件平台功能;是否可对用户界面和资源进行个性化定制;如是开源软件,用的是什么编程语言。可接受的文档格式。包括文本(一般论文、图书、学位论文)、图像、数据资料、视频、音频、计算机软件、CAD/CAM、数据库、复合多媒体等。支持的搜索引擎或全文搜索功能;元数据的浏览、检索与分类功能;内容管理功能,如长期保存;用户的认证与管理(作者、编辑者、系统管理者等角色);在检索与用户界面等方面对多种语言的支持情况;大批数据的上传与下载能力;几个相关数字对象一起提交的功能;对存档文件的实时更新与索引;非Web格式的呈现能力。系统管理。用户管理情况;可调整的用户权限;支持用户认证(X.509或LDAP);注册,基于角色的分级管理和认证等;报告、日志功能;可扩展性;数据与系统备份和恢复功能,系统速度与可靠性等。技术:技术特征。永久标识CNRI、DOI等的支持;内容提交与批准工作流(灵活性、多种步骤、角色定位、集中还是分散式提交);版本升级情况。元数据标准。描述方面;技术方面;长期保存方面的支持;知识产权等。系统配置。服务器支持的操作系统,Windows 还是Unix/Linux;支持的数据库,MySQL、DB2、Oracle、Postgres还是SQL Server;软件所需的第三方软件工具;被推荐的相应硬件配置;客户端是否需Web浏览器外的软件。互操作技术。OAI的兼容性;Z39.50、SRW和METS的支持情况。服务:技术文档,完善文档的可获得性;在线帮助;系统文档;适用的系统设计文档;系统配置的文件样本。通过电话或在线论坛,还是直接Email或者Email列表;是否可从软件开发商得到付费的咨询服务帮助系统管理;是否可得到24/7的服务,系统整个过程的服务支持。公司背景也是一个不可忽略的因素,包括公司成立时间、声誉、用户情况、发展前景与资助情况等。费用:各种类型费用不同,虽然有免费的开源软件供选择,但还需要其它相关费用;软硬件平台的费用可以较精确地估计,而综合规划、安装、员工培训、维持系统日常运作则取决于机构库的设计。购买类型是免费还是商业的、一次性还是分期付款。各版本升级及日常技术支持,是否免费。总之,机构库软件平台的构建是一件非常重要而又复杂的系统工程。每个机构库软件的基本功能与内容大体相同,特别是对于常见的几个系统,无所谓谁好谁坏。但在细节方面,每个软件都源自开发者的设计哲学,反映了特定机构库建设的独特需要。评价与选择时需考虑系统软件的各自独特功能及每个机构库自身的需要(战略定位、规模、用户特点、技术能力、预算限制等),在系统功能、技术、服务和费用之间取得最佳平衡13。参考文献1陈韬.机构知识库对图书馆的作用.新华书目报.http:/2Gerard van Westrienen, Clifford A. Lynch. Academic Institutional Repositories Deployment Status in 13 Nations as of Mid 2005. http:/www.dlib.org/dlib/september05/westrienen/09westrienen.html3Karen Markey. Census of Institutional Repositories in the United States MIRACLE Project Research Findings. http:/www.clir.org/pubs/reports/pub140/contents.html4http:/www.opendoar.org/index.html5http:/roar.eprints.org/6A Guide to Institutional Repository Software v 3.0http:/www.soros.org/openaccess/pdf/OSIGuidetoIRSoftwarev3.pdf7William Nixon.DAEDALUS: Initial experiences with EPrints and DSpace at the University of Glasgow.http:/www.ariadne.ac.uk/issue37/nixon/8Richard Jones. DSpace and ETD-db Comparative Evaluation.http:/www.thesesalive.ac.uk/archive/ComparativeEvaluation.html9Marion Prudlo. E-Archiving:An Overview of Some Repository Management Software Tools.http:/www.ariadne.ac.uk/issue43/prudlo/10Chan, Diana L. H. Changing roles of reference librarians : the case of HKUST Institutional Repository. http:/11董丽.开放源代码的数字资源管理系统DSpace和Fedora的分析和比较.现代图书情报技术,2005(7)P.1-612Barton M R. Creating an institutional repository:LEADIRS workbook. http:/www.dspace.org/implement/leadirs.pdf13李广建等.IR:现状、体系结构与发展趋势.情报学报,2006 Vol.25 No.2 P.236-241(来稿时间:2007-09-14 责编:冉文格)作者简介 杨思洛,男,讲师,硕士,研究方向为网络信息资源管理。