我国高校数字资源长期保存的挑战与策略.ppt
我国高校数字资源长期保存的挑战与策略,朱强2008年11月,提纲,引言高校数字资源建设现状高校数字资源保存现状高校数字资源长期保存的策略结语,引 言,我们面临一个全新的数字环境,无所不在的网络和无所不在的计算信息化成为国家建设五大战略任务之一电子商务、电子政务、数字出版、无纸办公数字地球、数字城市、数字社区、数字校园、数字图书馆家电数字化和数字产品家电化(数字家庭),5,信息技术促使学术交流体系发生变化,出版从“分子书”走向“电子书”,使得电子出版、网络出版变得越来越普遍刚刚落幕的法兰克福书展上,超过30%的展品是数字化产品统计显示,我国现有电子图书50万种,互联网期刊9000种,数字报纸600多份。预计未来5年,将有30%的手机用户通过手机阅读电子书和数字报,由图书馆等机构用户采购的电子书、数字报的销售规模将达到10亿元,由网民和手机用户带动的电子书、数字报内容销售及广告收入将达到50亿元。,北京大学图书馆,学术交流的渠道增多、范围更广,开放获取运动和机构存储成为网络环境下学术界传播及出版学术信息的一种新的方式据西安交大图书馆的统计,国外开放获取期刊已超过12000种,北京大学图书馆,6,学习和研究的方式在变化,许多人习惯于用搜索引擎查找资料,对电子书刊的阅读日益增加中国出版科学研究所有关报告表明:我国国民传统介质阅读率持续6年下降的同时,网络阅读率6年来则上升了6.5倍。今年发布的第五次全国国民阅读调查报告也显示,互联网阅读已达44.9%,比2005年提高了17.1%,已经接近了48.8%的图书阅读率。-解放日报2008年11月8日,7,北京大学图书馆,关于未来信息资源获取的预测,美国同行认为,到2025年,纸本书刊将会从图书馆消失数字资源越来越多,甚至占据主体地位,应该是趋势,9,已有数字资源类型一览,文献(技术报告、会议论文、预印论文)图书学位论文数据集计算机程序视觉、模拟模块多媒体出版物,电子刊物书目、目次、摘要图像视听资料格式化数字收藏电子教学资料网页管理资料,图书馆借助于信息技术走向数字化大量的纸质文献和其他文献被数字化,形成图书馆的特色资源超过三分之一的经费被用于购买数字资源或购买数字资源访问权互联网上的学术信息被加以组织,形成导航库;许多网站的信息被有计划地下载,与上述资源共同构成图书馆的数字资源,图书馆实体资源和虚拟资源的结合必然要求加强对数字资源的管理和保存数字资源的虚拟性数字资源的多样性数字资源的脆弱性数字资源建设和使用的复杂性,高校数字资源建设现状,高校图书馆的数字资源包括商业化的数字资源(多数为租用,少数为拥有)多馆共建的数字资源单馆自建的数字资源,以北大图书馆为例,各种数字资源学科门类基本齐全,引进的SCI、中国期刊网、Jstor、新东方网络课程等国内外数据库已达近500个网上全文电子期刊达45,000多种,各类电子图书和学位论文等近50万册数字扫描加工的古文献、民国图书、学位论文、教学参考书和民国旧报刊等印刷型资源超过12TB拥有近16TB的本地数字资源,并且每年以7-8TB的速度增长,CALIS数字资源类型,16,CALIS 数字资源数量,17,CALIS集团引进数据库,目前,CALIS集团共购买数据库283个,其中文摘索引数据库126个,电子期刊数据库80个,电子图书数据库21个,事实型数据库52个,其它数据库4个。,其中,全文电子期刊30,636种(去重后约24,000种)会议录8,557种电子图书(包括学位论文)145,052种平均回溯年限大约15年,CALIS 自建特色数字资源(65),中国科技史数字图书馆资料库猪养殖特色数据库铁路交通运输特色数据库湖南人物数据库长江资源库中国年谱数据库跨国公司研究专题数据库上海百个著名作家学术研究资料数据库机器人信息系统河南地方文献数据库华侨华人文献信息专题数据库电子科学与技术重点学科特色库东北亚研究数据库潮汕文献数据库汽车工程信息数据库钱伟长特色网站数据库,高校古文献资源库高校音乐教育资源数据库朱子研究特色农产品加工专题数据库东南亚及闽台研究数据库无人驾驶飞机专题文献数据库红色江西特色数据库红楼梦特色数据库大珠三角地区研究文献数据库经济学学科知识门户粮油食品专题特色数据库食品科学与工程专题数据库书院文化数据库猪养殖特色数据库饲料添加剂专题特色库民国时期文献资源库,20,CALIS 自建特色数字资源(续),巴蜀文化特色数据库中国年谱数据库民用航空专题数据库摩托车信息特色资源数据库中国水力发电工程猪养殖特色数据库江南制造局专题特色库数据库CAD/CAM专题文献数据库心血管疾病信息资源数据库中国年谱数据库民族相关文献特色库小麦文献信息数据库北大讲座视频点播资源库河南地方文献数据库陆相油气勘探开发专题数据库汽车资源数据库邮电通信专题文献数据库,潮汕文献数据库西夏文化数据库系统行为科学专题数据库复合材料专题特色数据库高校音乐教育资源数据库中国民族音乐数据库系统河洛文化文献专题数据库中国农村问题研究文献数据库无人驾驶飞机专题文献数据库北大名师多媒体特藏数据库中国邮政数据库建筑艺术与技术资料库经济学学科知识门户中国建筑文化特色数据库兽药文献信息数据库中国航运信息资源库,21,单馆自建数字资源,以北大图书馆为例祕籍琳琅北京大学图书馆古文献资源库北京历史地理数据库北京大学学位论文数据库北大名师数据库视频点播多媒体数据库热点话题数据库新书导读数据库网上咨询台常见问题数据库一小时讲座课件数据库自建数据库数据量已超过12TB,品种和数量将继续增加,高校数字资源保存现状,目前的模式,引进数字资源的存档镜像模式裸数据模式自建数字资源的存档备份模式镜像模式,24,25,问题与挑战,总体上缺乏完整的数字资源长期保存政策和战略规划引进资源方面,缺乏强制性的有效的措施和手段自建资源方面,缺乏政策指导、规划协调和监督检查技术上,缺乏系统的研究和完善的方案最根本的,缺乏资金投入,高校数字资源长期保存的策略,关于数字资源长期保存,美国研究图书馆组织(RLG)对“可信赖的数字仓储”(trustedreliable digital repository)作了如下定义:“一个可信赖的数字仓储,是以提供对受控数字资源长期存取为使命的仓储;其职责是为了存储者以及当前和将来用户的利益对数字资源进行长期维护;按照普遍接受的惯例和标准设计系统以保证实时管理、存取和存储其中的资料的安全;建立系统评估方法以满足用户对于文档真实性的需求;可以被可靠地用来公开和明确地履行对存储者和用户的长期职责;其政策、运行和表现可以被稽核和测量。”,数字资源保存的目标数字资源在存储媒体上的可读性 数字字符串可以被人或电脑阅读和处理格式化内容可以被它的使用者理解数字资源与它所代表的原体相同(或记载不同之处),Rosenthal等人提出了系统的保存策略:,复制(replication),提供对数字资源的备份;迁移(migration),将数字资源迁移到新的系统或平台;透明(transparency),公开数字资源的编码,以利于解读和迁移;多样(diversity),多种格式并存,以便某些格式过时时,其他格式仍可替代;稽核(audit),不断对数字资源的状态进行检查,确保其完好;经济(economy),确定保存项目的轻重缓急,首先确保最重要的部分;怠速(sloth),有意降低系统运行速度,以便在数据崩溃时增加修复的可能性,保护数字资源的几种做法载体更新(Refreshing)Tape-harddisc-CD-DVD,copy without change原始形态保存(Static Preservation)Preserve the bits旧新迁移(Migration)Periodic transfer of materials from one hardware/software configuration to another模仿环境(Emulation)Provide software tools to emulate or mimic essential viewing applications and operating environments,不同类型数字资源的保存策略,重要商业资源的存档:商业资源的服务一般是有保障的,对这类资源CALIS将和其他共享组织联合起来分工协作保存,并做战略性存档,防止突发的事件和突然的灾害 高校自建资源的存档:这类资源是有组织建设的,目的性强,应在组织大家建设的同时,集中存档。但是这类资源的后续服务中的问题,如版权等,是需要加以考虑和解决的网上免费资源的存档:选择对重点学科建设有用的资源,整体规划,分工协作教学科研过程中产生的资源:加强各校的论文、报告、课件等资源的收集、整理和加工,33,原则性考虑,联合其他系统,共同建立安全存储数据的网络,对缺少和没有后继服务的有价值资源进行存档,防止和减少资源的丢失集中和分布结合,同类资源能集中到一起的,集中保存,并进行异地备份;不适合集中到一起的,分散保存。能提供集中服务的,集中服务;否则,分散服务鼓励地方增加存档经费,减轻中央投资的压力为全国和地区中心配备存档设备,由CALIS核心馆承担存储任务引进的商业资源保留1个备份,自建资源保留2个或2个以上备份,34,数字资源建设应当采取以下策略:在项目之初就重视有关保存政策的制订;采用国际标准与通行做法,如OAIS(Open Archival Information System);尽量采用无产权(non-proprietary)系统,以减少来自软件所有者的限制;建立永久性文档管理措施;合作建立可靠的数字仓储。,建立统一的长期保存技术平台建立Open Access平台建立统一规划下的机构仓储平台为其他开放资源提供存取平台建立数据储存与灾备系统建立数字资源保存中心,36,关于数字资源保存的国家战略(建议),立法保障商业化数字资源的长期可获得性使用权存档权重视原生数字资源的采集和保存必要性战略与规划分工与合作机构仓储主题仓储,统一规划建立国家级数字资源中心体制问题:谁来牵头或协调资源是集中还是分布政策问题国家统一投入还是部门分担无偿使用还是有偿使用,方案设计考虑因素:成本和效率便利性安全性,结 语,数字时代,必须十分重视信息的长期保存保存是选择性的,需要对信息加以过滤图书馆作为保存人类精神产品的社会机构,尤其要重视数字资源的长期保存我国数字资源的长期保存目前还缺乏系统性的研究和完整、可靠的解决方案各方面应该重视和研究数字资源的长期保存,高校将积极参与、主动配合,谢 谢!,