数字图书馆原理及应用技术篇.ppt
技术篇(一),面向21世纪课程教材数字图书馆原理及应用,内容,第三章:数字图书馆的体系结构(p43-74)第四章:数字图书馆的支撑技术(p75-113),重点,掌握:Web概念、特点、体系结构:p75-77软件计算模式:p87-88数据仓库、数据挖掘技术与数字图书馆关系:p98数字图书馆系统集成:p101-103熟悉:安全需求、常用方法、PKI技术;p104-106,p111,重点,了解:体系结构;p43-52Web开发技术;p81-86中间件、数据仓库、数据挖掘概念及其关系;p87,p94系统集成概念;p100系统安全理论;p103,第三章数字图书馆的体系结构,数字图书馆的体系结构,DL的信息体系结构(p.44-51)DL的技术体系结构(p.52-58)DL的体系结构比较研究(p.58-68)DL系统的结构模型(p.68-74),数字图书馆的信息体系结构,基本概念(K-W结构)数字对象(Digital Object)键元数据、数字资料、调度码,数字图书馆的信息体系结构,基本概念(K-W结构)数字对象仓库(Repositories)元对象(Meta Object),K-W结构的完整描述,数字图书馆的信息体系结构,数字信息特征相关性数字格式数字对象的变化权限与许可权数字图书馆的信息体系结构图P.47 图3-1,p.47 图3-1,DigitalObjects,数字图书馆的技术体系结构,网络基础设施基础应用平台数字资源采集加工平台异构资源整合系统数字资源的管理与存储系统资源调度系统资源发布与用户检索系统联合编目和馆际互借系统版权保护与安全认证系统电子商务系统,基础应用平台,数字对象仓库,数字对象仓库,数字对象仓库,元数据,网络基础设施,数字资源的管理与存储系统,资源采集加工系统,异构资源整合系统,版权保护与安全认证系统,联合编目与馆际互借系统,客户端,资源发布与用户检索系统,电子商务,资源调度系统,数字图书馆的结构,传统图书馆自动化的视角,书目索引等二次文献,图书馆自动化系统,人工获取,索引与对象间无完整性保证,数字图书馆的结构,IBM的三角结构,检索数据(Search Data),LibraryServer,查询(SEARCH),访问入口客户端(ACCESSClient),存储(STORE),对象内容(Content Objects),光盘库或磁带库,分布式的数字图书馆结构实例,InfoBus p.63 图3-4中国试验型数字式图书馆项目 p.64 图3-5其他有关项目:NCSTRL p.61NSDL p.62UMDL p.65Interspace p.66CSTR p.66,数字图书馆的结构,一个混合型的实例(国家馆),数字图书馆体系结构的评价标准,开放性互操作性扩展性可伸缩性P.67,数字图书馆结构模型的几个要素,用户界面检索系统调度系统图书馆服务器对象系统加工系统P.68,数字图书馆结构模型的几个要素,对象库,资源加工系统,图书馆服务器,用户界面,客户服务器,检索系统,资源调度系统,第四章数字图书馆的支撑技术,Web概念、特点、体系结构,什么是Web?World Wide Web,WWW,万维网Web是建立在客户机/服务器结构之上,以HTML语言和HTTP协议为基础,能够提供面向各种Internet服务的、一致用户界面的信息系统p.75,Web概念、特点、体系结构,Web起源1991年,WWW创始人,欧洲核物理实验室(CERN)的贝纳斯-李(Tim Berners-Lee)完成了世界上第一个Web的开发1993年2月,美国国家超级计算应用中心(NCSA)推出了Mosaic软件,解决了文字显示、连接和图像显示问题,使WWW技术得到了空前的发展和应用,Web概念、特点、体系结构,Web服务的特点:超文本、多媒体与平台无关性直观、易于使用的用户界面Web是分布式的Web是动态的、交互的p.76,Web概念、特点、体系结构,Web的体系结构客户机/服务器结构统一资源定位符URLHTTP协议Web与数据库技术CGI ASP PHP JSPODBC JDBC ADOp.79,统一资源定位器(URL),统一资源定位器(Uniform Resource Locator)是全球万维网系统服务器资源的标准寻址定位编码,用于确定资源相应的位置及所需要检索的文档(件)URL的结构所使用的因特网文档传送协议(如:http、ftp、telnet、file等)标识要检索的主机代号(域名或IP地址)检索文档在主机中的路径及文件名,统一资源定位器(URL),常见的URL网页,网页,FTP,发送电子邮件,本地文件,file:/c:/lyyu/thesis.doc远程登录,,域名与DNS,IP地址 域名:,Web开发技术,客户端技术脚本 script JavaScript、VBScript组件 JavaBeans、ActiveXDHTMLJava Applet服务器端技术CGI服务器端脚本 ASP、PHP、JSPServlet技术,软件计算模式,软件计算模式的变迁软件计算模式B/S结构 p.87两层客户/服务器结构 p.87多层客户/服务器结构 p.88几个要点表示层、业务逻辑层与数据层开放与标准通用客户端与专用客户端客户端管理与维护,应用分层体系架构,展现层,数据(资源)层,应用逻辑层,两层客户机/服务器架构,中间件,基本概念IDC:中间件是一种独立的系统软件或服务程序,分布式应用软件借助这种软件在不同的技术之间共享资源,中间件位于客户机服务器的操作系统之上,管理计算资源和网络通信。分类及比较分类 p.89-91比较 p.91-92特殊的中间件(应用服务器)功能与特点 p.92-93,三层客户机/服务器架构,多层客户机/服务器架构,多层客户机/服务器架构,数据仓库,概念(Inmon)支持管理决策过程的、面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合。特征主题与面向主题数据的集成性数据是随时间不断变化的数据的相对稳定性关键技术数据抽取存储和管理数据表现,数据仓库,数据方块,Overall sales of TVs in the USin 3rd quarter,数据仓库,数据挖掘,数据挖掘的概念从数据中抽取有价值的信息,其目的是帮助决策者寻找数据间潜在的关联,发现被忽略的要素,而这些信息对于预测趋势及决策行为是十分有用的数据挖掘的模式分类模式回归模式时间序列模式聚类模式关联模式序列模式,数据仓库与数据挖掘之间的关系,p.98数据仓库是数据挖掘的基础数据挖掘促进并指导数据仓库的建设,数据仓库、数据挖掘技术与数字图书馆,数据仓库、数据挖掘技术对数字图书馆提供以下方面的支持:数据收集存储和组织数据分析和知识挖掘决策支持,系统集成,概念根据应用的需求,将硬件平台、网络设备、系统软件、工具软件及相应的应用软件等集成为具有优良性能价格比的计算机系统的全过程。特点接口是系统集成的技术关键系统协调与优化是系统集成的技术难关,数字图书馆系统集成的内容,数据集成业务过程集成服务集成p.101-102(批判吸收),数字图书馆应用集成的方式,点对点集成结构集成流程集成外部集成p.102-103,数字图书馆系统安全,概念数字图书馆系统安全主要包括硬件安全、软件安全、运行安全、计算机系统安全立法等相关概念密码安全计算机安全网络安全信息安全p.103,数字图书馆系统的安全需求,信息的保密性信息的完整性信息的不可否认性管理员与读者身份的认证性系统的可靠性可访问性防御性合法性p.104-105,数字图书馆系统安全常用的方法,防火墙技术密钥系统消息摘要数字签名数字时间戳数字证书p.106-111,PKI(Public Key Infrastructure)公钥基础设施,概念PKI为管理用户的数字证书、公钥以及安全政策的一系列安全服务的集合。组成证书机构证书库证书撤销密钥备份与恢复自动密钥更新,密钥文档管理 交叉认证 数字时间戳 客户端软件 p.112-113,PKI(Public Key Infrastructure)公钥基础设施,基于公钥体制(非对称密钥算法),PKI(Public Key Infrastructure)公钥基础设施,加解密过程,PKI(Public Key Infrastructure)公钥基础设施,数字摘要或签名,Q&A,本演示文稿地址:,