第讲数据库技术及其发展简介ppt课件.ppt
《第讲数据库技术及其发展简介ppt课件.ppt》由会员分享,可在线阅读,更多相关《第讲数据库技术及其发展简介ppt课件.ppt(77页珍藏版)》请在三一办公上搜索。
1、一.本课程主要内容(包括关系数据库和新型数据库)第一章 关系和关系模型 数据模型, 关系和关系模式, 键, 关系的更新.第二章 关系运算 布尔运算,选择 ,投影, 连接, 除,常关系 ,属性命名,关系代数.第三章 数据依赖 函数依赖、多值依赖和连接依赖,数据依赖的公理系统,依赖集的等价和覆盖及算法。 第四章 关系数据库范式 范式的概念,1NF5NF,模式分解及其算法,生成范式的不同算法。第五章 数据库系统设计 数据库系统设计与数据库设计,数据库系统设计的任务与内容,数据库系统设计方法与步骤。第六章 数据库管理系统 数据库管理系统的系统结构、主要功能、实现技术、语言处理,当前流行的主流数据库管理
2、系统简介。 关系数据库补充内容:连接面向对象编程和关系数据库的桥梁- Hibernate 应用程序的分层体系结构和Hibernate的作用、软件的模型、 在Java应用中使用Hibernate的步骤:创建Hibernate的配置文件、创建持久化类、创建数据库Schema、创建对象-关系映射文件、通过Hibernate API操纵数据库。,新型数据库部分,第七章 分布式数据库系统 分布式数据库系统的特点,分布式数据库系统的体系结构,分布式查询处理,分布式事务管理,分布式目录,数据库的安全保护,数据库的完整性保护。第八章 面向对象数据库 新应用的需求与传统数据库的局限性,面向对象数据模型,面向对象
3、数据库系统的查询、并发控制,面向对象数据库管理系统,对象-关系数据库管理系统。第九章 云计算中的数据库 介绍几种典型云计算中的数据库存储和管理系统,包括:Google云计算中的数据库Bigtable、 Hadoop中的数据库HBase、 Amazon云计算中的中的简单数据服务Simple DB和关系数据库服务RDS、 微软云计算中的数据库SQL Azure等。 云计算补充内容:云计算的概念、云计算发展现状、云计算实现机制等。 第十章 数据库技术新进展 数据库技术新进展,包括:数据仓库、数据挖掘、并行数据库、Web数据库、多媒体数据库、工程数据库、主动数据库等。第十一章 数据库技术论文选读 选择
4、10-15篇与教学内容相关的学术论文进行讲解,让学生了解本学科的基本研究方法和研究方向。,二主要参考书1.周志逵 江涛 ,数据库理论与新技术 北京理工大学出版社 2001.42.王珊 萨师煊, 数据库系统概论 高等教育出版社 20093.孙卫琴 , 精通Hibernate:Java对象持久化技术详解 第2版 电子工业出版社 2013 .14. 李昭原,数据库技术新进展 清华大学出版社 2007.105. 刘鹏, 云计算(第二版), 电子出版社, 2011.10 因为数据库技术涉及内容广泛,本课程使用了比较多的参考书,不同章节使用不同参考书中相关部分,但本课程内容本身自成体系。对以前一点没有学过
5、数据库基本知识的同学,可以从参考书2或其它相关参考书中进一步相关知识。,三课程要求和考核方式 掌握相关理论、原理和技术 完成有课后书面作业和上级实践 期末闭卷考试 成绩:平时作业(20)期末考试成绩(80),四.数据库领域研究的三个主要方面,1数据库管理系统(DBMS) 研究数据库设计方法和实现技术,数据模型,对持久性数据的有效存储和存取方法,数据结构定义和数据操纵语言,用户接口等。数据库管理系统软件是位于用户和操作系统之间的数据管理软件。如ORACLE、SQL Server、DB2、ACCESS等。,2数据库应用系统的设计方法和工具 早期有设计指南和规范标准,设计阶段的计算机辅助设计工具,计
6、算机辅助设计全过程。要求设计工具能够支持不同应用领域数据库设计,如支持复杂对象设计等。,3有关数据模型及设计理论的研究(7方面)(1)数据依赖理论 函数依赖、多值依赖、连接依赖 (2)规范化理论 范式、算法、模式分解(3)查询优化理论 包括逻辑层和物理层的优化,(4)泛关系理论 泛关系模型、泛关系表示、泛关系查询 (5)符号表追踪理论 (6)超图理论 利用超图研究数据库模式的特性 (7) 空值理论(不确定信息) 空值表示,加了空值后的运算、推理,空值的分类,分解方法、查询优化等。,1.数据管理技术产生 人工管理阶段(上世纪50年代初期)应用程序管理数据数据不共享数据不具有独立性,五.数据管理技
7、术产生和数据库系统组成,数据库系统阶段(上世纪60年代后期)数据结构化数据的共享性高,冗余度低,易扩充数据独立性高数据由统一管理和控制,数据库管理系统,数据库,2. 数据库系统(DBS)组成 由:数据库、数据库管理系统、应用系统、数据库管理员(DBA)、数据库用户构成的系统,后页,数据库(DataBase, DB) 长期存放在计算机内的、有组织的、可共享的数据集合。数据库管理系统(Data Base Management System DBMS) 数据库管理系统是位于用户和操作系统之间的数据管理软件。如ORACLE、SQL Server、DB2、ACCESS等 。 数据库管理系统的功能是:科学
8、地组织和存储数据、高效地获取和维护数据。,数据库管理员Database Administrator DBA,全面负责管理和控制数据库系统具体任务决定数据库中信息内容和结构存储结构和存取方式定义定义数据的安全性和完整性约束条件改进和重构数据库系统监控数据库的使用和运行,数据库用户,用户(Database Users)可以按照使用系统的不同方式进行区分:复杂用户可直接使用查询语言的技术人员专家用户:可根据需要编写特定的数据库应用程序简单用户使用编制好的应用程序访问数据库如银行的职员、机票预定人员、旅馆总台服务员偶然用户企业或组织机构的高中级管理人员,其它人员:,系统分析员负责应用系统的需求分析和规
9、范说明与用户及DBA协商,确定系统的硬软件配置参与数据库系统的概要设计数据库设计人员参加用户需求调查和系统分析确定数据库中的数据设计数据库各级模式应用程序员设计和编写应用系统的程序模块进行调试和安装,六. 数据库系统外部体系结构的演变,(1)单用户结构(2)主从式结构(3)分布式结构(4)客户服务器结构的数据库系统(CS)(5)浏览器/服务器模式(B/S)(6)嵌入式数据库系统,1. 单用户数据库系统,整个数据库系统(应用程序、DBMS、数据)装在一台计算机上,为一个用户独占,不同机器之间不能共享数据早期的最简单的数据库系统例如一个企业的各个部门都使用本部门的机器来管理本部门的数据,各个部门的
10、机器是独立的。由于不同部门之间不能共享数据,因此企业内部存在大量的冗余数据,2. 主从式结构的数据库系统,一个主机带多个终端的多用户结构数据库系统,包括应用程序、DBMS、数据,都集中存放在主机上,所有处理任务都由主机来完成各个用户通过主机的终端并发地存取数据库,共享数据资源,主从式结构的数据库系统的优缺点,优点:易于管理、控制与维护缺点:当终端用户数目增加到一定程度后,主机的任务会过分繁重,成为瓶颈,从而使系统性能下降系统的可靠性依赖主机,当主机出现故障时,整个系统都不能使用,分布式数据库系统是地理上分布在网络的不同结点,而逻辑上属于同一个系统的数据库系统。 分布式数据库将分散存储在计算机网
11、络中的多个节点上的数据库在逻辑上统一管理。它是建立在数据库技术与网络技术发展的基础之上的。 最初的数据库一般是集中管理的,随着网络的扩大,增加了网络的负荷,对数据库的管理也困难了,分布式数据库则可克服这些缺点,分布式数据库可供地理位置分散的用户共享彼此的数据资源。,3. 分布式数据库系统,20,分布式数据库的特点和组成,分布式数据库系统的特点 1. 数据是分布的 2. 数据是逻辑相关的 3. 结点自治性分布式数据库管理系统的组成 1局部数据库管理系统(LDBMS) 2全局数据库管理系统(GDBMS) 3全局数据字典GDD 4网络通信管理CM,4CS结构的数据库系统,客户服务器( Client/
12、Server ,CS) CS是一种网络架构,它把客户端 (Client) 与服务器 (Server) 区分开来。每一个客户端软件的实例都可以向一个服务器或应用程序服务器发出请求。CS结构的数据库系统把DBMS功能和应用分开网络中某个(些)结点上的计算机专门用于执行DBMS功能,称为数据库服务器,简称服务器其他结点上的计算机安装DBMS的外围应用开发工具,用户的应用系统,称为客户机,客户服务器数据库系统的种类,集中的服务器结构一台数据库服务器,多台客户机分布的服务器结构在网络中有多台数据库服务器分布的服务器结构是客户服务器与分布式数据库的结合,客户服务器结构的优点,客户端的用户请求被传送到数据库
13、服务器,数据库服务器进行处理后,只将结果返回给用户,从而显著减少了数据传输量数据库更加开放客户与服务器一般都能在多种不同的硬件和软件平台上运行可以使用不同厂商的数据库应用开发工具,客户服务器结构的缺点,“胖客户”问题:系统安装复杂,工作量大应用维护困难,难于保密,造成安全性差相同的应用程序要重复安装在每一台客户机上,从系统总体来看,大大浪费了系统资源系统规模达到数百数千台客户机,它们的硬件配置、操作系统又常常不同,要为每一个客户机安装应用程序和相应的工具模块,其安装维护代价便不可接受了。,多层(三层)C/S结构,在客户和服务器间增加了应用服务器一级,专门处理商业逻辑,关键算法。,三层C/S结构
14、,多层C/S结构 前端的客户层:负责提供可以移植的表达逻辑 中间的应用层:实现各类业务逻辑 后端的数据管理层与服务层:提供对专门服务的访问,Internet由许多独立的商业网、教育网、政府机构网互连而组成。Internet上提供的服务有信息浏览、电子邮件、会议、发送接收文件等。网络间通过公共协议(TCP/IP)通信。 Web是一个基于超媒体的信息网络,通过超级连接浏览Internet上的信息。 Web中的计算机可有二种角色:客户机(浏览器)、服务器。作为服务器,可以提供信息;作为客户机可以浏览和请求信息。服务器与浏览器间通过HTTP协议交换信息。,5. 浏览器/服务器模式(B/S),中间件负责
15、管理Web服务器与数据库服务器间的通信,应用程序的业务计算和数据库访问。,数据库服务器,结束,6 嵌入式数据库系统,嵌入式数据库或移动式数据库(EDBS/EMDBS) 各种移动设备、智能计算设备、嵌入式设备(手机、机顶盒、电冰箱、洗衣机) 基于GPS的应用 通过地球同步通讯卫星(GPS)传送地图信息或位置信息。 用于车辆定位、对自然资源和环境的控制和管理,Key/Value数据库 大数据技术 云计算中的数据库(9) 分布式数据库(7) 面向对象数据库(8) 对象关系数据库(8) 数据仓库和数据挖掘(10),主动数据库(10)空间数据库(10)时态数据库(10)嵌入式数据库(10)并行数据库(1
16、0)多媒体数据库(10)工程数据库(10),七. 数据库领域的新技术 除了关系数据库外,有新的数据库不断出现,包括:,1. Key/Value数据库,具备高可靠性及可扩展性的海量数据存储对互联网公司来说是一个巨大的挑战,传统的数据库往往很难满足该需求,并且很多时候对于特定的系统绝大部分的检索都是基于主键的的查询,在这种情况下使用关系型数据库将使得效率低下,并且扩展也将成为未来很大的难题。在这样的情况下,使用Key-value存储将会是一个很好的选择。 目前几种典型云计算系统也采用Key-value存储方法,或Key-value存储方法的变体。比如: 亚马逊Dynamo就是一种高可用的分布式Ke
17、y/value数据存储与管理系统; Facebook Cassandra-开源的高可伸缩分布式Key/value数据存储与管理系统; Google BigTable的数据结构采用一个多维稀疏矩阵,矩阵中所有信息基于主键进行排序。,key/value的数据结构,域(Domain)数据项(Item) 域类似于“表”,但无结构;作用是容纳数据项。 数据项用Key定义,所有与一个数据项相关的内容都存储到该数据项中。 可以将Key-value数据存储系统理解为面向数据项的系统,所有与一个数据项相关的内容都存储带该数据项中。在同一个域中存储的数据项可以有不同的结构,一个给定的数据项也许有多个动态变化的属性
18、。 由于与数据项相关的内容都存储在一个单独的数据项中,因此要获取一个数据项的相关内容无需多个表之间的Jion操作。,Key/Value数据模型和关系数据库模型举例,一个域中,不同数据项中很可能有重复存储的数据内容,好在由于磁盘的单位价格越来越低,重复存储并不是很大的问题了,而这种数据结构却为系统的可伸缩性带来了很大的便利,数据可以容易得扩展到其他机器上。一个Key/Value数据模型例子如下图:,关系数据库模型如下图:,关系数据库中的SQL 与Key/Value模型中的 API,关系数据库的数据创建、更新、删除和获取都使用SQL完成,SQL查询可以从单个表或者通过多个表的Join操作来获取数据
19、,SQL查询包括聚集、复杂的数据过滤等功能。传统关系数据库还包括将一些数据处理逻辑嵌入到数据存储中的实现,例如存储过程、触发器等。 Key/Value数据的创建、更新、删除和获取都是用API方法调用。,Key/Value的特点,数据模型:无数据模式,与数据项相关的内容都存储在一个单独的数据项中 要获取一个数据项的相关内容无需多个表之间的Join操作 便于扩展 重复存储 在数据模型设计时,没有范式的概念,没有表示关系和关系约束的机制(增加了应用程序的负担)数据访问机制: API,而非SQL,少数提供类似SQL的语法定义过滤规则 关系数据库有存储过程、触发器等,将数据处理逻辑在数据存储和管理系统中
20、实现,但Key/Value的这些处理逻辑全部实现在应用代码中。应用接口: SOAP/REST服务接口 一个数据项和一个“对象”对应,直接映射到应用程序代码,无需进行对象关系映射.,Key/Value数据模式优缺点,Key/Value的优点: 便于扩展,适于云计算的环境 与应用程序代码的兼容性更好Key/Value的缺点: 数据完整性约束转移至应用程序 目前的很多Key/Value数据存储系统之间不兼容 在云环境中,很多用户和应用使用同一个系统。为了避免一个进程使共享环境超载,往往严格限制一个单独的查询所能够产生的全局影响。 例如,在SimpleDB中,不允许用户运行一个超过5秒钟的查询,在Go
21、olgeAppEngine数据存储中,用户一次查询返回的数据项只允许在1000条以内。这对于很多商业应用来说,是不现实的。特别是对于数据分析应用,例如用户使用模式跟踪、推荐系统等来说,这样的限制是不可容忍的。,分布式key/value存储系统比关系数据库更适于互联网环境,互联网环境中进行数据处理的需求特点: 数据规模较大,数据存储必须便于扩展; 大多是非结构化的数据,很多情况下无需进行复杂的查询;关系数据库: 数据结构化、为进行复杂的数据查询设计 表结构较为复杂,不便于在分布式环境下进行数据扩展。,分布式Key/value数据存储与管理系统应用举例1,(1) 亚马逊Dynamo-高可用的分布式
22、Key/value数据存储与管理系统 Amazon运行一个全球性的电子商务服务平台,在繁忙时段使用位于世界各地的许多数据中心的数千台服务器为几千万的客户服务。Amazon平台有严格的性能、可靠性和效率方面操作要求,并支持持续增长,因此平台需要高度可扩展性。可靠性是最重要的要求之一,因为即使最轻微的系统中断都有显著的经济后果和影响客户的信赖。 Amazon服务平台中的许多服务只需要主键访问数据存储。对于许多服务,如提供最畅销书排行榜、购物车、客户的偏好、会话管理、销售等级、产品目录,常见的使用关系数据库的模式会导致效率低下、有限的可扩展性和可用性。Dynamo提供了一个简单的主键唯一的接口,以满
23、足这些应用的要求。 Dynamo通过一个简单的接口将对象与key关联,它有了两个操作:get()和put()。get(key)操作在存储系统中定位与key关联的对象副本,并返回一个对象或一个包含冲突的版本和对应的上下文对象列表。put(key,context,object)操作基于关联的key决定将对象的副本放在哪,并将副本写入到磁盘。,分布式Key/value数据存储与管理系统应用举例2,(2) Facebook Cassandra-开源的高可伸缩分布式Key/value数据存储与管理系统 Cassandra是一个分布式的存储系统,可用来管理分布在大量廉价服务器上的巨量结构化数据,并同时提供
24、没有单点故障的高可用服务. Cassandra是一套高度可扩展、最终一致、分布式的结构化键值存储系统,结合了Dynamo的分布技术和Google的BigTable数据模型,更好满足了海量数据存储需求,解决了应用与关系数据库模型之间存在的非依赖关系。 Cassandra中的表是一个按照主键索引的分布式多维图. Cassandra的API由下面三种方法组成. insert(table, key, rowMutation) get(table, key, columnName) delete(table, key, columnName),2.大数据技术简介,(1)大数据的由来和特征(2)大数据的应
25、用(3)大数据相关技术(4)大数据的研究方向,想驾驭这庞大的数据,我们必须了解大数据的特征。,地球上至今总共的数据量:在2006 年,个人用户才刚刚迈进TB时代,全球一共新产生了约180EB的数据;在2011 年,这个数字达到了1.8ZB。而有市场研究机构预测:到2020 年,整个世界的数据总量将会增长44 倍,达到35.2ZB(1ZB=10 亿TB)!,1PB = 250字节1EB = 260字节1ZB = 270字节,(1)大数据的由来和特征大数据时代的爆炸增长,何为大? _ 数据度量,1Byte = 8 Bit1KB = 1,024 Bytes1MB = 1,024 KB = 1,048
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库技术 及其 发展 简介 ppt 课件

链接地址:https://www.31ppt.com/p-1875954.html