第六章数据资源管理技术.ppt
《第六章数据资源管理技术.ppt》由会员分享,可在线阅读,更多相关《第六章数据资源管理技术.ppt(25页珍藏版)》请在三一办公上搜索。
1、第六章 数据资源管理技术,科学管理依赖信息,信息是一个组织重要的资源。数据库技术的使用是 MIS 成熟的重要标志。数据管理技术的发展数据人工管理阶段:没有软件支持,只有程序文件的概念数据处理后程序和数据的内存空间一起被释放。数据和程序相互依赖;数据结构的变化、修改,导致整个程序的修改。最大的问题是编程效率低,程序依赖数据,不灵活,容易出错。文件管理阶段:有分离的程序文件和数据文件,文件系统管理数据。程序使用数据文件名访问数据,不必关心其物理位置和细节。便于程序访问数据,有索引文件,链接文件和散列文件等等。数据不属于某个特定程序,允许重复使用,但数据文件的结构仍取决于特定的应用,程序与数据间的依
2、赖关系并未根本改变。具有数据设备独立性,但不能体现用户观点下的数据逻辑结构独立于数据在外存上物理结构的要求,在数据物理结构修改时,仍需修改用户应用程序。文件管理方式是数据资源管理的一大进步,它也是数据库的基础。文件系统的缺陷:数据冗余(redundancy),每个应用程序有对应的数据文件,文件间缺乏联系,同样的数据可能重复出现。冗余浪费存储空间,且数据修改稍有不谨慎可能造成数据不一致性(inconsistency);其次,数据文件面向应用,当数据结构改变时,程序维护成为系统的主要矛盾。,第六章 数据资源管理技术,数据管理技术的发展数据库阶段:数据存储在数据库中,数据资源使用数据库管理系统的专门
3、软件管理。数据库用数据结构描述了数据,数据间的联系。数据面向整个应用系统,减少冗余,真正实现数据在不同应用中共享。数据库管理系统(DBMS,Database Management System)的三级模式,有物理数据独立性,数据库只根据系统需求独立设计;逻辑数据独立性,特定用户以逻辑结构(视图)操作数据,大大提高了编程效率。DBMS 提供方便操作的用户接口,数据库的恢复,并发控制,数据完整性、安全性等控制功能,保证数据的安全,可靠性。数据库系统以记录为单位操作数据,也可操作数据项,增加系统灵活性。从文件系统发展到数据库系统是信息处理领域中的一个重大变化,以数据为中心。应用程序设计退居为外围地位
4、。,第六章 数据资源管理技术,访问远程数据资源 计算机网络中有多台计算机访问数据资源,系统由三部分组成:客户机(Client)用户操作的多台个人(PC)计算机;服务器(Server)数据集中存储的计算机。通常只有一台服务器,有些系统配置有多台服务器;通信网络连接客户机和服务器的通信线路。传统的文件方式:客户机应用程序访问远程数据资源时,将文件服务器上的数据文件装载到客户机上,应用程序在数据文件中找到它所需的数据,处理后再将整个数据文件回送文件服务器。整个远程数据资源访问过程都不可见,但占据了时间和网络总线的带宽。要求有较大内存容量,较强的处理能力的客户机。客户机/服务器(C/S,Client/
5、Server)方式:客户机的应用程序请求服务器查找它所需的数据,服务器将数据文件中匹配的数据返回。节省时间和网络的开销。发挥了服务器较强的处理功能,客户机只集中处理用户界面。在两层C/S结构中,客户机必须配置访问的各种数据库的驱动程序,成本高;用户还必须考虑配置和软件维护问题。三层C/S结构中,插入中间件服务器,客户机仅需与中间件服务器驱动程序通信,中间件服务器完成与服务器的不同数据库的驱动问题。,第六章 数据资源管理技术,访问远程数据资源分布式客户/服务器结构用于更复杂的和更有弹性的系统,系统中有多个分布配置的服务器,执行不同的功能或某些特殊功能。浏览器/服务器(B/S,Browser/Se
6、rver)方式:随着网络技术和Web技术的发展,使用数据源的数据量剧增,开发Web数据库系统十分有意义。在Internet和Intranet上,如网上银行、在线购物、产品信息、市场调查分析、联机数据库查询等,到处可看到Web数据库的应用。Web数据库基于C/S结构的三层模式,即Browser/Web server/DB server,客户层是统一界面的浏览器,数据服务器为服务层,中间层是Web服务器和应用服务。用户通过浏览器的Web页上输入信息,并发送到Web服务器,通过应用程序访问数据库,将结果以图形、图像、文本或表的形式返回浏览器。一种特别感兴趣的网络计算机:没有磁盘驱动器或其它当地数据存
7、储设备的PC机,使网络管理简化,又能处理图形用户界面,需要的是能在任何计算机上运行的图形用户界面,在服务器上修改某个驱动程序或应用程序时,可以在该服务器的每个网络计算机客户机上运行。面向对象的程序设计语言Java,使应用程序独立于异构网络上的多种平台,提供在任何计算机上运行的图形用户界面设计。,第六章 数据资源管理技术,数据描述现实世界:现实世界是在人们头脑以外的客观世界(real world),对信息系统而言,组织的业务活动涉及的物流、人、事、单位以及相关的数据,如库存管理,涉及货物的存放、进出、搜查等业务活动。业务活动中抽取的数据为管理活动提供报表、汇总、统计分析图等。信息世界:人的认知一
8、是从特殊到一般的归纳,二是从一般到特殊的演绎。将现实世界中客观存在相互区别的事物或事件抽象为实体集。实体集具有组成实体的共同的性质(属性),如学生实体集有姓名、年龄、性别等共同属性。实体集中的具体实例称实体,有具体的属性值,如某个学生姓名叫李四,年龄22岁,性别为男等,属性值的不同用来区别不同的实体。实体标识符是某个属性(代码)或一组属性,唯一标别每个实体。,第六章 数据资源管理技术,数据描述计算机世界:是数据存储形式,在计算机中数据以文件方式存储,并分下列层次:字段(field)或称数据项:字段可以命名的最小数据单位,字段名表示实体的属性。字段值表示每个具体属性值或数据,一般分两大类型:数值
9、型和字符型。记录(record):记录结构是字段有序集合,记录描述一个具体实体,是字段值有序集合,实体属性的数据描述。例 实体集:学生(学号,姓名,年龄,性别,)实体:99064111 李四 22 男 文件(file):文件是同一实体集的所有记录的集合,所有的学生记录组成一个学生文件。其中,主关键字(key)简称主键,是能唯一标识文件中每个记录的字段或字段集,与信息世界中实体标识符的概念相对应。数据库是数据层次最高一层,它是综合的、相关的文件集合,它表示一个应用项目中相关的实体集的集合及实体集间的关联。我们可以不必关心数据的存储结构和具体实现方式,因为数据库系统的目标之一,是用户能简单、方便地
10、访问数据库中的数据。,第六章 数据资源管理技术,数据库数据模型:逻辑模型和物理模型。逻辑模型不涉及数据的表示、物理实现,只描述从系统需求到信息世界的高层抽象的信息模型。创建数据逻辑模型的工具是实体联系(E-R)图。物理模型面向信息模型所采用的具体数据结构,第二层抽象。数据的物理模型有严格形式化定义,便于计算机中实现数据的存储和访问。实体间的联系:其联系方式不外乎三种:一对一(1:1)联系:在两个实体集中,一方的一个实体最多与另一方对应的一个实体相联系。例如,已婚男性集合和已婚女性集合间实体关系是一对一的联系。一对多(1:M)联系:在两个实体集中,一方的一个实体与另一方对应的若干个实体相联系;反
11、之,另一方的一个实体最多对应一方的一个实体,称一对多联系。例如,一个组织部门和职工,在一个具体部门工作的职工有若干个,而一个职工只在一个部门工作,工作将部门和职工两个实体联系在一起,是一对多的联系。多对多(M:N)联系:若两个实体集中,任何一方的一个实体都对应另一方的若干个实体,称多对多联系。例如,在教学管理中学生和课程,一个具体学生可选修若干门课程,反之,一门课程可以被若干个同学选修,选修将学生和课程两个实体联系在一起,是多对多的联系。实体有属性,联系也有属性。例如,学生和课程的选修多对多的联系有成绩属性。除多对多联系的属性外,一对一和一对多联系的属性,一般都可归併相应的实体属性中。递归联系
12、是一个实体与自身相联系,也有一对一,一对多和多对多的联系。例如一个组件可以由多个零件组装而成,而一个零件又可以在多个组件中组装使用,这就是多对多的递归联系,组装使用数量则是联系的属性。对1:1(m)递归联系,事实上是超类与子类的联系,如职工与干部、领导的联系。,第六章 数据资源管理技术,数据库数据模型实体联系ER图(Entity Relationship Diagram):数据的逻辑模型强调语义表达功能,概念简单、清晰,易于理解,便于数据库设计人员和用户交流,启发、检验、返回补充系统需求。E-R图使用图形符号表示组织业务活动涉及的实体及实体间联系。矩形框表示实体,两部分分别表示实体标识及其属性
13、;菱形表示实体间的联系,带有联系方式的直线相关的实体连接,关系有属性直接附于菱形框。在实际系统中往往有多个相互关联的实体,作图也比较复杂。例 仓库主要管理零件入库、出库及采购等事项。工程项目需要仓库提供零件,仓库需要向零件供应商采购零件,建立E-R图过程:确定实体集;确定实体间关系;确定实体集名称和属性。,工程项目(项目编号J#,项目名称Jname,开工日期DATE)零件(零件编号P#,零件名称Pname,规格Psize,重量Pweight)供应商(供应商代号S#,姓名Sname,地址SADR),第六章 数据资源管理技术,数据库数据模型数据的物理模型数据库的数据结构。层次或树状模型:用倒树结构
14、表示实体及实体间关系。树的结点是记录类型,非根结点只有一个父结点,上层与下层间是一对多的关系。特点是记录间的联系依靠指针,查询效率高。缺点是只能表示一对多的联系,多对多联系实现复杂困难;数据查询、更新复杂、编程比较复杂。网状模型:用有向图表示实体及实体间关系。有向图的结点是记录类型,有向边从箭尾端记录类型到箭头端记录类型是一对多关系。特点是记录之间的联系用指针,多对多的关系亦可拆成两个一对多的关系。模型易于实现,查询效率较高,缺点是编写程序比较复杂,程序员必须熟悉数据库的逻辑结构。关系模型:用二维表格表达实体集,外键表示实体间关系。与层次网状模型相比,简单易懂,编程方便,集合论是关系模型的数学
15、基础。关系数据库的标准化语言SQL已得到广泛应用。典型关系数据库管理系统DBMS产品有DB2,ORACELE,SYBASE,INFORMIX和微机产品FOXPRO,ACCESS等。概念简单,易于理解,多对多的关系可简单地分解二个一对多的关系。实体集的主键用直线下划线表示,则上节仓库管理的实体及实体间关系可表示:,工程项目(J#,Jname,Date)零件(P#,Pname,Psize,Pweight)供应商(S#,Sname,Saddr)供需关系(J#,p#,Total)需供关系(P#,S#,Quantity),第六章 数据资源管理技术,数据库管理系统 DBMS DBMS 是一个提供对共享数据
16、可靠管理用的软件,数据库系统的核心。DBMS 对数据库定义、提供用户视图、查询、更新等一切操作,用作数据库与应用程序之间,或数据库与用户之间的接口。三级模式结构:内模式、概念模式和外模式。外模式(external schema):单个用户使用的数据视图,是概念模式的一个子集。概念模式(conceptual):所有用户的数据定义,系统的、全局的数据视图。内模式(internet):涉及的数据存储结构,物理存储数据视图,又称存储模式。数据据库数据的三个抽象级别,使用户只要抽象地处理数据,不必关心数据的表示和存储,数据的具体组织、管理工作交给DBMS,减轻用户使用系统的负担。数据在三级模式间差别很大
17、,DBMS 在三级模式间提供两个层次的映射外模式到概念模式、概念模式到内模式映射。两级数据独立性:数据库的逻辑独立性:概念模式的修改不影响外模式,只需改变外模式到概念模式的映射关系,从而保证子模式不变,应用程序亦无须修改。数据的逻辑独立性,简化了数据库系统应用程序的设计工作。数据库的物理独立性:内模式的修改不影响概念模式,只需改变概念模式到存储模式的映射关系。使数据库只需根据系统需求独立设计,又因为有数据库的逻辑数据独立性,从而保证对于外模式和应用程序不受存储模式影响,简化了数据库系统应用系统的开发、设计工作。两级独立性简化应用系统的开发,提高开发效率。概念模式能导出不同应用的多种子模式,减少
18、数据冗余,保证数据的一致性,有利于数据共享。应用程序只操作自己的子模式范围内的数据,把数据库中其他用户的数据隔离,用户对数据库概念模式和存储模式的数据都不可见,有利于数据的安全性和保密性。,第六章 数据资源管理技术,数据库管理系统的组成:查询处理器和存储管理器。查询处理器:查询处理器主要包括有DDL编译器、DML编译器、嵌入型DML预编译器、查询运行核心程序。数据描述语言DDL(Data Description Language):定义数据库的三级结构及其相互之间的映射,定义数据完整性、安全控制等约束。数据库系统中存储三级结构定义的数据库称数据字典(data dictionary,DD)。数据
19、操纵语言DML(Data Manipulation Language):实现数据操作。基本的操作有查询、插入、删除、更新等四种。DML分交互型和嵌入型两种。DML语言分:过程性的DML必需指示“做什么”和“怎么做”,层次、网状的DML属过程性DML。非过程性的DML,如关系型的DML,只需指示“做什么”就可,操作简单、使用方便,深受广大用户欢迎。存储管理器:存储管理器主要包括有授权和完整性管理器、事务管理器、文件管理器、缓冲管理器等,提供数据库保护功能如数据恢复、并发控制、数据库完整性和安全性控制。安全性保护:规定用户访问数据库的权限防止非法用户窃取的安全、保密保护措施。系统可采取多种措施,如
20、鉴定用户身份、口令、数据编密码等安全性保护。完整性管理:完整性指数据的正确性和一致性,通过对数据及数据间的逻辑关系施加约束条件来实现。如对字段值类型、取值范围、精度等约束,对实体唯一性约束,对实体间联系的约束等。故障恢复:数据库在运行过程中难免会造成数据库被破坏,如磁盘损坏、病毒、或操作不当等偶然因素使数据丢失,系统能恢复到破坏前的状态称故障恢复。在使用故障恢复功能时,数据备份,事务管理必不可少。并发控制:在多用户或网络应用中的数据库,多个用户操作同一数据时,必须控制不合理的时差有可能造成数据出错现象。,第六章 数据资源管理技术,数据库管理系统的组成存储管理器:并发错误解决方法是控制相关进程互
21、斥地访问数据库,如用加锁和开锁控制。用户程序中使用锁,就可能存在死锁问题。编写应用程序时,必须采取预防死锁的措施。数据库的维护功能提供数据库管理员运行DB系统时使用。如数据导入、备份、文件重组、性能监控等,确保数据库保持最佳工作状态。用户界面:用户是指使用管理信息系统应用程序的联机终端用户。程序员用程序设计语言(称宿主语言),设计数据库应用程序或用户界面,编写数据库应用系统。DBMS 主要由数据定义语言DDL和数据操作语言DML组成,是基于记录模式的语言,程序设计语言是基于整数、实数、字符、记录、数组等数据类型的运算模式的语言,两者之间有“缝隙”。例如,SQL语言不能直接使用指针,数组等数据结
22、构,程序设计语言也没有DDL、DML。有二种处理方式:一是扩充宿主语言的编译程序,使之能处理 SQL语句,如VC+、VB 等。另一种是自含语言,DBMS 有自己的编译器,也有程序控制命令,可直接用于编写数据库应用程序,如 VFP、DELPHI 等,使用方便,很受欢迎。,第六章 数据资源管理技术,关系型数据库关系模型的特点:数据结构是二维表格,简单易理解;集合论是其理论基础有严密的关系运算理论和关系模式设计理论:关系模型面向集合处理,一次可操作多个元组,层次、网状模型一次只能操作一个元组;关系模型有视图等工具,应用不随数据库改变而改变,有数据逻辑独立性;RDBMS 只需指出“做什么”不必指出“怎
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 数据 资源管理 技术
链接地址:https://www.31ppt.com/p-5428257.html