多媒体数据管理技术.ppt
第五章 多媒体的 数据管理技术,5.1 概述,多媒体应用的发展,使多媒体应用项目中的多种数据格式的管理成为关键。数据管理技术的发展历经三个阶段:1、人工管理阶段。2、文件系统阶段。3、数据库系统阶段(1)公用数据库(2)关系型数据库(3)多媒体数据库,1.人工管理阶段(20世纪50年代中期以前)计算机主要应用于科学计算,数据量较少,一般不需要长期保存数据;硬件方面,没有磁盘等直接存取的外存储器;软件方面,没有对数据进行管理的系统软件。,5.1 概述,程序与数据是一个整体,一个程序中的数据无法被其他程序使用,应用程序的设计与维护负担繁重。,2.文件系统阶段(20世纪50年代后期至60年代后期)计算机开始大量用于数据管理;硬件上出现了直接存取的大容量外存储器;软件方面,出现了操作系统,其中包含文件系统。,5.1 概述,文件的逻辑结构与存储结构有一定区别,即程序与数据有一定的独立性,大大减少了维护程序的工作量。,文件系统使计算机在数据管理方面有了长足的进步,但其存在3个缺点:数据的冗余度大,数据不能共享;数据独立性差,数据和应用程序是互相依赖的;缺乏对数据的统一控制管理。,5.1 概述,3数据库系统阶段(20世纪60年代后期)计算机在管理中应用规模更加庞大、数据量急剧增加,数据共享性更强;硬件价格下降;软件价格上升,编制和维护软件所需成本相对增加。,5.1 概述,这些成为数据管理在文件系统的基础上发展到数据库系统的原动力。,5.1 概述,数据库(Data Base):是按照一定的规则相互关联数据的集合。这些数据是用来反映各类实物的属性的数据。数据库管理系统(DBMSData Base Management System):是能够用来建立数据库,完成数据库的维护、管理等操作,并能够帮助用户方便地使用数据库的软件。,5.1 概述,数据库系统的概念数据库系统(Database System,记为DBS)是一个复杂的系统,它是由硬件、软件(操作系统、数据库管理系统和编译系统等)、数据库和用户构成的系统。,数据库概述,数据库系统的概念数据库系统与图书馆的比较 数据库图书馆 数据图书 外存书库 用户读者 数据模型书卡格式 数据库管理系统图书馆管理员 数据的物理组织方法图书馆图书存放方法 用户对数据库的操作读者对图书馆的访问(使用数据操纵语言对数据(用普通语言借书、还书等)检索、插入、删除、修改),5.1 概述,数据库管理系统(DBMS)模式种类:1、物理模式(存储模式):数据的存储组织方法 2、概念模式(逻辑模式):定义抽象世界的方法 3、外部模式(视图):概念模式对用户有用的那 一部分,5.1 概述,数据库管理系统(DBMS),5.1 概述,数据库管理系统(DBMS)模式种类:1、物理模式(存储模式,内模式):它是数据库中全体数据的内部表示或底层描述,是数据库最低一级的逻辑描述,它描述了数据在存储介质上的存储方式和物理结构,对应着实际存储在外存储介质上的数据库。内模式由内模式描述语言来描述、定义,它是数据库的存储观。,5.1 概述,数据库管理系统(DBMS)模式种类:2、概念模式(逻辑模式):它是由数据库设计者综合所有用户的数据,按照统一的观点构造的全局逻辑结构,是对数据库中全部数据的逻辑结构和特征的总体描述,是所有用户的公共数据视图(全局视图)。它是由数据库系统提供的数据模式描述语言(DDL:Data Description Language)来描述、定义的,体现、反映了数据库系统的整体观。,5.1 概述,数据库管理系统(DBMS)模式种类:3、外部模式(视图):外模式又称子模式,对应于用户级。它是某个或某几个用户所看到的数据库的数据视图,是与某一应用有关的数据的逻辑表示。外模式是从模式导出的一个子集,包含模式中允许特定用户使用的那部分数据。用户可以通过外模式描述语言(外模式DLL)来描述、定义对应于用户的数据记录(外模式),也可以利用数据操纵语言(DML:Data Manipulation Language)对这些数据记录进行描述。外模式反映了数据库的用户观。,数据库系统的特点数据共享:多个用户可同时存取数据而不相互影响;减少数据冗余:在数据库中用户的逻辑数据文件和具体的物理数据文件不必一一对应;具有较高的数据独立性:指数据与应用程序之间的彼此独立增强了数据安全性和完整性保护:加入安全保密机制,实行集中控制。,5.1 概述,5.1 概述,传统数据库数据模型:1、关系型 2、层次型 3、网络型,5.1 概述,传统数据库数据模型:1、关系型 采用关系框架来描述数据之间的关系,通过把数据抽象成不同属性和相互的关系,建立起数据的管理机制。列称为字段,行称为记录。,5.1 概述,传统数据库数据模型:2、层次型 也称树型,很像一颗倒挂的树,用来描述有层次联系的事物;反映了客观事物之间一对多(1:n)的联系。,5.1 概述,传统数据库数据模型:3、网络型 反映了客观事物之间的多对多(m:n)的联系。例如一个商店可以经营若干种商品,若干个商店可以出售同一种商品。商店与其所经营的各类商品之间的联系就是一种网络数据模型。,5.1 概述,5.1 概述,多媒体数据与数据库管理:数据库中的数据类型:1、字符数值数据 2、文本数据 3、声音数据(音频)4、图形数据 5、图像数据 6、视频数据,5.1 概述,数据库中的数据类型:1、字符数值数据 记录事物非常简单的属性、数值属性,或是高度抽象的属性。特点:简单、规范,因而易于管理;应用:传统数据库主要针对这种数据,在多媒体 数据库中仍需要管理大量的这类数据。,5.1 概述,数据库中的数据类型:2、文本数据 最常见的媒体形式,各种书籍、文献、档案等无不是由文本媒体数据为主构成。特点:计算机内由长短不一的字符串表示,给存储和再现带来不便,自然语言理解技术的不成熟也使查询文本数据的难度加大。应用:许多通用型数据库系统根本没有管理和使用文本媒体的有效手段。关键字检索和全文检索,5.1 概述,数据库中的数据类型:3、声音数据(音频)音乐数据:以符号表示,数据量小,对它的查询和存储可以当成文本处理。语音数据:以数字化的波形为主,数据量大。检索:1)给语音数据人工附加属性描述或文本描述;2)浏览。具体应用中一般两者相结合使用。,5.1 概述,数据库中的数据类型:4、图形数据 可分解为点、线、弧等基本的图形元素,使用层次数据模型。特点:由于图形是用符号或特定的数据结构表示,易于管理。应用:已有很多成功的应用范例,如地理信息系统、工业图纸管理系统和建筑CAD数据库等。,5.1 概述,数据库中的数据类型:5、图像数据 指位图式图像,目前已经提出很多方法,例如:属性描述法、特征提取、分割、纹理识别、颜色检索等。特定于某一类应用的图像检索系统已取得成功的经验,如指纹数据库、头像数据库等。多媒体数据库中更强调对通用图像数据的查询和管理。,5.1 概述,数据库中的数据类型:6、视频数据 复杂得多,引入了时间属性,管理要在时间和空间两方面进行。管理、查询难度更大。考虑实时、合成、同步等问题。,5.1 概述,多媒体数据的特点:(1)、数据量巨大(2)、数据类型繁多、差别大(3)、有些多媒体信息对处理时间要求 过高(4)、多媒体信息往往需要多种信息集 成、共同描述,5.1 概述,多媒体数据的管理方法:(1)文件管理系统(2)建立特定的逻辑目录结构(3)传统的字符、数值数据管理系统(4)多媒体数据管理系统(MDBMS)(Multimedia Database Management System)(5)超文本和超媒体(Hypertext and Hypermedia),5.1 概述,(1)文件管理系统 利用操作系统提供的文件管理系统对多媒体数据资源按不同媒体、不同使用方法或不同类别建立不同属性的数据文件,并对这些文件进行维护和管理,供多种多媒体应用开发程序使用。,5.1 概述,文件管理系统示意图,现实世界信息,采集/转换,图形数据文件,图像数据文件,声音数据文件,文字数据文件,字符数据文件,文件系统,多媒体应用程序,多媒体应用程序,多媒体应用程序,操作系统网络操作系统窗口操作系统,5.1 概述,(2)建立特定的逻辑目录结构 与文件管理系统的对比:相同点:也是利用操作系统提供的文件管理系统;不同点:将各类源文件和数据库文件放在不同的 目录下管理。,5.1 概述,(3)传统的字符、数值数据管理系统 把文件管理系统和传统的字符、数值数据库管理系统结合起来。常规数据 传统数据库管理系统(如字符、整型数等)非常规数据 文件管理系统(如动画、图形等)将数据库文件的完全文件名作为字符串纳入传统数据库进行管理,5.1 概述,传统的字符、数值数据管理系统示意图,多媒体数据文件,传统DBMS,多媒体数据库文件检索程序,OS的文件系统,多媒体应用,多媒体应用,多媒体应用,数据库,5.1 概述,(4)多媒体数据管理系统:特点:如果能够对多媒体数据和传统的字符型数值数据采用统一的方法进行管理,该系统将成为最理想、最有效的数据管理方法。功能:(1)、多媒体数据库对象的定义(2)、多媒体数据库运行的控制(3)、多媒体数据库的建立和维护(4)、多媒体数据库在网络上的通信功能 主流数据库系统:如Oracle、Sybase 等,5.2 多媒体数据库管理系统,5.2.1、多媒体数据库管理系统的基本功能:(1)、必须能表示和处理各种媒体数据(包括音频、视频、动画等非格式化数据)。(2)、必须能反映和管理各种多媒体数据的特性,或各种媒体数据之间的空间和时间的关联。(3)、必须满足物理数据独立性和逻辑数据独立性,同时满足媒体数据独立性。,5.2 多媒体数据库管理系统,物理数据独立性:物理数据结构(存储模式)改变不影 响概念数据组织(逻辑模式)。逻辑数据独立性:概念数据组织改变时,不会影响用户 程序使用的视图(外模式)。媒体数据独立性:多媒体数据库管理系统的设计和实现 时,要求系统保持各种媒体的独立性 和透明性。,5.2 多媒体数据库管理系统,5.2.2、多媒体数据库管理系统的体系结构:1、层次结构 2、组织结构:联邦型结构 集中统一型结构 客户/服务器结构 超媒体型结构,1、层次结构:,传统数据库层次结构:,1、层次结构:,多媒体数据库层次结构:,1、层次结构:,多媒体数据库层次结构:,媒体支持层:针对各种媒体的特殊性质,对媒体进行相应的分割、识别、变换等操作,并确定物理存储的位置和方法,以实现对各种媒体的最基本数据的管理和操纵。,1、层次结构:,多媒体数据库层次结构:,存取与存储数据模型层:完成多媒体数据的逻辑存储与存取。描述各种媒体数据的逻辑位置安排、相互的内容关联、特征与数据的关系以及超链的建立等。,1、层次结构:,多媒体数据库层次结构:,概念数据模型层:为上层的用户接口、下层的多媒体数据存储和存取建立起一个在逻辑上统一的通道。,1、层次结构:,多媒体数据库层次结构:,多媒体用户接口层:完成用户对多媒体信息的查询描述和得到多媒体信息的查询结果。,联邦型结构,2、组织结构:,对多媒体数据的管理分开进行;对多种媒体的联合操作交给用户完成;对多种媒体的联合操作、合成处理和概念查询等都比较难于实现。,集中统一型结构,2、组织结构:,只存在一个单一的多媒体数据库和单一的多媒体数据库管理系统;各种用户的需求被统一到一个多媒体用户接口上,多媒体的查询检索结果可以统一地表现;实现难度很大。,客户/服务型结构,2、组织结构:,各种媒体数据相对独立,每一种媒体的管理和操纵用一个服务器来实现;所有服务器的综合和操纵用一个服务器来完成;针对不同需求采用不同的服务器、客户进程组合;容易扩展到网络环境下工作;需要对服务器和客户进行仔细规划和统一的考虑,采用标准化的和开放的接口界面。,超媒体型结构 强调对数据时空索引的组织,把数据库分散在网络上,把它看成一个信息空间,只要设计好访问工具就能够访问和使用这些信息。,2、组织结构:,5.2.3、多媒体数据模型:1、NF2数据模型;2、面向对象数据模型;3、其它数据模型(超媒体数据模型、文献模型、专有媒体数据模型),1、扩展关系数据库方法,引入抽象数据类型(ADT),用来描述复杂数据类型的逻辑表示,扩充的数据类型主要有:图像、图形、声音,并应用一些新技术如Windows的OLE,从而使那些传统的RDBMS具有一定的管理多媒体数据的能力。引入嵌套表,在记录和表之间建立层次关系*这种扩充方法有其很大的局限性,这条途径只能是一个过渡形式,而不是长久的办法。,扩展关系数据库方法:,浙江大学2003级博士生学籍登记表(传统数据库),浙江大学2003级博士生学籍登记表(多媒体数据库),扩展关系数据库方法:,住 址,国 家,城 市,邮政编码,详细地址,E-mail,地址嵌套,1NF(Normal Form):第一范式,将关系规定成二维表格形式(Nor First Normal Form):非第一范式,2、面向对象数据模型:(1)对象:问题领域中事物的表示和描述(2)属性:组成对象的数据(3)方法:定义在对象属性上的一组操作(4)消息:对象间的通信和请求对象完成某种处理 工作要传递的信息(5)类:具有相似属性的一组对象(6)基类和派生类(7)继承性:建造新的派生类(从个别基类继承属 性和方法,并增加新定义的属性和方 法)(8)封装性:对象的实现细节对外部是不透明的(不 可见的),也是不可取的。(9)多态性:同样的消息引起不同对象的不同操作,2、面向对象数据模型:(1)以客观自然的方法来描述现实世界中的各种 实体及实体间的联系(2)更具表示能力(支持抽象数据类型和用户定 义方法)(3)封装性使得多媒体对象的界面独立于对象的 内容表示(4)基类、派生类及其继承性可减少冗余和避免 引起问题,利于版本控制(5)查询语言是沿着系统内部固有联系进行,避 免大量的查询优化工作,3、其他数据模型 超媒体数据模型;文献模型;专有媒体数据模型;,如何将用户的请求转变为系统所能识别的形式并输入系统成为系统的动作;如何将系统查询得到的结果按照要求进行表现。,5.3 多媒体数据库的用户接口,总结:,掌握:多媒体数据的特点、管理方法。多媒体数据库管理系统的基本功能、体系结构 超文本和超媒体的含义 了解:数据管理技术的发展 多媒体数据库的当前应用现状 超文本与超媒体系统的发展前景,