多媒体数据库ppt课件.pptx
多媒体数据库,为什么提出多媒体数据库?,多媒体数据可以有哪些数据组成?,多媒体数据是指由多种不同类型媒体综合组成的,通常包括文本、图形、图像、声音、视频图像和动画等媒体形式。 只包含某种媒体的数据称为单媒体。当然,单媒体可以看作是特殊的多媒体。,多媒体数据的特征?,数据量非常庞大音频视频有时间维,固定速率播放才能预期效果内容中语义结构难识别空间时间协调表示多个媒体类型数据含义模糊、主观参数多,多媒体数据具有如下几种特性:,1. 集成特性2. 独立特性3. 数据量大4. 实时性强5. 具有交互性6. 非解释特性7. 非结构特性,三个难题:,信息媒体的多样化多媒体数据集成或表现集成多媒体数据与人之间的交互性,多媒体数据库技术需要研究的问题:,如何用数据库系统来描述如何表达多媒体信息的内容将怎样进行检索查询该如何处理这些数据呢,?,如何用数据库系统来描述,?,多媒体数据模型,是客观事物及其联系的数据描述;数据的描述:指出模型中包含那些记录类型,并对记录类型进行命名;指明各个记录类型由那些数据构成,并对数据项进行命名,每个数据项均需指明其数据类型和取值范围。数据间联系:指明各个不同记录间所存在的联系和联系方式。,数据模型作用,为表达使用系统将要存储和检索的数据项的性能提供框架(或语言)该框架允许设计者和用户定义、插入、删除、修改和搜索数据库项目和性能,与传统数据类型相比较,多媒体数据不仅包含整型、实型、布尔型和字符型等传统数据类型,而且还应包括图形、图像、声音、文字、动画等复杂数据类型从数据量上看,常规数据与多媒体数据的大小差别可以达到几千、几万甚至几十万倍,与传统数据类型相比较,从数据长度上看,常规数据项一般采用定长记录处理,存储结构清晰,而多媒体数据长度可变从数据传送方面看,多媒体数据不论是视频媒体还是音频媒体,都要求连续播放,否则将导致严重失真,这就要求CPU、I/O、RAM、网络带宽及软件算法比常规数据快一个档次,综上所述:,多媒体数据项对应一个复杂对象,而并不是一个不可再分的原子数据,它的数据模型通常具有复杂的层次结构,而不同于简单关系模型,要求数据模型满足:,可扩展,以便添加新的数据类型能够表示复杂空间和时间关系的基本媒体类型和复合对象灵活的,以便在不同抽象级别上指定、查询和搜索数据项允许进行有效存储和搜索,多媒体数据模型,目前,建立多媒体数据模型的方法主要有如下两种:扩展现有关系数据库管理系统,用于支持类似于二进制对象的各种多媒体对象。将RDBMS从基本的二进制对象扩展到继承和类这一概念。转变为发展成熟的面向对象数据库,以支持SQL语言。将数据库和应用软件转变为面向对象的数据并使用面向对象的语言,如C+,或使用对象的SQL来开发。,多媒体数据模型的层次,多媒体数据模型是用来描述任何多媒体数据静态特性和动态特性的一组概念和定义,一般可以分为如下三个层次。概念数据模型(conceptual data model,CDM) 逻辑数据模型(logical data model,LDM) 物理数据模型(physical data model,PDM),数据模型分类,简单性数据模型复杂型数据模型智能型数据模型,简单型多媒体数据模型,对应于多媒体简单应用。特征:涉及到的对象多为静态,结构较为简单,查询比较确定。简单型多媒体数据库功能:对多媒体数据中的物理媒体数据的有效管理和存取;建立多媒体数据及其文本说明等属性之间的相互关系。,复杂型多媒体数据模型,表述一类结构较为复杂、可以进行某种意义上模糊查询的多媒体应用。特征:具有复杂的结构,实体之间存在多重联系,查询方式多样。复杂型多媒体数据库主要功能:对多媒体中所包含的物理媒体数据、逻辑媒体数据的统一描述、有效存取和管理;对多媒体数据中包含的多种语义信息进行描述、存取和管理。,智能型多媒体数据模型,具有特殊复杂对象、应用要求相当复杂的系统。特征:对系统的描述具有很高的要求。智能型多媒体数据库主要功能:能够对多种媒体数据进行有效的存储和管理;还能够支持对多种媒体数据的理解以及从中进行知识获取;在知识引导下的查询及其相应智能化的操作和处理。,扩展的关系数据模型,传统的关系数据模型缺少支持多媒体数据库的能力。只是为管理表格字母数字形式的数据设计的,很难实现具有空间关系和时态关系的数据,缺乏演绎和推理操作。最近,关系数据库管理系统开始使用大二进制对象(BLOB)来存储和管理多媒体对象。BLOB可用于图像或其他二进制数据类型的对象。关系数据库中包括BLOB的位置信息,这些信息实际存储在数据库之外的分离的图像或视频服务器上。通过访问这些BLOB,为用户显示完整的数据集。,面向对象模型,面向对象模型是另一种表达多媒体数据库的主要方法,许多多媒体应用中的数据管理都建立在面向对象模型上。面向对象数据库模型类的概念对多媒体数据特别有用。一旦定义了类,所有类中的对象就被赋予了类的属性。类定义在应用软件的开发速度上也有着明显的优势,并且有利于为开发和维护复杂多媒体应用软件提供更完善的功能及更广泛的对象性能。此外,对象数据库的功能,如消息传递、可扩展性、支持分层结构,对于多媒体系统来说也都是非常重要的。,面向对象模型,不足之处:尚无一个统一的标准;缺乏坚实的理论基础;许多实际技术还不够成熟改进之处:增加反映多媒体对象之间时空关系的描述,描述多媒体对象间更深刻的语义。,?,如何表达多媒体信息的内容,多媒体元数据及其生成,多媒体数据往往由多种媒体组合而成。多媒体数据类型不同,表示方式也各不相同。不同的表示形式,其存取方式和绘制方式等各不相同。因此,多媒体数据库还应包括处理不同对象的相关方法库。多媒体数据库与方法库应紧密相关联,以便进行数据对象的组合、分解和变换等操作。所以,多媒体数据应包括数据原始对象(也称数据源)、数据对象的说明(元数据等)以及与对象相关联的方法3部分,媒体对象,如音频、图像及视频,是二进制和非结构化的,因此也不能简单地用数学解析式表示。多媒体数据库必须取得并存取基于这些媒体对象内容的解释,这些解释就成为元数据。元数据可以从媒体信息自动地或者半自动地(或者在一些情况下是手动地)生成。,元数据包含两方面的内容:媒体内部元数据处理媒体内信息的解释。媒体相互间的元数据处理多个媒体和它们相互关系信息的解释。,多媒体元数据分类,内容相关的元数据内容描述的元数据内容无关的元数据,2022/11/9,33,多媒体元数据生成,文本元数据文本元数据可以表示为字符串(即由键盘输入),也可以表示为图像(由扫描仪输入)。若用字符串表示,其最基本的元数据是文本逻辑结构及其展示风格的描述,描述的内容一般可由作者提供,作者提供的不充分的某些部分仍需用自动或半自动的方法识别,例如子标题边界的确定和关键词的提取等。如果文本数据是由扫描仪输入,则生成元数据需要更多的自动或半自动处理,例如行、字、符号、图和表的识别、段落边界的确定、关键词的提取等。,2022/11/9,34,声音元数据在声音媒体中,语音是使用和研究得最多的一种媒体。有限制的语音识别逐步走向实用化。从语音鉴别发言人、按照语调和语气来区别语义和词义也在研究之中。但在普遍情况下,既不限词汇、不限发言人数、不限语法、不限环境和背景,语音识别的效果就不够好,还不能实用化。,2022/11/9,35,通过语音处理和识别,可以获得语音数据的各种语义信息,这是最基本的依赖于内容的语音单元。由于语音识别须要和大量样板语音数据比较,空间和时间的开销都很大。目前,用自动半自动方法提取语音元数据还有一定的困难。,2022/11/9,36,图像元数据图像元数据与图像类型和应用领域有关。例如人像的元数据主要包括人的自然和社会的属性以及人的各部分的特征等;卫星图像元数据主要包括栅格结构、地理位置、地貌特征、地域覆盖(例如国域,省域等)、摄取时间;医学图像元数据主要包括病人属性、检查时间,结构异常部位及特征。,2022/11/9,37,影视元数据影视数据是由一系列帧组成的。影视元数据有些是属于帧一级的,例如某一帧的颜色或灰度特征;有些是属于帧系列级的。帧系列还可以分为多级:即影视级(一部电影或电视节目)、情节级(表示影视中一段连贯的内容),场景级(在一个地点或场地拍摄的内容),镜头级(一次连续的拍摄)。每一级都可能有各自的元数据,例如某个镜头中物体移动轨迹,,?,将怎样进行检索查询,多媒体数据的检索,对常规数据库的检索,最有效的是B+树,可是B+树是一维线性检索,而多媒体数据库面对的是二维以上的N维空间检索,因此B+树就失效了,这里不存在一个能用于不同媒体检索的索引机制,而需针对不同媒体采用不同索引机制。,2022/11/9,40,多媒体数据库查询,数据库查询是数据库系统最重要的功能之一。典型的查询包括如下几部分:需要输出的数据项。可供查询的信息库。查询条件(查询谓词)。根据谓词描述的内容和谓词被指定的方式可用不同的类型对多媒体数据库进行查询。,2022/11/9,41,多媒体数据库查询实例,下面以电影点播(MOD)多媒体数据库系统为例,列举一些多媒体数据库查询的实例。客户能连接到VOD服务器,查询服务器能提供的电影,下载和观看电影。假设VOD服务器能存放电影的如下信息:,2022/11/9,42,(1) 电影的一个影像段。(2) 与影像段相关的声音段。(3) 电影提取的两个重要情节的画面图像。(4) 给出电影的导演、男演员、女演员和其他电影特征的文本。,2022/11/9,43,客户能用许多可能的方式查找VOD数据库。举例如下:查询1:带有计算机动画卡通的电影有哪些?VOD服务应答器回应:VOD服务器显示电影的细节:“Who Framed Rabbit”和“Toy Story”。,2022/11/9,44,查询2:请显示一个卡通主角讲这个句子的电影的细节(这个声音段为:“有人污染了海湾”)。VOD服务应答器回应:服务器显示出有卡通人物Wooody讲过上述句子的电影“Toy Story”的片段。回应包括影像和声音的片段,并带有宣传画和文本信息。,2022/11/9,45,查询3:显示如下影像发生的电影片段:卡通人物Wooody给绿军人员指派了一个监视生日礼物的侦察任务。VOD服务应答器回应:服务器显示所需的电影“Toy Story”的片段,并提供相应的声音、宣传画和文本。,2022/11/9,46,查询4:显示这个电影宣传画面的电影细节(图像描述了卡通人物Jessica Rabbit被扔出动画马车的画面)。VOD服务应答器回应:服务器显示相应电影“Who Framed Roger Rabbit”的宣传画及其细节资料。客户还能进行以上查询的组合查询,不同组合的查询返回的多媒体对象应包括相应的内容。,2022/11/9,47,多媒体数据库的查询类型,多媒体数据的查询可以分为不同类型,主要方式如下。1. 基于多媒体信息内容的查询由于多媒体信息内容已被多媒体对象相关的媒体数据描述了。因此,这些查询是通过对元数据和媒体对象的直接访问进行的。,2022/11/9,48,2. 依据实例查询(QBE)QBE查询就是查找与指定实例对象相似对象的查询过程。用户处理器必须正确指定用户要求匹配例子对象的特性。我们看看下面的查询:“给我和这幅图像相似的图像”。这相似性匹配要求用户必须指定纹理方面、颜色、空间特性(例子图像内的位置)或者图像中提供的对象的形状,也可以全部或部分匹配。对于部分匹配来说,查询处理器必须指定匹配可容错程度。,2022/11/9,49,3. 时间索引查询(Time Index queries)这些查询用来处理媒体对象的时间特性,这些时间特性可用节段树存储。查询处理器采用访问索引信息(用节段树存储)或其他的相似方法来处理时间索引查询。,2022/11/9,50,4. 空间查询这些查询可以去处理和对象有关的空间特性,这些特性可作为媒体信息生成。查询处理器可访问这些媒体数据信息并做出反应。,2022/11/9,51,5. 应用程序指定查询应用程序指定描述可作为元数据信息存储。查询处理器可访问这些信息并做出反应。,该如何处理这些数据呢,?,2022/11/9,53,查询过程的选择,多媒体数据的查询包括引用多媒体对象。对于首先访问哪个多媒体数据库查询处理器有不同的选择。例如下图描述了一个简单媒体文本的查询过程。假定文本信息的元数据存在,那索引文件则首先被访问。以文本文档的选择为根据,通过访问元数据,查询信息就会提供给用户。,2022/11/9,54,2022/11/9,55,当查询媒体超过一个时间段时,查询的进程就可以用不同的方式处理。下图描述了多个媒体的查询进程的一种可能方式:文本和图像。假定图像和文本元数据都是有效的,那查询就可以用下面两种不同的方式处理:,2022/11/9,56,2022/11/9,57,(1) 首先访问和文本有关的索引文件并选择一个原始的文档集。然后检测文档集以确定文档中是否有查询指定的图像对象。这个隐含文档中包含有关图像方面的信息。(2) 首先访问和图像信息有关的索引文件并选择图像集。然后监测与图像相关的信息以确定图像是否是任何文档的一部分。,2022/11/9,58,多媒体数据库查询语言,作为用户查询的一部分,为了选择某个对象还需要计算查询谓词。这些谓词可以由一些布尔操作组成,例如:NOT、AND和OR。查询语言是用来描述查询谓词的,对多媒体数据库应用程序来说,查询语言需要有描述下面谓词的特性:时间谓词。空间谓词。描述举例查询的谓词。应用程序指定谓词。,2022/11/9,59,除了需要描述不同谓词的特性外,查询语言还需要描述不同媒体对象的特性。多种查询语言可用于多媒体数据库应用程序。 SQL和它的各种版本提供了描述多媒体数据库查询的特性。然而,多媒体应用程序有一个很大的需求范围,因此,各类专家研究小组也对其他的查询语言进行了研究。查询语言提供的特性有助于应用程序的查询描述。,2022/11/9,60,1. SQL/MM查询语言SQL/MM查询语言提供了新的数据类型如二进制大对象(BLOBS)、新类型构造器和面向对象的特征。新的内部数据类型是作为抽象数据类型提供的。面向对象附加特性是为了使语言更适合于多媒体数据库应用程序。SQL/MM定义的每个当前状态都由3部分组成:结构框(FRAMEWORD)、全文本(FULL-TEXT)和空间部分(SPATIAL)。下面,我们讨论作为SQL/MM一部分而定义的抽象数据类型。,2022/11/9,61,SQL/MM中定义的抽象数据类型可根据应用程序的需要定义数据类型。在面向对象的系统中,ADT和这种定义对象的方法相似。ADT的定义有两种:结构上和行为上的。结构部分定义了ADT的数据结构,而行为部分则描述了对数据进行的操作。作为行为部分的一部分,每个ADT都定义了内部构造函数。构造函数初始化各种在数据结构部分定义的数据结构。每个ADT也有一个内部析构函数,当ADT被破坏时清除对象。,2022/11/9,62,2. PICQUERY+查询语言PICQUERY+语言是一种用于图示和字符数据库管理系统的查询语言。PICQUERY+在数据库上的主要应用是医学应用。医学数据库应用程序的重要特性包括下面这些内容。,2022/11/9,63,医学数据库的这些特性描述了身体的某些器官是如何在一段时间内发展的:(1) 进化(发展):一个对象的特性是可以在某段时间内发展的。(2) 混合:一个对象可以和其他的对象混合,形成一个具有区别于父母对象特性的一个新的对象。(3) 繁殖:一个对象可以分裂成两个或多个单独的对象。,2022/11/9,64,时间特性描述了数据库对象如下特性:(1) 两个对象之间的时间关系(例如:一个事件跟在另一事件之后)。(2) 一个对象生存的时期或事件发生的时间。,2022/11/9,65,PICQUERY+提供下面的查询操作: 进化谓词指定和对象不同发展阶段的有关约束条件。作为PICQUERY+一部分定义的0进化操作包括:EVOLUES INTO、FUSES_INTO和SPLITS INTO。 作为时间谓词,PICQUERY+指定下列操作:after、before、between、in、overlaps、meets、equivalent、adjacent、follows和precedes。,2022/11/9,66,对于描述和数据空间特性有关的查询包括下面操作:INTERSECTS、CONTAINS,IS COLLINEAR,WITH,INFILTRATES,LEFTOF,RIGHTOF,ABOVE,BELOW,INFRONT OF,BEGIND。 对于描述模糊查询,定义了SLMlLAR操作。,2022/11/9,67,3. VIDEO SQLVIDEO SQL查询语言是OVID系统提供的一种视频对象检索语言。VIDEO SQL有以下语句:,2022/11/9,68,(1) SELECT子句VIDEO SQL的定义和普通的SQL有一定区别,它指定了被检索的OVID对象的类型。CONTINOUS表示视频对象由一个单独的顺序帧组成;INCONTINUOUS则由两个以上的序列帧组成。例如,某个对象可由这样的帧组成:(1,10)和(15,30)。而中间的帧(11,14)不能作为OVID对象的组成的一部分;ANY则有两种类型。,2022/11/9,69,(2) FROM子句指定了视频数据库的名字。(3) WHERE子句描述了由属性/值和比较操作符组成的条件,VIDEO帧数量也被作为条件的一部分指定。,2022/11/9,70,条件指定如下的例子:ATTRIBUTE IS VALUE/VIDEO OBJECT。条件描述了已指定属性值或VIDEOOBJECT的视频对象。ATTRIBUTE 包含 VALUE/VIDEO OBJECT。条件描述了在一属性集中包含有某一指定值的视频对象。DEFINEDOVER VIDEO SEQUENCE,VIDEO FRAME。条件表示被定义的视频对象不在指定的VIDEO序列或帧里。,2022/11/9,71,多媒体数据库管理系统,多媒体管理系统属于预先编排类多媒体应用,通过查询存取和控制存储的对象。由于各种媒体对象的不同特征,这种存储和基于查询的存取模式显得更复杂。影响多媒体数据库管理系统需求的媒体特性是:对象的大小、实时特性、信息的原始和非解释性。,2022/11/9,72,多媒体数据库视图,(1) 物理存储视图:存储媒体对象。物理存储视图描述如何在文件系统中存储多媒体对象。由于多媒体对象特别巨大,它们的存储和检索需要不同的技术。(2) 概念数据视图:对原始信息的解释。概念数据视图描述由媒体对象物理存储表示层生成的解释。这一视图同时用于处理如何通过索引机制提供快速存取问题。,2022/11/9,74,(3) 媒体对象和用户的物理位置:媒体对象可以存储在不同的系统中,用户可以在计算机网络上存取存储的数据(4) 过滤视图:查询数据库。用户可以用不同的方法查询多媒体数据库,这取决于他们所需要的信息的类型。这些查询为用户提供一个多媒体数据库的过滤视图,用户仅需检索所需的对象。,2022/11/9,75,(5) 用户视图:多媒体数据库应用与用户之间的接口。该显示描述了如何将数据库中提取出来的对象正确演示出来,为多媒体数据库应用及用户之间提供了一个接口。,