毕业设计（论文）视频数据库系统的设计与实现.doc

上传人：文库蛋蛋多

文档编号：3984801

上传时间：2023-03-30

格式：DOC

页数：31

大小：156KB

《毕业设计（论文）视频数据库系统的设计与实现.doc》由会员分享，可在线阅读，更多相关《毕业设计（论文）视频数据库系统的设计与实现.doc（31页珍藏版）》请在三一办公上搜索。

1、视频数据库系统的设计与实现摘要：随着多媒体技术的迅速发展和Internet的日益普及,如何实现对网络上存在的大量视频数据的高效管理已成为多媒体信息处理领域的一个研究热点。本文首先阐述了视频数据库系统的一般结构,然后介绍了如何实现基于内容的视频数据检索,最后分析了视频数据库管理系统的构成,并给出了一种设计方案。关键字：视频数据库；视频分割；内容检索Abstract: With the rapid development of multimedia technology and the growing popularity of the Internet, the network on how

2、to achieve the large number of video data of the efficient management of multimedia information processing has become a hotspot areas. In this paper, a video database system on the general structure, and then on how to achieve content-based video data retrieval, analysis of the final video of a data

3、base management system, and gives a design plan. Keyword: Video database; video segmentation; Retrieval目录第一章绪论2第二章视频数据库数据模型52.1基于内容检索对视频数据模型的要求52.2视频数据模型62.2.1基于视频分割的数据模型62.2.2基于层次标识的数据模型62.2.3时间描述类模型72.2.4代数视频数据模型72.2.5通用的视频数据框架模型82.2.6扩充的面向对象的视频数据模型82.3视频数据模型及系统设计92.4目前视频数据模型建立中存在的问题102.4 小结11

4、第三章工具介绍123.1 Delphi简介123.1.2面向对象编程的概念133.2数据库技术143.2.1数据库的基本概念143.2.2关系数据库153.2.3数据库管理系统16第四章视频数据库系统的结构和关键技术194.1视频数据库系统的基本结构194.2视频数据库管理系统的关键技术204.2.1视频分析与分段204.2.2视频特征提取214.2.3视频数据索引214.2.4视频数据查询224.3视频分割与特征提取224.4视频检索与浏览23第五章视频数据库中的数据更新255.1数据模型255.2数据更新265.2.1特征的更新265.2.2注释的更新275.2.3 视频段的更新28

5、参考文献29总结30致谢31第一章绪论目前,多媒体技术正以前所未有的速度蓬勃发展,在人们日常生活中发挥着越来越重要的作用。而视频数据作为包含较多信息内容、较为直观的多媒体信息,应用也越来越广泛。另一方面,随着Internet的日益普及和网络技术的不断发展,视频信息越来越多的出现在网络上,如何实现对这些网络上视频数据的有效管理,已成为多媒体信息处理领域的一个重要的发展方向。随着多媒体和网络技术的迅速发展，多媒体信息越来越多地出现在Web站点上。这就使得人们有机会接触到大量的视频数据，因此如何有效地组织、管理和检索大规模的视频数据库将成为未来的一个研究热点。由于视频数据是一种非格式化、时空

6、并存、数据量大的信息，传统的基于文本的信息查询技术已经能满足人们的要求，而基于内容的检索技术便是解决这一问题的关键技术之一。基于内容的检索技术是指基于信息的内容或特征对多媒体信息进行有效的检索。所谓信息的内容或特征主要是指视频数据中的帧、镜头、运动对象和场景等，图象数据中的颜色、纹理、轮廓和对象等，音频数据中的音调、音色和旋律等。要进行基于内容的视频检索，首先要建立一个合理的视频数据模型，并在此模型的基础上对视频数据进行分割和特征提取，然后对视频数据或镜头进行检索。基于内容的视频检索技术具有广泛的应用领域，如远程监控、多媒体会议、虚拟现实、电视新闻、卫星云图、信息娱乐、交互购物、电影和电视的后

7、期制作等，因此它将对多媒体业产生很大的冲击。由于视频数据信息丰富、结构复杂,与以往的文本数据截然不同,因此当把视频数据引入到传统的数据库中时,就会带来许多问题。视频检索单元的确定、检索特征的提取以及最后实现基于内容的检索,都是传统数据库管理系统所没有考虑过的;此外,视频索引的建立方法、用户界面的设计也都与传统数据库系统有着很大的不同,以上这些问题以及网络的飞速发展引发了我们对基于web的视频数据库管理系统的研究。视频数据库在远程教学、远程医疗、电子商务、数字图书馆、视频监视等领域有广阔的应用前景，在1990年代中期才成为多媒体技术研究的热点之一由于视频数据库技术涉及的理论和技术众多，虽已有一些

8、视频数据库原型问世，但是这一领域还没有形成完整的理论体系，很多方面还没有公认成熟的方法，也没有广泛应用的商业化视频数据库软件平台出现，目前仍处于实验室研究及成果推广阶段.视频数据是指存储声像信息的一类十分特殊的数据，它所传递的信息量远大于静态图像和文字，一般来说，视频数据与文本数据相比具有以下特点1:1)视频数据有较高的信息分辨率.所谓信息分辨率是指媒体提供的细节的多少，如对于一段描述犯罪现场的视频数据，我们可从中分辨出犯罪地点、背景、犯罪人、犯罪工具乃至作案手段等细节.2)视频数据之间关系复杂，是非结构化的数据组织.视频段之间，视频段内的对象之间既有时间上的关系，又有空间上的关系，此外，视频

9、数据还与特定的应用领域有关.3)视频数据解释的多样性及模糊性.它不像字符数值型数据有完全客观的解释，而常常有个人主观的因素.由于视频数据的模糊性，当我们对其进行基于内容的查询时，无法像传统的数据库检索那样采用关键字确切查询一个特定记录，常常只能用相似性进行查询。为了解决基于关键字检索的问题，必须引人基于内容的视频检索技术(content-based video retrieval, CBVR)，即根据视频的语义特征进行检索，计算机提取出与特征相符或相似的视频片段，反馈给用户进一步选择.要根据视频特征和语义线索建立视频数据库并从中进行基于内容的检索，则需要在建立数据库时以自动或半自动的方式完成对

10、视频数据特征及语义的描述.这需要综合应用图像处理、图像理解、人工智能和数据库等技术，建立新的视频数据模型，把原始的视频信息以独立的结构化的单元有机地存储起来，采用可靠的查询算法，使用户在智能化查询接口的辅助下完成视频检索工作。建立数据模型是设计基于内容检索的视频数据库的基础和核心.由于视频数据库技术涉及的理论和技术众多，目前还没有表示视频数据模型的经典完善的理论及技术，在这一方面国内研究成果甚微，国外已有不少研究成果，已提出了基于视频分割的数据模型、基于层次标识的数据模型和面向对象的数据模型等几种。目前有许多国内外机构都在进行关于基于内容的检索视频数据库检索的研究。第二章视频数据库数据模型2

11、.1基于内容检索对视频数据模型的要求由于视频具有时空两维特性和复杂的逻辑结构，因此，基于内容检索对视频数据模型有以下基本要求: 1)支持多层视频结构抽象:把整个视频在不同的层次上分段，不同的层次从不同的角度反映了视频所包含的信息，这样就形成了视频流的多层抽象.在每一层，允许加人附加信息，使得更容易理解所涉及到的视频信息内容，更好地支持视频浏览，简化视频索引和存储组织。 2)支持时空关系:视频数据模型应能识别不同的物理对象及它们在时间、空间上的关系.不同分段间的时间关系非常重要，它们可能有前后、重叠、相等多种时间关系，且都能用于形式化查询中.空间关系主要反映一个视频段内容各个对象间的位置关系。

12、 3)支持数据独立性:数据独立性是一个DBMS应该提供的基本的透明性.其优点之一是共享和重用视频数据.由于视频数据量非常大，这一点在视频数据库管理系统中是一个关键问题。 4)支持内容索引:内容索引可以用文字或代表帧表示。 5)支持共享和重用:当视频流分为多级结构单元(如镜头、场景)后，用户可能需要以这些基本单元为基础，通过区间投影、合并及重叠等操作运算，形成新的视频流。根据基于内容检索对视频数据模型的要求可知，目前提出的一些通用多媒体数据模型(扩充关系数据模型、面向对象数据模型、超媒体数据模型)还无法满足基于内容的视频检索的要求。扩充关系数据模型没有捕捉数据实体之间语义关系、时态关系和空间

13、关系，基于该数据模型的视频数据库系统只能实现视频数据的存取;借助面向对象技术中的对象、属性、方法、封装性、类及其继承性等概念和方法，适合于表达视频数据的内容特征、多级结构和复杂关系，但现有面向对象数据库中所建立的对象模型用于视频数据上存在不足，必须在运算体系、属性继承和共享重用方面进行进一步的研究和扩充.尽管超媒体数据模型能够在一定程度上反映视频之间的语义关系和空间关系，但从本质上说，超媒体是由语义网络加上浏览机制构成的，对视频数据的多级结构抽象、共享和重用的支持不够。2.2视频数据模型2.2.1基于视频分割的数据模型这种数据模型由Hampapur博士提出，此模型通过研究不同视频数据的应用及

14、生成来作为视频数据模型设计的依据.该数据模型主要使用两种分段标准分割视频数据:语法分段准则和语义分段准则.视频段由起始帧tb和结束帧te定义，并具有n种不同的特征(F1F2,.，Fn)，每个特征对应一种特征类型，分别为(W1 ,W2 ,. ，Wn).特征的分类依据是内容依赖性、时间延展性和是否需要标记等原则。此模型中引人了时间关系、图像及视频特征等要素，可较全面地反映视频数据的时空关系及特征，对进行视频编辑处理及建立视频数据库有较大参考价值，但是这一模型并未给出视频数据实体及其间关系的完整表达及描述，只能作为视频数据模型的一种较初级的表达。2.2.2基于层次标识的数据模型由于基于视频分割的数

15、据模型缺乏灵活性，Swanberg等人提出了基于层次的模型.模型的最底层是镜头(shot)，基于内容的镜头描述采用从镜头本身提取的视频特征(如图像、声音等)作为镜头的属性一旦确定了合适的算法，这种描述可以由计算机自动完成，而且由于特征取自视频本身，因此具有较完整的代表性.根据不同镜头的时空相关性，可以从语义上构成场景(scene)，多个具有内在联系的场景组成序列(sequence)，相关联的序列又组成复合单元。这种金字塔型的视频数据模型实现数据由细到粗的抽象，对于不同要求的应用都有参考价值。2.2.3时间描述类模型视频数据的重要特征是具有时间和空间两维结构，将时间维引入模型.Breiten

16、eder在文2中提出一种以时间线为基础的模型，此模型中有四类实体:影片(movie)实体表达由多个信道(tracks)组成的视频信息结构;信道实体是由媒体实体派生而来，每一信道由一种媒体派生，此外此模型允许把信息合成为一组，形成一类中间实体层(layer)实体，实体层支持信道的组合及重用. 时间线模型的优点是为视频用户提供了一类相当明确又直接的表达方式，从时间线上可清楚地看出镜头划分，播放时间等.时间线模型的缺点是采用绝对时间坐标，因此增加视频编辑的复杂性.这类模型从严格意义上还不能算是一个完整的视频数据模型，只能算是一种形象地表现视频数据时间序列及关系的初级形式.此模型中未引人高级抽象，含有

17、的语义很少，并未考虑视频的逻辑结构及视频段之间的层次关系，而且也未包含对视频操作运算机制，无法共享视频素材及生成新的视频流.2.2.4代数视频数据模型 Duda等提出了代数视频数据模型(Algebraic Video Model)，这一模型中引人了视频段之间层次关系及视频代数操作，可由原始视频段经视频代数操作生成新的视频流.代数数据模型是可嵌套的层次结构，其基本元素是代数视频结点(Algebraic Video Nodes)及包含在结点上的某些操作.代数视频结点中包含子结点名，子结点可能是一个代数视频结点，也可能是一个原始视频段.原始视频段可用原始视频名及原始视频的一个区间表示.代数视频结点还

18、包含关于其内容的描述信息以及描述其所有子结点播放特征的组合及表现信息.代数视频模型的特点是，模型有视频合成、重用、组织、搜索及浏览等基本功能;可用视频代数把视频的复杂的嵌套逻辑关系模型化;视频代数是本模型的核心，用它可表达视频段的时间依存关系，并可把视频段与描述及表现信息联系起来;支持基于视频内容、逻辑结构及空间组成的存取;代数视频模型的基本功能均统一在基于代数运算的层次模型中;在模型的结点上承载了视频的合成描述、表现、查询及浏览信息，在模型的层次结构上表达了视频的层次、嵌套结构. 由上述特点可看出，代数视频数据模型既包含了视频数据的分段及时间关系，又为视频段提供了描述其内容的特征信息，支持基

19、于内容的检索，还定义了视频表现特征，因此是一个较为完善的模型. 模型的提出者已依照此模型建立了一个原型系统，该系统可以从视频数据中抽取视频属性信息并支持基于内容存取和视频播放，此系统已用电视广播新闻、商业及电影等视频素材进行了试验. 这一模型主要考虑的是视频的编辑和生成，在视频内容索引和查询效率上存在不足，该模型还需进一步改进或补充，如引人超媒体链，以便使用户可链接存在于不同视频集合中的视频结点.2.2.5通用的视频数据框架模型 Hjelsvold提出了一种通用的视频数据框架模型，此模型借助实体联系图建立了一个较清晰的概念模型，提供了核心的概念及模块;采用视频分段的方法定义视频文档结构，有良

20、好的层次抽象结构，支持镜头、场景、序列及复合单元等多级抽象;模型建立中使用了面向对象技术，每个视频对象都有唯一的对象标识符;模型中引人了视频数据上下文的概念，借助于上下文可把原始视频合成为新视频，并有可能产生新的语义;模型中定义了视频查询代数，可对视频数据进行方便的操作. 通用的视频数据框架模型的出发点是企图建立一种通用的视频数据模型，Video STAR是依据该模型建立起来的一个视频存储及检索实验系统. 该模型的一个缺点是结构较复杂，使用中会受到一定的限制，而且该模型只提出一种框架，在视频对象的封装、继承、共享、索引生成等方面没有进行深人探讨.2.2.6扩充的面向对象的视频数据模型胡宏斌在

21、其博士论文中提出了一种扩充的面向对象的视频数据模型，该模型中一个视频对象可以是任何一段视频序列，包括视频文档、剧情、场景或镜头，视频对象定义为: O= (OID, I, FOID, COID, V)，其中 1) OID是对象标识符，它由中间件对象标识符代理(Video Object Surrogate)来统一管理; 2) I为区间; 3) FOID是直接父对象标识符; 4) COID是直接子对象标识符数组，COID= coid1 , coid2 , , coidn ; 5) V是一n元对，a1;a2;.an,vn，其中aiin是属性名，vi是属性值，属性值可递归地定义为一对象. 该模型的运算体

22、系分为两类，一类是传统数据库系统的运算体系，另一类是视频数据模型所特有的视频合成运算体系.视频合成运算有区间投影运算、视频对象合并运算和视频对象重叠运算.该模型及支持对视频的多级结构抽象，又能够反映其复杂的时空关系，视频对象标识符代理机制可以解决分布式环境下视频对象标识符的分配问题，其分段规则还可以表现视频的多级结构，图结构的类层次可以表现各种类型视频的丰富特征和内容，通过完善的运算体系，这一模型还支持视频对象的共享和重用.该模型在传统的面向对象数据模型基础上进行扩充，可以满足基于内容视频检索的基本要求。2.3视频数据模型及系统设计数据模型是数据库的描述机制，它从不同的角度和级别描述数据库的内

23、容以及数据问的联系方式数据库结构和信息组织方式。其发展已经历了网状模型、层次模型、关系模型和面向对象模型，而进一步的发展趋势将是多媒体数据模型。视频数据模型是视频数据直接面对应用的表述，它也是设计视频数据库的关键环节。通常视频数据可以用帧、镜头和场景来描述。帧是一幅静态的图象，它是组成视频数据的最小单位。镜头是由连续记录的一个或一系列帧组成，它是视频数据的基本结构单元，镜头常用于表示时问和空间续的一个动作。场景是由时问和空问相关的一组镜头构成，它描述的是一个完整的事件。为了视频检索的需要，可将视频数据分割成一个个镜头。所谓镜头是指一个有意义的场景及其描述数据，它包括标识符、区问、属性及其相应值

24、集合。每个镜头都有唯一的标识符，每一区问可以由起始帧和结束帧来表示，它代表一个连续的视频帧序列。每个镜头均对应于一个视频帧序列，其内容通过一组属性及其相应值来表示。因此镜头可定义为:(标识符，区问，属性/值或特征值集合)。视频数据库系统是用于管理视频数据并为用户提供面向内容查询的视频软件系统。通常基于内容检索的视频数据库由两个子系统组成，即数据库生成子系统和数据库查询子系统。每个子系统均由相应的功能模块组成，如图1所示。图1视频数据库的系统结构数据库生成子系统包括原始视频流、视频分割、代表帧和特征提取等模块。生成的数据库由视频库和特征库组成，视频库主要包含视频数据或镜头，而特征库包含用户输

25、入的特征和自动提取的内容特征。数据库查询子系统包括查询语言或示例、提取特征、计算相似度等模块。可以说，视频分割、相似性或模糊值是基于内容视频检索的有效方法。2.4目前视频数据模型建立中存在的问题 1)视频数据中各对象之间的空间关系是一个十分复杂的问题，如对象的识别、跟踪都是目前正在研究的问题. 2)由于目前还不具有全自动图像和语音识别系统，数字视频还不能很容易地进行特征内容的抽取. 3)目前关于视频数据独立性的问题、视频数据共享和重用问题还没有得到完全解决. 4)表示视频数据模型的统一理论及方法还没有形成，目前研究者各自从不同的方向对视频数据模型进行讨论，所建立的视频数据模型一般也只反映或视频

26、数据的某一类特征，其应用也侧重于某一领域.5)受目前图像理解、计算机视觉、人工智能等学科发展水平的限制，视频数据自动地分段及抽取视频的高级语义特征还存在不少困难，因此目前不应对视频数据模型提出过高的不切实际的要求，而应以建立有限自动化且应用于某些特定领域的模型为目标。2.4 小结尽管众多数据模型被建立起来，但目前仍没有一个表示基于内容检索的视频数据模型的经典完善的理论和技术.研究者各自从不同的方向对基于内容检索的视频数据模型进行探讨，所建立的数据模型一般也只能反映或强调视频数据的某一类特性，其应用也仅侧重于某一领域.由于视频数据本身的复杂性及应用的广泛性，要建立统一的能广泛应用于多个领域的普遍

27、型模型，还有很长的路要走.但作为数据库技术发展的最新技术，基于内容检索的视频数据库系统虽然只是起步，然而其前景是辉煌的，随着问题的逐步解决，视频数据库系统将在信息社会各领域发挥重要的作用。第三章工具介绍3.1 Delphi简介Delphi的出现打破了V承可视化编程领域一统天下的局面。并且Delphi使用了本地编译器直接生成技术，使程序的执行性能远远高于其它产品生成的程序。它还是真正的面向对象的编程语言。PASCAL语言的严谨加上可视化的优势和强大的数据库功能使得它有充分的资本和微软的VB叫板。许多人当时都认为Pascal 是最有前途的程序设计语言，并预测Delphi将会成为可视化编程的主流环

28、境。Delphi在你编好程序后自动转换成.EXE文件它运行时速度比VB快，而且编译后不需要其他的支持库就能运行。它的数据库功能也挺强的，是开发中型数据库软件理想的编程工具。 Delphi适用于应用软件、数据库系统、系统软件等类型的开发。而且它拥有和VB差不多一样的功能，而且一样能应用API函数，这在控制Windows很有用。 Delphi是全新的可视化编程环境，为我们提供了一种方便、快捷的Windows应用程序开发工具。它使用了Microsoft Windows图形用户界面的许多先进特性和设计思想，采用了弹性可重复利用的完整的面向对象程序语言(Object-Oriented Language)

29、、当今世界上最快的编辑器、最为领先的数据库技术。对于广大的程序开发人员来讲，使用Delphi开发应用软件，无疑会大大地提高编程效率，而且随着应用的深入，您将会发现编程不再是枯燥无味的工作Delphi的每一个设计细节，都将带给您一份欣喜。3.1.1 Delphi的基本形式Delphi实际上是Pascal语言的一种版本，但它与传统的Pascal语言有天壤之别。一个Delphi程序首先是应用程序框架，而这一框架正是应用程序的“骨架”。在骨架上即使没有附着任何东西，仍可以严格地按照设计运行。您的工作只是在“骨架”中加入您的程序。缺省的应用程序是一个空白的窗体(Form)，您可以运行它，结果得到一个空白

30、的窗口。这个窗口具有Windows窗口的全部性质：可以被放大缩小、移动、最大最小化等，但您却没有编写一行程序。因此，可以说应用程序框架通过提供所有应用程序共有的东西，为用户应用程序的开发打下了良好的基础。Delphi已经做好了一切基础工作程序框架就是一个已经完成的可运行应用程序，只是不处理任何事情。您所需要做的，只是在程序中加入完成您所需功能的代码而已。在空白窗口的背后，应用程序的框架正在等待用户的输入。由于您并未告诉它接收到用户输入后作何反应，窗口除了响应Windows的基本操作(移动、缩放等)外，它只是接受用户的输入，然后再忽略。Delphi把Windows编程的回调、句柄处理等繁复过程

31、都放在一个不可见的Romulam覆盖物下面，这样您可以不为它们所困扰，轻松从容地对可视部件进行编程。3.1.2面向对象编程的概念面向对象的程序设计(Object-Oriented Programming，简记为OOP)是Delphi诞生的基础。OOP立意于创建软件重用代码，具备更好地模拟现实世界环境的能力，这使它被公认为是自上而下编程的优胜者。它通过给程序中加入扩展语句，把函数“封装”进Windows编程所必需的“对象”中。面向对象的编程语言使得复杂的工作条理清晰、编写容易。说它是一场革命，不是对对象本身而言，而是对它们处理工作的能力而言。对象并不与传统程序设计和编程方法兼容，只是部分面向对象

32、反而会使情形更糟。除非整个开发环境都是面向对象的，否则对象产生的好处还没有带来的麻烦多。而Delphi是完全面向对象的，这就使得Delphi成为一种触手可及的促进软件重用的开发工具，从而具有强大的吸引力。一些早期的具有OOP性能的程序语言如C+,Pascal,Smalltalk等，虽然具有面向对象的特征，但不能轻松地画出可视化对象，与用户交互能力较差，程序员仍然要编写大量的代码。Delphi的推出，填补了这项空白。您不必自己建立对象，只要在提供的程序框架中加入完成功能的代码，其余的都交给Delphi去做。欲生成漂亮的界面和结构良好的程序丝毫不必绞尽脑汁，Delphi将帮助您轻松地完成。它允许

33、在一个具有真正OOP扩展的可视化编程环境中，使用它的Object Pascal语言。这种革命性的组合，使得可视化编程与面向对象的开发框架紧密地结合起来。3.2数据库技术3.2.1数据库的基本概念管理信息系统的最综实现还需要数据库的支持。数据库顾名思义，就是存储数据的仓库，是计算机系统中存储和处理数据的重要工具。当人们面对一大堆信号和数据记录时，如“产品”信息包括上千种产品的名称、供应商、类别、单价、数量、库存量等。如果将它们无序地存放在计算中，则很难进行筛选、更新、删除、统计等处理。这时人们首先想到的是利用数据库将这些数据存储起来。数据库存取是高度结构化的，它考虑到了各项记录之间、数据之间的关

34、联。可以说一个数据库是一个有机的整体，这便于用户进行统一管理，方便进行查找、检索、统计等操作。还可以方便地将新数据添加进来和将过期的数据删除掉。数据库的性质是由其中的数据模型决定的。在数据库中的数据如果依照层次模型进行数据存储，则该数据库为层次数据库；如果依照网络模型进行数据存储，则该数据库为网络数据库；如果依照关系模型进行数据存储，则该数据库为关系数据库。数据库管理系统所管理的数据，都是依照关系模型进行存储的，因此其数据库为关系数据库。从20世纪60年代起，数据管理进入数据库时代，数据由数据管理系统进行管理。数据库管理系统是为使用数据库而设置的软件。20世纪70年代初，数据库领域出现了数据关

35、系模型，进而关系型数据库以数据的关系模型为基础而诞生。数据库是数据库应用系统的核心和管理对象。所谓数据库，就是以一定的组织方式将数据组织在一起存放在计算机存储器上形成的、能为多个用户共享的、与应用程序彼此独立的一组相关数据的集合。数据库应用系统开发的目标是建立一个满足用户长期需求的产品。开发的主要过程为：理解用户的需求，然后，把它们转变为有效的数据库设计。把设计转变为实际的数据库，并且这些数据库带有功能完备、高效能的应用。数据库技术在计算机软件邻域研究中一直是非常重要的主题，产生于60年代，30多年来数据库技术得到了迅速发展，并已形成较为完整的理论体系和一大批实用系统。并且，近年来，随着Wor

36、ld Wide Web(WWW)的猛增及Internet技术的迅速发展，使得数据库技术之时成为最热门技术之一。数据库由DBMS（数据库管理系统）处理，DBMS则由开发人员和用户通过应用程序直接或间接地使用。它主要包括四个要素：用户数据、元数据、索引和应用元数据。3.2.2关系数据库关系数据库（relation database）是若干个依照关系模型设计的数据表文件的集合。也就是说，关系数据库是由若干张完成关系模型设计的二维表组成的。与文件系统的数据文件不同，我们称一张二维表为一个数据表，数据表包含数据及数据间的关系。一个关系数据库由若干个数据表组成，数据表又由若干个记录组成，而每一个记录是由若

37、干个以字段属性加以分类的数据项组成的。在关系数据库中，每一个数据表都具有相对的独立性，这一独立性的唯一标志是数据表的名字，称为表文件名。也就是说，每一个数据表是靠自身的文件名与其他文件保持独立，一个文件名代表一个独立的表文件。数据库中不允许有重名的数据表，因为对数据表中数据的访问通过表文件名来实现的。关系数据库中各个数据表的独立性，使用户在使用数据表中的数据时，可以简捷、方便地存取和传输。在关系数据库中，有些数据表之间是具有相关性的。数据表之间的这种相关性是依靠每一个独立的数据表内部具有相同属性的字段建立的。一般地，一个关系数据库中会有许多独立的数据表是相关的，这为数据资源实现共享及充分利用，

38、提供了极大的方便。关系数据库由于以具有与数学方法相一致的关系模型设计的数据表为基本文件，不但每个数据表之间具有独立性，而且若干个数据表间又具有相关性，这一特点使其具有极大的优越性，并能得以迅速普及。关系数据库具有以下特点：以面向系统的观点组织数据，使数据具有最小的冗余度，支持复杂的数据结构；具有高度的数据和程序的独立性，用户的应用程序与数据的逻辑结构及数据的物理存储方式无关；由于数据具有共享性，使数据库中的数据能为多个用户服务；关系数据库允许多个用户同时访问，同时提供了各种控制功能，保证数据的安全性、完整性和并发性控制。安全性控制可防止未经允许的用户存取数据；完整性控制可保证数据的正确性、有效

39、性和相容性；并发性控制可防止多用户并发访问数据时由于相互干扰而产生的数据不一致。3.2.3数据库管理系统3.2.3.1数据库管理系统的概念数据库管理系统（DBMS）是指数据库系统中管理数据的软件系统。DBMS是数据库系统的核心组成部分。对数据库的一切操作，包括定义、更新及各种控制,都是通过DBMS进行的。DBMS总是基于某种数据模型，可以把DBMS看成是某种数据模型在计算机系统上的具体实现。根据数据模型的不同，DBMS可以分成层次型、网状型、关系型、面向对象型等。MS SQL Server2000就是一种关系型数据库管理系统。关系模型。关系模型主要是用二维表格结构表达实体集，用外键表示实体间联

40、系。关系模型是由若干个关系模式组成的集合。关系模式相当于前面提到的记录类型，它的实例称为关系，每个关系实际上是一张二维表格。关系模型和层次、网状模型的最大判别是用关键码而不是用指针导航数据，表格简单用户易懂，编程时并不涉及存储结构，访问技术等细节。关系模型是数学化模型。SQL语言是关系数据库的标准化语言，已得到了广泛的应用。DBMS的特点和功能可以分为三个子系统：设计工具子系统、运行子系统和DBMS引擎。设计子系统有一个方便数据库及其应用创建的工具集。它典型地包含产生表、窗体、查询和报表的工具。DBMS产品还提供编程语言和对编程语言的接口。运行子系统处理用设计子系统开发的应用组件。它所包含的运

41、行处理器用来处理窗体和数据库的数据交互，以及回答查询和打印报表等。DBMS引擎从其他两个组件接受请求，并把它们翻译成对操作系统的命令，以便读写物理介质上的数据。DBMS引擎还涉及事务管理、锁、备份和恢复。3.2.3.2创建数据库（一）数据库模式数据库模式定义了数据库的结构、表、关系、域和业务规则。数据库模式是一种设计，数据库和应用正是建立在此基础上的。域是一列可能拥有的值的集合。必须为每一个表的每一列确定域。除了数据的物理格式外，还需要确定是否有些域对表来说是唯一的。数据库模式的最后一个要素是业务规则，它是对需要反映在数据库和数据库应用程序中的业务活动的约束。业务规则是模式的一个重要部分，因为

42、他们指定了无论什么数据变化到达DBMS引擎，允许的数据值必须满足的约束。不管无效的数据变化请求是来自窗体的用户、查询/修改请求还是应用程序，DBMS都应该拒绝。遗憾的是，不同的DBMS产品用不同的方法实施业务规则。在某些情况下，DBMS产品不具备实施必要业务规则的能力，必须以代码形式把它们编入应用程序。（二）数据库设计信息管理系统所涉及的数据库设计分五个步骤：数据库需求分析、概念设计、逻辑设计、物理设计与加载测试。（1）数据库需求分析的任务是将业务管理单证流化为数据流，划分主题之间的边界，绘制出DFD图，并完成相应的数据字典。（2）概念设计的任务是从DFD出发，绘制出本主题的实体关系图，并列出

43、各个实体与关系的纲要表。（3）逻辑设计的任务是从E-R图与对应的纲要表出发，确定各个实体及关系的表名属性。（4）物理设计的任务是确定所有属性的类型、宽度与取值范围，设计出基本表的主键，将所有的表名与字段名英文化（现在很多软件能支持中文字段，如MS SQL Server，我就是用的中文字段名），实现物理建库，完成数据库物理设计字典。（5）加载测试工作贯穿于程序测试工作的全过程，整个录入、修改、查询、处理工作均可视为对数据库的加载测试工作。要设计出一个好的信息管理系统数据库，除满足系统所要求的功能外，还必须遵守下列原则：基本表的个数越少越好。主键的个数越少越好。键是表间连接的工具，主键越少，表间的

44、连接就越简单。字段的个数越少越好。所有基本表的设计均应尽量符合第三范式。数据库的设计中，如何处理多对多的关系和如何设计主键，是两个有着较大难度、需要重点考虑的问题。下面我们着重从SQL应用、数据库设计范式和查询优化等方面来分析本课题的系统关键技术和实现难点并加以解决。第四章视频数据库系统的结构和关键技术4.1视频数据库系统的基本结构传统数据库中的数据为字符或数值,对数据的处理较为单一,结果也只用表格就可以表示,不需要更复杂的数据表现形式。但将视频数据引入到数据库系统后,处理方法发生了很大改变,为了实现对视频数据的插入、处理、检索等操作,视频数据库系统的体系结构应有其自身的特点。目前,无论数据

45、模型还是体系结构,在视频数据库系统领域,都还没有统一的标准。现有的设计方案大多都是针对于某一种情况的具体应用,下面对视频数据库系统的一般结构作简要的介绍。通常,视频数据库管理系统主要包括以下几个组成部分:(1)视频数据库保存原始的视频流,是视频数据的物理存储,由于原始视频数据的数据量一般都非常大,所以通常视频数据库中存储的都是已经压缩过的视频数据。(2)特征数据库保存从视频数据中提取出来的各种特征,用其把视频数据的逻辑位置与物理位置联系起来,此数据库的构造与视频数据库管理系统所支持的查询类型有关。(3)数据插入模块利用此模块用户可以把原始视频数据插入到视频数据库中,同时对原始视频流进行分段,并

46、从视频段中提取出视频特征存储到特征数据库中。 (4)查询处理模块利用此模块用户可以通过不同的查询方式检索视频数据,用户的查询请求可以用专门设计的视频数据查询语言表示,也可以使用示例方式查询表示。这个模块是整个视频数据库管理系统的核心。(5)用户接口模块相对于传统的数据库系统来说,用户接口在视频数据库管理系统中的地位更加重要,良好的用户接口可以让用户准确、方便的表达出他的查询请求,同时又可以把查询结果以更为直观的可视方式表现出来。4.2视频数据库管理系统的关键技术视频数据库管理系统主要功能就是向用户提供基于内容的视频检索。所谓基于内容检索是与以往基于整个视频文件的检索相对应的,它是基于视频数据局

47、部并且与视频语义内容相关的检索。要实现基于内容的视频检索,需要解决以下几个关键性技术:4.2.1视频分析与分段为了实现基于内容的视频检索,在将一段视频流插入到数据库时,需要将其分成若干有意义的单元,如镜头、场景、情节等,这就需要进行视频分析和分段的工作。采用人工视频段是十分繁琐的,但在目前的技术水平下,还只能实现部分的自动视频分段。像基于镜头的较低层次的视频分段可以由计算机自动完成,而对于基于情节的较高层次的分段则还需要由手工来完成。视频分段标准具有多样性和复杂性,一般常用的是基于镜头、场景和情节对视频数据分段,而基于镜头的分段是其它高层次分段的基础,具有非常重要的地位。按镜头分段就是通过检测镜头的变换将一段视频流分成不同的镜头。视频分段从原理上来说主要有两种方法:数据驱动方法和模型驱动方法。由于一个镜头的连续两帧变化不会很大,一般都会控制在某一阈值以内,数据驱动的方法就是检测连续两帧的颜色和亮度等这些特征的差异,如果超过了指定的阈值,就认为这两帧是属于不同的镜头,以此来检测镜头的切换。而模型驱动方