毕业设计(论文)视频数据库系统的设计与实现.doc
《毕业设计(论文)视频数据库系统的设计与实现.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)视频数据库系统的设计与实现.doc(31页珍藏版)》请在三一办公上搜索。
1、视频数据库系统的设计与实现摘 要:随着多媒体技术的迅速发展和Internet的日益普及,如何实现对网络上存在的大量视频数据的高效管理已成为多媒体信息处理领域的一个研究热点。本文首先阐述了视频数据库系统的一般结构,然后介绍了如何实现基于内容的视频数据检索,最后分析了视频数据库管理系统的构成,并给出了一种设计方案。关键字:视频数据库;视频分割;内容检索Abstract: With the rapid development of multimedia technology and the growing popularity of the Internet, the network on how
2、to achieve the large number of video data of the efficient management of multimedia information processing has become a hotspot areas. In this paper, a video database system on the general structure, and then on how to achieve content-based video data retrieval, analysis of the final video of a data
3、base management system, and gives a design plan. Keyword: Video database; video segmentation; Retrieval目 录第一章 绪 论2第二章 视频数据库数据模型52.1基于内容检索对视频数据模型的要求52.2视频数据模型62.2.1基于视频分割的数据模型62.2.2基于层次标识的数据模型62.2.3时间描述类模型72.2.4代数视频数据模型72.2.5通用的视频数据框架模型82.2.6扩充的面向对象的视频数据模型82.3视频数据模型及系统设计92.4目前视频数据模型建立中存在的问题102.4 小结11
4、第三章 工具介绍123.1 Delphi简介123.1.2面向对象编程的概念133.2数据库技术143.2.1数据库的基本概念143.2.2关系数据库153.2.3数据库管理系统16第四章 视频数据库系统的结构和关键技术194.1视频数据库系统的基本结构194.2视频数据库管理系统的关键技术204.2.1视频分析与分段204.2.2视频特征提取214.2.3视频数据索引214.2.4视频数据查询224.3视频分割与特征提取224.4视频检索与浏览23第五章 视频数据库中的数据更新255.1数据模型255.2数据更新265.2.1特征的更新265.2.2注释的更新275.2.3 视频段的更新28
5、参考文献29总 结30致 谢31第一章 绪 论目前,多媒体技术正以前所未有的速度蓬勃发展,在人们日常生活中发挥着越来越重要的作用。而视频数据作为包含较多信息内容、较为直观的多媒体信息,应用也越来越广泛。另一方面,随着Internet的日益普及和网络技术的不断发展,视频信息越来越多的出现在网络上,如何实现对这些网络上视频数据的有效管理,已成为多媒体信息处理领域的一个重要的发展方向。随着多媒体和网络技术的迅速发展,多媒体信息越来越多地出现在Web站点上。这就使得人们有机会接触到大量的视频数据,因此如何有效地组织、管理和检索大规模的视频数据库将成为未来的一个研究热点。由于视频数据是一种非格式化、时空
6、并存、数据量大的信息,传统的基于文本的信息查询技术已经能满足人们的要求,而基于内容的检索技术便是解决这一问题的关键技术之一。基于内容的检索技术是指基于信息的内容或特征对多媒体信息进行有效的检索。所谓信息的内容或特征主要是指视频数据中的帧、镜头、运动对象和场景等,图象数据中的颜色、纹理、轮廓和对象等,音频数据中的音调、音色和旋律等。要进行基于内容的视频检索,首先要建立一个合理的视频数据模型,并在此模型的基础上对视频数据进行分割和特征提取,然后对视频数据或镜头进行检索。基于内容的视频检索技术具有广泛的应用领域,如远程监控、多媒体会议、虚拟现实、电视新闻、卫星云图、信息娱乐、交互购物、电影和电视的后
7、期制作等,因此它将对多媒体业产生很大的冲击。由于视频数据信息丰富、结构复杂,与以往的文本数据截然不同,因此当把视频数据引入到传统的数据库中时,就会带来许多问题。视频检索单元的确定、检索特征的提取以及最后实现基于内容的检索,都是传统数据库管理系统所没有考虑过的;此外,视频索引的建立方法、用户界面的设计也都与传统数据库系统有着很大的不同,以上这些问题以及网络的飞速发展引发了我们对基于web的视频数据库管理系统的研究。视频数据库在远程教学、远程医疗、电子商务、数字图书馆、视频监视等领域有广阔的应用前景,在1990年代中期才成为多媒体技术研究的热点之一由于视频数据库技术涉及的理论和技术众多,虽已有一些
8、视频数据库原型问世,但是这一领域还没有形成完整的理论体系,很多方面还没有公认成熟的方法,也没有广泛应用的商业化视频数据库软件平台出现,目前仍处于实验室研究及成果推广阶段.视频数据是指存储声像信息的一类十分特殊的数据,它所传递的信息量远大于静态图像和文字,一般来说,视频数据与文本数据相比具有以下特点1:1)视频数据有较高的信息分辨率.所谓信息分辨率是指媒体提供的细节的多少,如对于一段描述犯罪现场的视频数据,我们可从中分辨出犯罪地点、背景、犯罪人、犯罪工具乃至作案手段等细节.2)视频数据之间关系复杂,是非结构化的数据组织.视频段之间,视频段内的对象之间既有时间上的关系,又有空间上的关系,此外,视频
9、数据还与特定的应用领域有关.3)视频数据解释的多样性及模糊性.它不像字符数值型数据有完全客观的解释,而常常有个人主观的因素.由于视频数据的模糊性,当我们对其进行基于内容的查询时,无法像传统的数据库检索那样采用关键字确切查询一个特定记录,常常只能用相似性进行查询。为了解决基于关键字检索的问题,必须引人基于内容的视频检索技术(content-based video retrieval, CBVR),即根据视频的语义特征进行检索,计算机提取出与特征相符或相似的视频片段,反馈给用户进一步选择.要根据视频特征和语义线索建立视频数据库并从中进行基于内容的检索,则需要在建立数据库时以自动或半自动的方式完成对
10、视频数据特征及语义的描述.这需要综合应用图像处理、图像理解、人工智能和数据库等技术,建立新的视频数据模型,把原始的视频信息以独立的结构化的单元有机地存储起来,采用可靠的查询算法,使用户在智能化查询接口的辅助下完成视频检索工作。建立数据模型是设计基于内容检索的视频数据库的基础和核心.由于视频数据库技术涉及的理论和技术众多,目前还没有表示视频数据模型的经典完善的理论及技术,在这一方面国内研究成果甚微,国外已有不少研究成果,已提出了基于视频分割的数据模型、基于层次标识的数据模型和面向对象的数据模型等几种。目前有许多国内外机构都在进行关于基于内容的检索视频数据库检索的研究。第二章 视频数据库数据模型2
11、.1基于内容检索对视频数据模型的要求 由于视频具有时空两维特性和复杂的逻辑结构,因此,基于内容检索对视频数据模型有以下基本要求: 1)支持多层视频结构抽象:把整个视频在不同的层次上分段,不同的层次从不同的角度反映了视频所包含的信息,这样就形成了视频流的多层抽象.在每一层,允许加人附加信息,使得更容易理解所涉及到的视频信息内容,更好地支持视频浏览,简化视频索引和存储组织。 2)支持时空关系:视频数据模型应能识别不同的物理对象及它们在时间、空间上的关系.不同分段间的时间关系非常重要,它们可能有前后、重叠、相等多种时间关系,且都能用于形式化查询中.空间关系主要反映一个视频段内容各个对象间的位置关系。
12、 3)支持数据独立性:数据独立性是一个DBMS应该提供的基本的透明性.其优点之一是共享和重用视频数据.由于视频数据量非常大,这一点在视频数据库管理系统中是一个关键问题。 4)支持内容索引:内容索引可以用文字或代表帧表示。 5)支持共享和重用:当视频流分为多级结构单元(如镜头、场景)后,用户可能需要以这些基本单元为基础,通过区间投影、合并及重叠等操作运算,形成新的视频流。 根据基于内容检索对视频数据模型的要求可知,目前提出的一些通用多媒体数据模型(扩充关系数据模型、面向对象数据模型、超媒体数据模型)还无法满足基于内容的视频检索的要求。 扩充关系数据模型没有捕捉数据实体之间语义关系、时态关系和空间
13、关系,基于该数据模型的视频数据库系统只能实现视频数据的存取;借助面向对象技术中的对象、属性、方法、封装性、类及其继承性等概念和方法,适合于表达视频数据的内容特征、多级结构和复杂关系,但现有面向对象数据库中所建立的对象模型用于视频数据上存在不足,必须在运算体系、属性继承和共享重用方面进行进一步的研究和扩充.尽管超媒体数据模型能够在一定程度上反映视频之间的语义关系和空间关系,但从本质上说,超媒体是由语义网络加上浏览机制构成的,对视频数据的多级结构抽象、共享和重用的支持不够。2.2视频数据模型2.2.1基于视频分割的数据模型 这种数据模型由Hampapur博士提出,此模型通过研究不同视频数据的应用及
14、生成来作为视频数据模型设计的依据.该数据模型主要使用两种分段标准分割视频数据:语法分段准则和语义分段准则.视频段由起始帧tb和结束帧te定义,并具有n种不同的特征(F1F2,.,Fn),每个特征对应一种特征类型,分别为(W1 ,W2 ,. ,Wn).特征的分类依据是内容依赖性、时间延展性和是否需要标记等原则。此模型中引人了时间关系、图像及视频特征等要素,可较全面地反映视频数据的时空关系及特征,对进行视频编辑处理及建立视频数据库有较大参考价值,但是这一模型并未给出视频数据实体及其间关系的完整表达及描述,只能作为视频数据模型的一种较初级的表达。2.2.2基于层次标识的数据模型 由于基于视频分割的数
15、据模型缺乏灵活性,Swanberg等人提出了基于层次的模型.模型的最底层是镜头(shot),基于内容的镜头描述采用从镜头本身提取的视频特征(如图像、声音等)作为镜头的属性一旦确定了合适的算法,这种描述可以由计算机自动完成,而且由于特征取自视频本身,因此具有较完整的代表性.根据不同镜头的时空相关性,可以从语义上构成场景(scene),多个具有内在联系的场景组成序列(sequence),相关联的序列又组成复合单元。 这种金字塔型的视频数据模型实现数据由细到粗的抽象,对于不同要求的应用都有参考价值。2.2.3时间描述类模型 视频数据的重要特征是具有时间和空间两维结构,将时间维引入模型.Breiten
16、eder在文2中提出一种以时间线为基础的模型,此模型中有四类实体:影片(movie)实体表达由多个信道(tracks)组成的视频信息结构;信道实体是由媒体实体派生而来,每一信道由一种媒体派生,此外此模型允许把信息合成为一组,形成一类中间实体层(layer)实体,实体层支持信道的组合及重用. 时间线模型的优点是为视频用户提供了一类相当明确又直接的表达方式,从时间线上可清楚地看出镜头划分,播放时间等.时间线模型的缺点是采用绝对时间坐标,因此增加视频编辑的复杂性.这类模型从严格意义上还不能算是一个完整的视频数据模型,只能算是一种形象地表现视频数据时间序列及关系的初级形式.此模型中未引人高级抽象,含有
17、的语义很少,并未考虑视频的逻辑结构及视频段之间的层次关系,而且也未包含对视频操作运算机制,无法共享视频素材及生成新的视频流.2.2.4代数视频数据模型 Duda等提出了代数视频数据模型(Algebraic Video Model),这一模型中引人了视频段之间层次关系及视频代数操作,可由原始视频段经视频代数操作生成新的视频流.代数数据模型是可嵌套的层次结构,其基本元素是代数视频结点(Algebraic Video Nodes)及包含在结点上的某些操作.代数视频结点中包含子结点名,子结点可能是一个代数视频结点,也可能是一个原始视频段.原始视频段可用原始视频名及原始视频的一个区间表示.代数视频结点还
18、包含关于其内容的描述信息以及描述其所有子结点播放特征的组合及表现信息.代数视频模型的特点是,模型有视频合成、重用、组织、搜索及浏览等基本功能;可用视频代数把视频的复杂的嵌套逻辑关系模型化;视频代数是本模型的核心,用它可表达视频段的时间依存关系,并可把视频段与描述及表现信息联系起来;支持基于视频内容、逻辑结构及空间组成的存取;代数视频模型的基本功能均统一在基于代数运算的层次模型中;在模型的结点上承载了视频的合成描述、表现、查询及浏览信息,在模型的层次结构上表达了视频的层次、嵌套结构. 由上述特点可看出,代数视频数据模型既包含了视频数据的分段及时间关系,又为视频段提供了描述其内容的特征信息,支持基
19、于内容的检索,还定义了视频表现特征,因此是一个较为完善的模型. 模型的提出者已依照此模型建立了一个原型系统,该系统可以从视频数据中抽取视频属性信息并支持基于内容存取和视频播放,此系统已用电视广播新闻、商业及电影等视频素材进行了试验. 这一模型主要考虑的是视频的编辑和生成,在视频内容索引和查询效率上存在不足,该模型还需进一步改进或补充,如引人超媒体链,以便使用户可链接存在于不同视频集合中的视频结点.2.2.5通用的视频数据框架模型 Hjelsvold提出了一种通用的视频数据框架模型,此模型借助实体 联系图建立了一个较清晰的概念模型,提供了核心的概念及模块;采用视频分段的方法定义视频文档结构,有良
20、好的层次抽象结构,支持镜头、场景、序列及复合单元等多级抽象;模型建立中使用了面向对象技术,每个视频对象都有唯一的对象标识符;模型中引人了视频数据上下文的概念,借助于上下文可把原始视频合成为新视频,并有可能产生新的语义;模型中定义了视频查询代数,可对视频数据进行方便的操作. 通用的视频数据框架模型的出发点是企图建立一种通用的视频数据模型,Video STAR是依据该模型建立起来的一个视频存储及检索实验系统. 该模型的一个缺点是结构较复杂,使用中会受到一定的限制,而且该模型只提出一种框架,在视频对象的封装、继承、共享、索引生成等方面没有进行深人探讨.2.2.6扩充的面向对象的视频数据模型 胡宏斌在
21、其博士论文中提出了一种扩充的面向对象的视频数据模型,该模型中一个视频对象可以是任何一段视频序列,包括视频文档、剧情、场景或镜头,视频对象定义为: O= (OID, I, FOID, COID, V),其中 1) OID是对象标识符,它由中间件对象标识符代理(Video Object Surrogate)来统一管理; 2) I为区间; 3) FOID是直接父对象标识符; 4) COID是直接子对象标识符数组,COID= coid1 , coid2 , , coidn ; 5) V是一n元对,a1;a2;.an,vn,其中aiin是属性名,vi是属性值,属性值可递归地定义为一对象. 该模型的运算体
22、系分为两类,一类是传统数据库系统的运算体系,另一类是视频数据模型所特有的视频合成运算体系.视频合成运算有区间投影运算、视频对象合并运算和视频对象重叠运算.该模型及支持对视频的多级结构抽象,又能够反映其复杂的时空关系,视频对象标识符代理机制可以解决分布式环境下视频对象标识符的分配问题,其分段规则还可以表现视频的多级结构,图结构的类层次可以表现各种类型视频的丰富特征和内容,通过完善的运算体系,这一模型还支持视频对象的共享和重用.该模型在传统的面向对象数据模型基础上进行扩充,可以满足基于内容视频检索的基本要求。2.3视频数据模型及系统设计数据模型是数据库的描述机制,它从不同的角度和级别描述数据库的内
23、容以及数据问的联系方式数据库结构和信息组织方式。其发展已经历了网状模型、层次模型、关系模型和面向对象模型,而进一步的发展趋势将是多媒体数据模型。视频数据模型是视频数据直接面对应用的表述,它也是设计视频数据库的关键环节。通常视频数据可以用帧、镜头和场景来描述。帧是一幅静态的图象,它是组成视频数据的最小单位。镜头是由连续记录的一个或一系列帧组成,它是视频数据的基本结构单元,镜头常用于表示时问和空间续的一个动作。场景是由时问和空问相关的一组镜头构成,它描述的是一个完整的事件。为了视频检索的需要,可将视频数据分割成一个个镜头。所谓镜头是指一个有意义的场景及其描述数据,它包括标识符、区问、属性及其相应值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计 论文 视频 数据库 系统 设计 实现
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-3984801.html