多媒体数据挖掘-2.docx
《多媒体数据挖掘-2.docx》由会员分享,可在线阅读,更多相关《多媒体数据挖掘-2.docx(6页珍藏版)》请在三一办公上搜索。
1、基于多媒体的数据挖掘【摘要】:多媒体挖掘是数据挖掘的一个新兴且富有挑战性的子领域。本文介绍了多媒体数据挖掘的特性,一种适合多媒体挖掘的系统模型,阐述了几种多媒体挖掘方法以及讨论了多媒体数据挖掘在知识服务中的应用。【关键词】:数据挖掘,多媒体挖掘,挖掘方法,服务应用目前,数据挖掘是数据库研究、开发和应用最活跃的分支之一,也是人们一直研究的热点。在数据挖掘近年来研究与应用迅猛发展的过程中,前人取得了一定的成果1。新的和改进的算法不断出现,所考察的数据类型日趋丰富,应用领域逐渐扩大,数据挖掘技术正慢慢融入到多媒体数据库中。多媒体数据库因为其数据量大、数据结构复杂、模式多样等特点一直是人们研究的难点。
2、随着数据挖掘技术应用的成功,人们将目光放到了多媒体数据库中进行知识发现。一、数据挖掘的概念及其结构1、基本概念简单地说,数据挖掘是从大量数据中提取或挖掘知识。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。与数据挖掘相近的同义词有数据融合、数据分析和决策支持等。这个定义包括好几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。数据挖掘是从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和
3、规律表示三个步骤。2、体系结构一个典型的数据挖掘系统的体系结构如下:其中数据库、数据仓库或者是其他一些信息存储媒介为数据挖掘的工作对象;服务器主要是响应数据挖掘引擎的请求,提取相应的数据;领域知识库主要用来指导挖掘的过程,以及用来评价挖掘出来的候选模式;数据挖掘引擎是整个系统的核心部分,可以由以下模块组成:分类模块、关联规则模块、聚类分析模块、时序模块和异常分析模块等;模式评价模块主要是根据一定的度量标准来与数据挖掘模块交互,以使得数据挖掘向着我们感兴趣的方向进行,往往越是高效的数据挖掘系统这种交互影响的程度越高;图形用户界面主要是为方便用户与数据挖掘系统的交互,由用户提出挖掘任务、指定重要的
4、挖掘参数以及由当前返回的结果指导进行更进一步的挖掘工作。二、多媒体与数据挖掘相结合随着多媒体技术的发展,人们接触的数据形式不断地丰富,多媒体数据库的日益增多,原有的数据库技术已满足不了应用的需要,人们希望从这些媒体数据中得到一些高层的概念和模式,找出蕴涵于其中的有价值的知识。这种将数据挖掘技术和多媒体信息处理技术有机地结合起来形成的在多媒体数据中进行知识发现的信息处理方法就是多媒体数据挖掘 。1、多媒体数据挖掘的特性 由于音频视频设备、数码像机、CD- ROM 和因特网的流行和普及,多媒体数据库系统变得日益普通。多媒体数据通常是一种多维的、非结构化或者半结构化的,各媒体数据有着不同的特点,有着
5、各自表述信息的方式,各媒体既可独立表示信息又可共同表示相同事件的不同特征,共同描述事件的存在、发展和结果。因此,多媒体数据集中必定存在关于信息主体的特征、属性以及它们之间的关系,或者存在着某些人们从直观上无法得到的模式。多媒体数据挖掘是一种智能的数据分析,旨在从特定的多媒体数据集中发现必要的结果来用于决策、对策及融合分析。例如在MMMiner(Mult iMediaMiner,多媒体挖掘)中,如查找包含人脸的所有图像,用户界面上就会逐步显示不同国家、不同肤色、不同表情的人脸,而不是显示一些猴脸或者是马脸。由此可见,多媒体挖掘就是从大量的多媒体数据集中,通过综合分析视听特性和语义,发现隐含的、有
6、效的、有价值的、可理解的模式,得出事件的趋向和关联,为用户提供问题求解层次的决策支持能力。22、多媒体数据挖掘的系统模型多媒体挖掘需要一个切实可行的系统框架模型。它的一般系统结构模型如图:3、多媒体数据挖掘的方法31多媒体数据的相似性搜索 对于多媒体数据相似性搜索,主要考虑两种多媒体索引和检索系统:(1)基于描述的检索系统,它基于图像描述(如关键词、标题、尺寸和创建时间等)建立索引和进行对象检索:(2)基于内容的检索系统,它支持基于图像内容的检索,如颜色直方图、纹理、模式、图像拓扑、对象的形状和它们在图像中的布局和位置。基于描述的检索若人工完成是很费力的。若自动完成,则质量较差。例如,关键词到
7、图像的赋值可能是棘手和武断的任务。最近开发的基于web的图像聚类和分类方法提高了基于描述的web图像检索的质量,因为环绕图像的文本信息和web链接信息可以用于提取合适的描述,并将描述相似主题的图像聚合在一起。基于内容的检索使用视觉特征索引图像,并促进基于特征相似性的对象检索,这在很多应用中都是非常期望的。332多媒体数据的多维分析 为便于大型多媒体数据库的多维分析,可以用类似于从关系数据构造传统数据立方体的方法,设计和构造多媒体数据立方体。多媒体数据立方体可包含针对多媒体信息的维和度量,如颜色、纹理和形状。如图是一个简单的图像数据立方体的模型:多媒体数据立方体是一种对多媒体数据进行多维分析的有
8、趣模型, 通过适当的一些操作: 上卷、下钻、切片和切块、转轴(旋转)可以进行强有力的分析。多媒体数据立方体的建立有助于基于视觉内容的多媒体数据的多维分析,和多种知识的挖掘,包括汇总、比较、分类、关联和聚类。33多媒体数据的分类和预测分析分类和预测建模已经用于挖掘多媒体数据,尤其在科学研究中,如天文学、地震学和地理科学的研究。数据分类可通过以下两步来实现:(1)建立描述预先定义的数据类或概念集的分类器: 分类通常是根据媒体数据的某一特性来确定的,该特性在元数据库中表现为视听描述子。通过分析元数据库中部分数据的该描述子值来构造模型,并把用于建立模型的媒体数据作为训练集。训练样本可以随机选取,并预先
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 数据 挖掘

链接地址:https://www.31ppt.com/p-1130861.html