Boosting自下而上和自上而下的视觉特征的显著性估.ppt
《Boosting自下而上和自上而下的视觉特征的显著性估.ppt》由会员分享,可在线阅读,更多相关《Boosting自下而上和自上而下的视觉特征的显著性估.ppt(31页珍藏版)》请在三一办公上搜索。
1、,Boosting Bottom-up and Top-down Visual Features for Saliency Estimation,Boosting 自下而上和自上而下的视觉特征的显著性估计,主要内容,摘要,自由观赏自然场景时,最好的视觉显著模型尽管有显著的最新进展,在预测眼睛注视与人类的表现仍然落后。多数模型是基于低层次的视觉特点,自顶向下的特点的重要性尚未得到充分探讨或建模。在这里,我们结合了低级别的功能,如方向,颜色,强度,以前最好的自下而上的模式,采用自顶向下的视觉认知功能(例如,脸,人类,汽车等)的显著图,使用回归、SVM和AdaBoost分类,从这些特点里学习直接映射
2、这些功能的的眼睛注视。通过广泛的试验三个基准眼球跟踪数据集,使用三种流行的评价分数,我们展示了:我们的Boosting模型优于27个最先进的模型,是迄今为止在注视预测最准确的模型。此外,我们的模型没有如区域分割这样复杂的图像处理,成功地检测到的最显著的一个场景中的对象。,视觉注意的过程中一直是许多心理学,神经科学,计算机视觉等研究的对象。相应地,一些计算模型已经在机器学习,计算机视觉和机器人领域引起关注。几个应用程序也已经被提出,并进一步提出了在这一领域的兴趣,包括:,自动创建拼贴5,视频压缩6 9,非真实渲染8,广告设计10。自下而上的显著性的模型经常被评估,在自由观看任务中,预测人的注视。
3、今天,许多显著性模型基于各种各样令人信服的技术,仍然每年都会有人引进新模型。然而,在预测眼睛注视时,模型和人类间观察员(IO)有很大的差距。IO模型“对于一个给定的刺激的输出,通过整合眼睛注视建成地图,而不是观看那个刺激。该模型预计将提供预测模型的准确度的程度,不同的人可能是对方的最好的预测者。上面提到的模型和人类之间的差距主要是由于自顶向下的因素的作用(参照图1)。,一、介绍,一、介绍,它被认为是自由观看的早期阶段(前几百毫秒),主要是基于图像醒目性的注意,后来,高层次的因素(例如,行动和事件)指导眼球运动5339。这些高层次的因素可能不一定转化为自下而上的显著性(例如,根据颜色,强度或方向
4、),应考虑分开。举例来说,一个人的头部可能在其余的场景中不会特别突出,但可能会引起人们的注意。因此,结合高层次概念和低层次的功能扩展现有模型,并达到人类的表现似乎是不可避免的。,一、介绍,由1的启发,我们提出了三个贡献显著性的学习。首先,我们结合最好的两个方面:自下而上和自上而下的因素。通过比较29个显著性模型,我们整合功能,最好的自下而上的模式已经发现预测与自上而下的因素,如人脸,人,车,等人的注视,培养几个线性和非线性分类从这些功能中的录制品。第二,我们更强调内部零件更准确的显著性检测瞩目的对象(例如,人类上部)。通过大量的实验,我们证明了我们的相结合的方法,超过以前显著的学习方法(1 4
5、8),以及其他最新的方法,在3个数据集上,使用3个评价得分。第三,我们证明了我们的模型能够在一个场景中检测到最突出的对象,接近主流的显著区域检测的表现。,一、介绍,相关工作:显著性模型简介 显著性模型一般可以分为认知(生物)或计算(数学),而有些发生在之间。几款根据Itti等人的自底向上的显著性模型4。这种模型是先执行Koch和Ullman的计算架构基于特征整合理论1516。在这个理论中,图像被分解为低一级的属性,如跨越几个空间尺度,然后归一化和线性或非线性相结合,形成一个主显著图的颜色,强度和方向。这一理论的一个重要组成部分是作为图像区域及其周围环境的独特性,显著性定义中心环绕的想法。这个模
6、型还提出一个合适的架构适应视觉搜索理论和对象检测模型(例如,18)。基于去相关的神经反应,Diaz等人29提出了一种有效的模型被称为自适应白化显著性(AWS)的显著性。Le Meur等33,Marat等36,Kootstra等17提出的模型是其他以认知的调查结果为导向的模型。另有,基于概率模型、基于频率模型等,这里不一一介绍。,一、介绍,与手动设计显著性措施相比,我们按照训练分类的一种学习方式,直接从人眼跟踪数据。其基本思路是的加权组合的功能,其中权重学会从一个大的库对自然图像的眼球运动,可以增强显著性检测比未经调整组合特征映射。学习方法也有容易适用于通过提高要素权重目标对象的可视化搜索的好处
7、。在下面,我们提出了一个朴素贝叶斯公式的显著性估计。让我们是一个二元变量表示的显著位置的图像像素X=(X,Y)与特征向量f,其中“s等于1”表示这个像素是突出的(也就是说,它可以吸引人类的眼睛)和零。像素x的概率是显著的可写为:,二、学习一个视觉显著性的模型,上面的公式是基于假设特点可以出现在所有的空间位置(即,x和f是相互独立的,则p(f|x)=p(f)。我们进一步假设,在S的先验概率(即,位置突出与否)都是平等的。上式右边的第一项测量由于上面的图像的像素的特征的显著性,而第二项措施显著性的基础上的像素的空间位置。我们学习使用p(s|f)分类标注数据(倾向的位置)。我们估计p(s|x):,其
8、中,d(X,X0)是归一化的像素x从中心像素的X0的距离。,二、学习一个视觉显著性的模型,低层次(自下而上)特点传统上,强度,方向和颜色已被用于对静态图像的显著性推导。动态场景(视频),闪烁和运动特点也已经被其他几个低级别的特点(例如,大小,深度和光流)增加5556。在这里,我们先调整每个图像为200200像素,然后提取一组特点,我们使用低级每个像素1,因为他们已经被证明与视觉注意力相关的特点,并有潜在的生物合理性1615。低层次的特点列举如下:13个在4个方向3尺度的可操纵金字塔过滤器的局部特点使用Itti和Koch显著的方法4计算的3强度,方向和颜色(红/绿和蓝色/黄色)对比通道。3个红色
9、,绿色和蓝色通道,以及3个功能相对应的各颜色通道的概率值。5在6个不同尺度中值滤波器滤波的图像的三维颜色直方图计算从上述颜色通道的概率。,二、学习一个视觉显著性的模型,这样产生了30个低级的特点。中心环绕操作需要注意的是,直接施加在地图的某些特点(例如,Ltti特征映射)。虽然在实践中,它是作为一个功能,可以使用任何自下而上的模型,在这里,我们利用Torralba 32,AWS29,GBVS20的模型,因为这些模型具有较高的固定预测能力,采用完全不同的显著性机制的速度,可以计算出从其他低级别的特点。样本图像中提取的特征示于图2。,二、学习一个视觉显著性的模型,二、学习一个视觉显著性的模型,高级
10、别(自顶向下)特点。高级别特点,如人脸和文字14,人车1,对称性17,和体征已建议直接关注。据悉,这些都是通过一个人的一生的时间获得的先验知识一个挑战是检测情感(情绪)的功能和语义(高层次的知识)场景属性,如因果关系和行动的影响力,这被认为是很重要的引导注意力。这些因素都影响眼球固定的位置和持续时间13。我们将我们的功能集包括如下的高级别的功能:。由于摄影师的倾向帧图像和对象水平所形成的水平线。实施由Felzenszwalb的变形部分模型的人和车探测器(DPM)50。使用Viola和Jone代码的人脸检测51。,二、学习一个视觉显著性的模型,从注释的数据,我们注意到,某些地区吸引更多的关注对象
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Boosting 自下而上 自上而下 视觉 特征 显著
链接地址:https://www.31ppt.com/p-5416715.html