【外文翻译】基于组合特征提取的手势识别.doc
《【外文翻译】基于组合特征提取的手势识别.doc》由会员分享,可在线阅读,更多相关《【外文翻译】基于组合特征提取的手势识别.doc(4页珍藏版)》请在三一办公上搜索。
1、原文: Hand Gesture Recognition Based on Combined FeaturesExtraction 基于组合特征提取技术的手势识别摘要:手势在视觉交流上是一个热门的研究领域,主要用于手语识别和人机交互的目的。在本论文中,我们提出了一个通过使用隐马尔可夫模型(HMM 模型)能够实时从彩色图像的序列中识别字母字符(A-Z)和数字(0-9)的系统。我们的系统有三个主要阶段:自动分割和手势区域的预处理、特征提取和分类。在自动分割和手势区域的预处理阶段,通过使用均值漂移算法和卡尔曼滤波,颜色和3D 深度图是用来探测手将出现的轨迹。在特征提取阶段,笛卡尔系统的使用让我们得到
2、三维组合特征的位置、方向和速度。然后,K-均值聚类采用隐马尔可夫模型。最后阶段所谓的分类,Baum - Welch 算法是用来做一个完整的隐马尔可夫模型参数训练。通过使用左-右手型与 Viterbi 算法结合的方法字母和数字的手势被识别。实验表明我们的系统能成功识别手势的概率是 98.33。关键字:手势识别,计算机视觉,图像处理,模式识别1.前言 从手势运动和手势位置得到的手语识别是一个用于人机交互的热门研究领域。一个手势是时空格局,这可能是静态或动态或两者。静态的手被称为姿势,而动态的手称作手势。手势解释的目的是推动人机交互从而使人机交互性能接近人际交往。这是由于手势跟踪存在的复杂性,如手的
3、外观,光照变化,跨手闭塞。这些问题损害了跟踪算法的性能和效率。在过去的十年中,几种方法在先进的手势交互的应用前景12345已经被提出来了,但这些差异在他们的模型中又都不相同。这些模型是神经网络1,隐马尔可夫模型2与模糊系统5。 Liu and Lovell 介绍了一种基于 Camshift 实时算法和复合恒定加速度卡尔曼滤波算法的实时手势跟踪系统。而 Nobuhiko 等人用 HSV 颜色空间来追踪非复杂背景下的手和脸,那里的重叠的手和脸通过先前的手和脸模板匹配能较好地分离开。Comaniciu 等人提出了一种使用均值漂移算法和卡尔曼滤波跟踪从摄像头获得的移动物体的技术,这一技术主要获得了实时
4、跟踪性能。先前的技术没有考虑到许多点,如双手的准确分割组合,包括手和脸重叠的鲁棒性跟踪和系统实时高分辨率的运行能力。 Vassilia 等人开发了一种系统,可以识别孤立和连续的希腊手势语言,其中方向向量是从图像中提取,然后作为参数输入到隐马尔可夫模型在句子中被使用。Ho-Sub 等人介绍了手势识别方法,该方法使用位置,角度和速度的组合特征确定作为输入到隐马尔可夫模型的离散向量。这种方法在字母(A-Z),数字(0-9),六编辑命令和六个绘图元素上可以实现。Nianjun 等人通过使用不同的隐马尔可夫模型的拓扑结构数提出一个方法来识别不同国家的从 A 到 Z 的 26 个字母。但是,这些方法运行在
5、一个非复杂离线背景。 Nguyen 等人提出一个手势识别系统,在这个系统里通过卡尔曼滤波和手斑点分析,以获得手部区域动作的描述来跟踪手势。这个系统对背景聚簇和使用皮肤颜色跟踪和识别手势相当强大。此外该系统用包括美国手语拼写字母和数字的36 个词汇来测试。但是这种方法在我们的系统中研究手的姿势而不是手的运动轨迹。其中有这样一个问题,它提高了手势识别的实时性,是由事实所引起的同样的手势如形状、轨迹和持续时间,甚至是同一个人变化引起的。所以,隐马尔可夫模型是在我们的系统用在它有能力建模时空的时间序列。 本文的主要贡献是研究用于手势识别的位置、方向和速度的组合特征的作用,这个特征是从时空手势路径获得的
6、。此外,它提出了一个能够从三维颜色图像序列中通过使用隐马尔可夫模型模型跟踪单个手势运动轨迹来识别字母字符(A-Z)和数字(0-9)的实时系统。颜色和 3D 深度图是用来检测手。此外,手的轨迹采用均值漂移算法13和卡尔曼滤波14与 3D 深度图结合的办法来确定。手和脸从来自立体相机、高斯混合模型(GMM)的和颜色信息的三维深度图从复杂背景分割出来,这相对于不利的照明和部分遮挡是更强大的。深度信息解决了手和脸重叠问题。该系统是用来自笛卡尔系统的变化的特征在不同的实验上测试以决定哪个特征能得到最好的结果。每个字母和数字用 30 帧测试(20 帧用来训练和 10 帧用来测试)。测试的手势在识别率上有
7、98.33。本文的其余部分如下: 第二部分介绍基本隐马尔可夫模型技术。 第三部分在三个小节中证明这个系统。 第四部分说明实验结果。 最后,第五部分提出总结和结论。2隐马尔可夫模型 马尔可夫模型是一个随机过程的数学模型,它在处理过程中产生一个具有相应概率密度分布的状态序列。一个隐马尔可夫模型是由三元组参数 A B ) ( 表示如下: 一个状态集 S s1 s2 . s N ,N 为常数。 一个初始可能每一状态 i i 12. N ,这样第一步 i P si 。一个 N 到 N 转移矩阵 A a ij ,其中 aij 是从状态 si 到 s j 的转移的可能性; i j N 1和矩阵 A 的每行之
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 外文翻译 外文 翻译 基于 组合 特征 提取 手势 识别

链接地址:https://www.31ppt.com/p-2324824.html