基于麦克风阵列的声源定位技术论文07647.doc
《基于麦克风阵列的声源定位技术论文07647.doc》由会员分享,可在线阅读,更多相关《基于麦克风阵列的声源定位技术论文07647.doc(43页珍藏版)》请在三一办公上搜索。
1、毕业设计说明书基于麦克风阵列的声源定位技术基于麦克风阵列的声源定位技术摘 要声源定位技术是利用麦克风拾取语音信号,并用数字信号处理技术对其进行分析和处理,继而确定和跟踪声源的空间位置。声源定位技术在视频会议、语音识别和说话人识别、目标定位和助听装置等领域有着重要的应用。传统的单个麦克风的拾音范围很有限,拾取信号的质量不高,继而提出了用麦克风阵列进行语音处理的方法,它可以以电子瞄准的方式对准声源而不需要人为的移动麦克风,弥补单个麦克风在噪声处理和声源定位等方面的不足,麦克风阵列还具有去噪、声源定位和跟踪等功能,从而大大提高语音信号处理质量。本文主要对基于多麦克风阵列的声源定位技术领域中的基于时延
2、的定位理论进行了研究,在此基础上研究了四元阵列、五元阵列以及多元阵列的定位算法,并且分别对其定位精度进行了分析,推导出了影响四元、五元阵列目标方位角、俯仰角及目标距离的定位精度的一些因素及相关定位方程,并通过matlab仿真软件对其定位精度进行了仿真;最后在四元、五元阵列的基础上,采用最小二乘法对多元阵列定位进行了计算;通过目标计算值和设定值对比,对多元阵列的定位精度进行了分析,并得出了多元阵列的目标定位的均方根误差。关键词:麦克风阵列,声源定位,时延,定位精度,均方根误差Based on Microphone Array for Sound Source Localization Resea
3、rchAbstractSound source positioning technology is to use the microphone to pick up voice signals, and digital signal processing technology used for their analysis and processing , Then identify and track the spatial location of sound source. Acoustic source localization techniques have a variety of
4、important uses in videoconferencing, speech recognition and speaker identification, targets direction finding, and biomedical devices for the hearing impaired. The pick up range of traditional single microphone is limited, the signal quality picked up is not high, then a voice processing methods wit
5、h the microphone array has been proposed . It may be electronically aimed to provide a high-quality signal from desired source localization and does not require physical movement to alter these microphones direction of reception. Microphone array has the functions of de-noising, sound source localiz
6、ation and tracking functions, which greatly improved the quality of voice signal processing. The article discusses some issues of sound source localization based on microphone array, On the basis ,it studies a four element array,five element array and an multiple array positioning algorithm, then th
7、e positioning precision is analyzed. Derived some factors of the azimuth and elevation angle targets the target range of the estimation precision affected and positioning equation. And through MATLAB simulation software for its positioning accuracy of simulation. finally ,based on four yuan, five yu
8、an of array, using the least square method ,the multiple array localization were calculated. Through the contrast of the target value and set value, multiple array positioning accuracy is analyzed, and the of diverse array target positioning.Keywords: Microphone Array, Sound Source Localization, Tim
9、e Delay, Positioning precision , root mean square error目 录1 引言11.1 研究背景和意义11.2 声源定位技术的研究现状及发展 11.2.1 研究历史和现状11.2.2 发展趋势21.3 麦克风声源定位技术31.4 本文所要研究的内容42 声学理论基础知识52.1 空气的物理特性52.2 声波的物理特性52.3 声波在空气中的传播特性82.4 声源定位原理92.5 本章小结103 基于时延估计的声源定位算法及其精度分析113.1 时延估计算法概述113.2 基于时延估计的声源定位的研究分析113.2.1 四元阵列定位算法123.2.2
10、 五元阵列定位算法153.3 四元阵列的定位精度分析及其仿真153.3.1 方位角精度分析及仿真173.3.2 俯仰角精度分析及仿真193.3.3 距离估计精度分析及仿真213.4 五元阵列的定位精度分析及其仿真233.4.1 方位角精度分析及仿真233.4.2 俯仰角精度分析及仿真253.4.3 距离估计精度分析及仿真263.5 本章小结284 多元麦克风阵列声源定位分析294.1 多元麦克风阵列定位方程294.2 最小二乘法求声源位置304.3 定位精度分析314.4 结果及计算分析324.4 本章小结335 总结与展望345.1 全文总结345.2 本文的不足之处及后续工作展望34参考文
11、献36致 谢381 引言1.1 研究背景和意义在各种电子设备高度智能化的今天,语音增强与声源定位技术成为语音通信领域中两种不可缺少的技术。例如,在视频会议中,通过声源定位技术控制摄像头,使其自动转向感兴趣的说话人方向;对于高速行驶的车辆,为避免驾驶员用手去接听电话,车载免提电话应运而生1。然而,当车中坐有多个说话人时,语音识别系统就无法辨别实际命令的来源,此时就需要一种定位系统来提取驾驶员方位的语音,进而对其命令作出响应;助听器的出现为有听觉障碍的残疾人提供了帮助,基于阵列的语音增强技术利用声源的位置信息进行空间滤波,可以进一步抑制除说话人以外的其他方向的噪声,使得助听器话音更加清晰。声源的定
12、位在各个领域都有着广泛的应用,尤其是利用传声器阵列的方法,在电话会议、视频会议、可视电话等系统中控制摄像头和传声器阵列波束方向对准正在说话的人,发挥了强大的功能。早在20 世纪七八十年代,声源定位系统就开始被广泛地研究。用于声源定位的传声器阵列具有很强的空间选择性,不需要移动传声器就可以获得移动目标的声音信号,并且能够在一定范围内实现声源的自适应检测、定位及跟踪。这种声源定位技术主要可以分成3 类:第一类是基于最大输出功率的可控波束形成技术,当传声器阵列探测到信号时,对各路信号进行加权求和形成波束,直到得到具有最大输出功率的波束为止;第二类是高分辨率谱估计技术,这类技术需要利用传声器阵列所获取
13、的信号计算空间谱的相关矩阵,运算量大,定位不准确,在实际操作过程中很少采用;第三类是基于声达时间差(time difference of arrival , TDOA) 的定位技术,利用到达阵列上各传声器的声音信号间的时间差未定位声源,这类技术计算量小,比较适用于实时处理,在实际应用中占有很大的比重2。1.2 声源定位技术的研究现状及发展1.2.1 研究历史和现状近年来,传感器和探测技术、微电子技术、信号处理技术以及人工智能技术的飞速发展,均为声探测技术用于直升机等军事目标的定位、跟踪和识别幵辟了新的应用前景,使声探测技术成为一种重要的军事侦察手段和防空作战中反电子干扰和反低空突防的一种有效途
14、径。声探测技术就是利用直升机飞行及坦克行进时的噪声和振动信号,实现对目标的自动探测、跟踪和识别。美英等国研制的声智能雷弹系统,就是采用了这一思想来对付超低空飞行的直升机。采用声复合引信的反直升机、反坦克智能雷弹系统具有独立自主的作战能力。单枚雷弹的杀伤半径将超过100km,与普通雷弹系统相比,极大地提高了武器系统的有效性,如法国的MAZAC反坦克雷弹,单枚雷弹的效能相当于60枚普通地雷的综合效能3。因此,智能雷弹系统在构成雷场时所需的弹药数量最少,可以最大限度地减轻战时与和平时期的后勤保障负担,具有显著的作战效益和经济效益。发展这种系统的关键在于,研制一种声或声复合引信,而声阵的布设方法及目标
15、定位、跟踪方法的研究是声引信的核心。和平与发展是当今世界的两大主题,但世界并不太平,一些局部战争不断发生。历史遗留下来的边界和领土争端、南海诸岛的主权争议以及台湾问题等都对我国构成了不安定的因素。一些主要的邻国装备了相当数量性能优良的武装直升机和坦克,并在不断提高其武器装备的现代化水平,已对我国的国家安全构成了潜在的威胁。研究声源定位技术,加强我军反直升机、反坦克武器系统的装备水平,对我国的国防现代化建设具有重要意义。1.2.2 发展趋势声源定位技术是利用声学与电子装置接收目标声场信息以确定目标声源位置的一种技术,能够用于探测武装直升机、坦克、火炮等军事目标的位置,是一种重要的军事侦察手段。其
16、方法可分为被动定位系统和主动定位系统两大类。被动声定位系统属于辐射源无源定位,它具有作用距离远,隐蔽性好等优点。主动声定位系统容易暴露自己,被对方发现,影响系统自身的安全。进行利用声探测技术进行目标识别、跟踪和定位最早见于声呐,由于电磁波在海水中的传播衰减很大,作用距离受到限制,因此,声波被广泛用于水下目标的探测。地面声测产生于第一次世界大战。地面声测侦察在炮兵作战中曾立下汗马功劳,用于确定堑壕战中敌人武器的方位。据统计,在第二次世界大战和朝鲜战争中有75%的火炮侦察任务是利用声测手段完成的。随着雷达、红外、激 光侦察技术的兴起,声测技术曾一度受到冷落。近年来,由于雷达面临着电子干扰、反辐射导
17、弹、低空突防和隐身技术这四大威胁,越来越容易遭受攻击,因此,人们又开始重视被动式声探测系统,重新激起对声探测技术的兴趣4。反坦克等智能武器的研究幵发是必要的、紧迫的,这是对地面防空力量的重要补充。声测系统作为一种传统的侦察手段,近年来通过釆用新技术,提高了性能,满足了现代化战争的需要,其主要特点是:(1)不受通视条件的限制。可见光,激光和无线电侦察器材则需要通视目标,在侦察器和目标之间不能有遮蔽物,而声测系统可以侦察遮蔽物如山,树林等后面的声源。(2)隐蔽性强。声测系统不受电磁波干扰也不会被无线电测向及定位,工作隐蔽性强。(3)不受能见度限制。其它侦察器材受环境气候影响较大。在恶劣气候条件下工
18、作时,性能下降,甚至无法工作,声测系统可以在夜间,阴天,雾天和下雪天工作,具有全天候工作的特点。在几十年的发展过程中,声测系统的基本原理和设计变化不大,主要是通过釆用釆用各种现代化技术实现了自动化、集成电路化,提髙了性能。现有的声测 系统一般用热线,碳粒或电容传声器接收声音信号,用无线电技术或光纤技术传输信号,用电蚀纸带或墨水纸带记录测量结果,并把记录仪与计算机相连,用计算机处理测量结果。声测基线采用直线,弧线,正方形等多种形式。目前,声测系统的侦察距离可达30km,精度达到1%,无线电传输方式的展幵时间仅需半小时,可同时测量50多个目标5。目前,这些国家研制的声探测系统都具有战场侦察、目标定
19、位跟踪和敌我识别等综合作战能力,而且它们的研制已经进入了实质性的研制阶段,而我国在这方面的研究仍处于预研阶段,拟釆用的技术手段和途径仍处于可行性探索阶段,与其他国家相比还有很大的差距。1.3 麦克风声源定位技术麦克风阵列是获取高质量语音信号的重要途径。麦克风阵列语音采集系统能在多种环境下(混响、噪声、竞争声源、说话者运动)为后继的语音识别系统和编码系统等提供高质量的语音数据,而且还能定位声源位置和跟踪声源运动。准确的声源定位能引导麦克风阵列增强感兴趣的语音,同时抑制干扰语音和噪音。声源定位技术是利用声学与电子装置接收目标声场信息以确定目标声源位置的一种技术。麦克风阵列的声源定位是指用麦克风阵列
20、拾取声音信号,通过对多路声音信号进行分析与处理,在空间域中定曲一个或多个声源的平面或空间坐标,即得到声源的位置,以进一步控制摄像机和麦克风阵列波束对准正在说话的人。基于麦克风阵列的声源定位在视频会议、声控机器人、车载电话系统和语音导航系统、智能空间中的人机交互、声源的实时跟踪和监控等诸多领域具有广泛的应用前景。我们提出了有效的高分辨率多声源定位方法,适用于存在较强混响的环境。目前,基于麦克风阵列的声源定位方法大体上可分为三类:(1)基于子空间的定位技术;(2)基于可控波束形成的定位技术;(3)基于到达时延(TDOA)的定位技术6。TDOA方法首先求出声音到达不同位置麦克风的时延,再利用这些时延
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 麦克风 阵列 声源 定位 技术 论文 07647
链接地址:https://www.31ppt.com/p-4139751.html