2039.基于DSP56F827的声控收音机.doc
《2039.基于DSP56F827的声控收音机.doc》由会员分享,可在线阅读,更多相关《2039.基于DSP56F827的声控收音机.doc(15页珍藏版)》请在三一办公上搜索。
1、基于DSP56F827的声控收音机摘要: 本文首先介绍了语音识别和软件无线电的基本原理。设计了一种基于语音识别和软件无线电的新型声控收音机。该收音机是以Motorola的DSP56F827为核心,应用HMM模型和超外差式接收原理,本设计具有新颖和便携的特性。文中还简单介绍了Motorola的DSP56F827的特性以及与TMS320C54的区别。关键字:DSP;语音识别;软件无线电;声控收音机Voice Control Radio Based on DSP56827Abstract: At first, the methods of speech recognition and radio s
2、oftware are summarized in this paper. Then a hardware structure of Voice Control Radio, which adopts DSP56F827 as its main CPU, is introduced. This design is very novel and small in size. In the paper, the features of DSP56F827 that are different from TMS320C54 are also introduced. Finally we also g
3、ive the software flow chart in the end. Keywords: DSP; Speech recognition; Radio Software引言语言是人们交流的最直接的方式 ,语音交流的自然与舒适使得人们宁愿用语音界面与计算机交互,而不是通过键盘等低级的方式。尤其是对于中文等双字节表示的语言,输入成了相当一部分人的使用计算机的瓶颈。语音界面能支持很多应用。比如,电话簿查询,数据库语音查询,办公听写系统,甚至机器语音翻译系统等等。这些应用背景促进了五十年代以来自动语音识别的研究。近四十年间,应用一系列的工程方法模板匹配,知识工程,统计模型等,语音识别研究取得
4、了很大进展。软件无线电是最近几年在无线通信领域提出的一种新的通信系统体系结构,它的基本思想是以开放性,可扩展性,结构最简的硬件为通用平台,把尽可能多的通信功能用可升级,可替换的软件来实现。而软件的加载或更新可以通过空中接口实现,所以使用起来更加快捷方便。声控收音机就是用这些原理,在DSP平台上开发的新型的,方便的收音机。其中,DSP是整个设计的核心,主要完成语音识别算法和解调算法。1. 声控收音机的原理1.1语音识别的基本原理语音识别就是研究如何使机器能准确地听出人的语音及其内容,以便控制其它设备来满足人类的各种需要。语音识别的基本方法是预先分析出语音特征,按照要求送给机器储存起来,这个语音参
5、数库称为“模板库”,而这个过程称为“训练”。接着,待识别的语音经过与训练相同的分析,得到语音参数,将它与模板库中的模板一一进行比较,失真最小的那个模板所代表的内容,就是识别结果,这个过程就称为“识别”。一个孤立词识别系统的识别原理可以由图1来表示。图1孤立词识别系统原理框图为了描述一个给定信号的性质,一般可以选择不同的信号模型。信号模型粗略的可以分为确定模型和统计模型两大类。确定模型通常要利用信号的某些已知的特定性质,而统计模型要描述信号的统计性质。统计模型的基本假设是:信号可以用一个参数随机过程来很好的加以描述,而且这个随机过程的参数可以用精确的很容易定义的方法加以确定或估计。考虑到语音信号
6、的种种特点,相比较而言,采用统计模型会较为合适,目前发展最快,使用最广的统计模型就是隐式马尔可夫模型(HMM)。当采用统计模型来描述语音时,设A为待识别语音的声学信号,W为识别基元组成的句子(即基元序列),则语音识别的最终目的可以表示为是求解(1-1)其中是从众多的侯选中找到的识别结果。利用Bayes公式改写上式,有 (1-2) (1-3)因为是在A确定的情况下选W,所以P(A)与W无关。P(W)是语言模型的匹配结果,P(A/W)则是声学模型匹配得来的结果。因此,总体来讲,语音识别的关键技术包括自适应滤波,断点检测,语音建模等。1.2HMM算法在本系统中的应用1.2.1噪声环境中基于短时分形的
7、语音信号端点检测和滤波方法在噪声语音信号的处理中,噪声语音信号中的语音和非语音段的判定,即噪声语音信号的语音端点检测,是语音处理系统中非常重要的工作,也是极其关键的一步工作。因为,在语音分析、语音滤波和增强中,语音信号的模型参数和噪声模型参数以及自适应滤波器中的适应参数都得依赖对应的信号段 (语音段或噪声段 )来计算确定。因此,只有准确地判定语音信号的端点,才能正确地进行语音处理。为了提高起止点检测的准确性,这里提出了一种非线性处理方法,即信号的短时分形维维数(Short-time Fractal Dimension)来进行噪声语音信号的端点检测。二维空间的时间信号图形的分形维数的物理含义是:
8、在平面空间中,设有复杂曲线L(如语音信号波形),以长度为r的直线段去测量L,设需要的线段数为N ,则使得测量值不依赖于r的大小而取有限值的实数d,则称d为平面图形L的分形维维数。即:(C为常数 ) (1-4)亦即: (1-5)由于直接应用(15)式求时间序列信号的分形维维数d是很困难的。因此,一般都将上述平面图形L的分形过程改用盒分形或网格分形。由于网格分形是一种简单实用的图形分形方式,特别适合于计算机进行数字处理,在数字图像和语音处理中也有人进行了研究和应用。将语音信号x(t)数字化为x(i),并将其按一定时间长度进行分帧处理。考虑到语音的特点,在20ms内信号近似平稳。同时又兼顾计算量和信
9、号x(i)的时变性,帧长一般控制在128点左右(分形的理论要求是长度K要长,K),即 ,组成第k帧信号。令 (1-6) (1-7)以及 (1-8) (1-9),分别表示用宽度为及的正方形网格覆盖第k帧信号图形所需要的网格格子数。则x(i)第k帧的短时分形维维数为: (1-10)(1-10)式是用于动态计算x(i)的分形维维数的近似平均算法。设x(i)是数字化的噪声语音信号的时间序列,s(i)和n(i)分别表示语音信号和加性噪声的时间序列:x(i )=s(i)+n(i) (1-11)实际噪声语音处理过程中,(1-11)式的x(i)是唯一能得到的数据信号,s(i)和n(i)是不可分离的。语音端点的
10、检测就是要在可测量和可获得的数据x(i)中判定语音s(i)的起止点(端点)。由于噪声语音信号x(i)在语音段,特别是语音中韵母声音信号期的图形较高频噪声信号(如白噪声)的图形具有较大的周期性和规则性,也就是说语音信号的分形维维数较白噪声的分形维维数要小。所以,信号的短时分形维维数具备噪声语音信号的端点检测能力。白噪声段的分形维维数要比语音段信号的分形维数大,噪声段的分形维维数大约为:dF=1。201578左右,而语音段的分形维维数大约在dF=1。0658911。173043之间。因此,时序信号的短时分形维维数是时域中用于提取信号特征的一种有效方法。一个1阶自回归平滑滤波器的数学表达式为: (1
11、-12)式中,x(i)为噪声语音信号,y(i)是滤波后的输出信号,为平滑滤波的控制参数。在噪声语音的滤波中,参数应根据输入的信号是语音还是噪声进行大小自动调整,即应具有自适应能力,要能根据输入信号的特征动态地调整值。假设参数是x(i)信号的短时分形维维数dF的函数,即。自适应滤波的应随输入信号x(i)的不同帧而不同,即。当滤波器输入信号为噪声时,较大,取值应小,而输入信号处于语音段时,较小,则取值要大。为了使算法应用于DSP,取与的函数关系为分段线性关系,如图2所示。图2中 =1。17作为判定输入信号语音段和噪声段的门限值参数。图2 与的关系1.2.2采用VQ/HMM的自学习语音识别系统隐马尔
12、可夫模型是一个双重随机过程的统计模型,其基本随机过程是隐藏起来观测不到的,另一个随机过程则产生观测序列。设:为观测序列;为状态序列;T为语音长度(以帧为单位);为第i个状态,N为状态数;为第k个码矢,M为量化器阶数;又HMM模型,其中,状态转移概率矩阵,;观测序列分布概率矩阵,。定义:前向概率;后向概率对于语音识别系统,观测序列O就是矢量量化后的结果序列,模型就是有训练语音得到的模板。语音的训练过程就是产生模板的过程,而语音的识别过程就是求出在模板下待识别语音的结果序列O的条件概率。由和的定义可直接得到:。而语音的训练算法则较复杂,目前都采用迭代的方法得到A和B的近似解。迭代公式: (1-13
13、) (1-14)在实际应用中,仅对词条的少数次发音进行训练的语音识别系统,不可能对各种复杂语境下的不同发音都有较高的识别率。某些较陈旧的识别算法如动态时间弯曲法,只能把单词的多次训练发音形成多个模板,造成模板数量成倍增加,影响系统的实时性。而HMM能够对一个词的多个训练序列进行有效的融合而形成一个模板。当训练发音的数量增多时,只会造成训练过程的计算量增大,而不会使识别过程的计算量有丝毫的增加,这对系统的实时性是相当有利的。设K个训练序列:式中是第k个训练序列,计算A和B的迭代公式只要修改如下: (1-15) (1-16)式中作为归一化系数。利用HMM对多训练序列的迭代公式,我们设计一套算法式系
14、统具有自学习的功能。该算法的基本思想是,当发生误识时,系统对误识的模板进行调整,使之更适应使用者的发音习惯,以避免类似的误识再度发生。发生误识时必然牵涉到两个模板,一个是与待识别发音相同的词却被判为不相同的模板;另一个是与待识别发音不相同的词却被判为相同的模板。当发生误识并由用户确认后,系统对两个模板分别进行修正,对于前者的处理较简单,只需将被误识的发音加入到原训练发音群中,再用迭代公式求出新的模板即可;对于后者的处理则较复杂,它的出现必然是因为形成该模板的训练发音群中有一部分与被误识的发音相近,所以修正该模板的主要任务就是删除这部分训练发音。为此先把被误识的发音制成模板,再用该模板与原先模板
15、的各训练发音分别匹配,把匹配程度较好的训练发音删除掉,对剩下的训练发音使用迭代公式形成新的模板即可。1.3软件无线电的基本原理软件无线电的基本思想是;宽带A/D,D/A变换尽可能早地将接收到的模拟信号数字化,最大程度地通过软件来实现电台的各种功能。软件无线电的特点是其完全可编程性。接收时,信号经过处理和变换,由宽带AD数字化,通过可编程DSP模块实现各种所需信号处理,并将处理后的数据送至多功能用户终端。发射时,和上述情况类似。典型的软件 (定义)无线电框图如图3所示。图3采用DSP技术的软件无线电接收机的硬件结构框图1.4 软件无线电实现的关键技术 一个典型可实现的软件定义的数字无线电系统,可
16、以引用数字移动通信中的移动台和基站来进一步分析和说明其实现的关键技术。不论是移动台还是基站,它们都含有宽带天线、多波段射频转换器、宽带A/D/转换器以及通用可编程处理器、存储器、电源以及总线结构等。实现的关键技术可以归纳为宽带射频段、高速中频段、可编程的基带段以及总线控制四大部分1.4.1宽带射频段(1)频段应具有接入多个波段甚至覆盖全波段功能。它具有频率高、带宽宽的两大特点,比如对于GSM,应工作900MHz的高频段,占有带宽25MHz。显然在这样高频率和如此宽的带宽下直接进行数字化处理,目前器件还不具备条件。 (2)目前,只能靠采用传统的高频模拟器件的硬件设备来完成射频段的主要功能。但也不
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2039. 基于 DSP56F827 声控 收音机
链接地址:https://www.31ppt.com/p-4139329.html