数字化语音存储与回放系统.doc
目录摘要1Abstract20 文献综述30.1 语音处理的背景条件30.2 语音处理技术的发展40.3 单片机技术的发展51 引言71.1 课题所具有的现实意义71.2 语音处理技术的发展前景71.3 课题研究任务要求81.4 本文的主要工作内容82 数字化语音存储与回放系统总体设计92.1 系统设计方案对比92.2 系统总体方案确立113 系统硬件设计123.1 话筒123.2 前置放大电路设计133.3 前置带通滤波器设计153.4 A/D转换电路设计163.5 语音编码203.6 单片机电路设计223.7 语音解码233.8 D/A转换电路设计243.9 输出功率放大电路设计253.10 后置带通滤波器设计263.11 键盘263.12 存储器264 系统软件设计275 结论28附录30参考文献31致谢32数字化语音存储与回放系统摘要:本文给出了一种数字化语音存储与回放系统的设计方法,分析了该系统的实现原理并且绘制出电路图。该系统以AT89C51单片机作为核心控制器,外接扩展128kb的RAM存储芯片用来满足对语音信号进行数据存储所需要的空间。语音存储部分利用ADC0809芯片实现对模拟信号的数字化处理,语音回放时则采用ADC0832对数字信号进行数模转换,以还原声音信号。并且通过键盘等接口电路实现人机交互,利用单片机进行全程控制,实现语音存储和回放的功能。采用LD-CELP压缩算法,能够有效的节省存储空间,实现系统的高效率运作。外围电路辅以滤波、功放和增益控制等电路,以确保语音信号的品质。关键词: 单片机 数字化 A/D转换 D/A转换 滤波 功放 Digital Voice storage and restarting systemAbstract: There is a design method about a digital voice storage and playback system in this paper,which analyzes the principle of the system and draws circuit diagrams.The system is based on the AT89C51 single-chip microcomputer extended a RAM memory which owed 128KB storage space to satisfy the design requirement. It uses an ADC0809 chip to achieve analog-to-digital conversion,and on the other hand,it uses a DAC0832 chip to achieve digital-to-analog conversion so that the voice signal can be restored.What is more,we can use an keybord etc. interface circuit to realize human-machine interaction and use SCM to control the process in order to complete voice storage and playback function.It uses the LD-CELP compaction algorithm so that it can save the storage space effetively completing the system efficiencily.The external circuit is supplemented by filter,amplifier and gain control circuit to ensure the quality of the voice signal.Key Words:SCM;Didital A/D converter;D/A converter;Filtering;Amplifier0 文献综述0.1 语音处理的背景条件 语言是人与人之间相互沟通的最基本的方法之一,在我们的生活中息息相关。语音处理技术随着信息科学技术的迅速发展,在最近几十年取得了非常巨大的突破,为人类的生活带来了极大的方便。对语音信号处理的研究可以分为四个方面:对语音信号的识别、合成技术以及对其所采用的编码的方法和说话人的认识。这四个方面都在迅猛发展,研究成果斐然,并且在实际应用中得以迅速推广,取得了良好效果。比如:我们能够利用自动语音识别技术制造自动听写机器、利用语音编码技术把一些重要的演讲对话进行高效率的压缩再存储和传播等等。总而言之,研究语音信号处理技术对于我们的现实社会具有相当重要的意义,它能够推动我们人类社会物质文明的不断丰富和发展。更加深入的了解语音处理技术1需要从人体说话的语音开始。人说话的声音就属于语音,概括来说语音主要可以包含四个方面的内容:分别是音色、音长以及音强和音高。声波的频率就是音高,音高在音乐中扮演相当重要的角色,经常可以听到说这首歌曲音调很高,这就是音高,它也可以说成是每秒钟振动的次数;频率在本次设计中是一个相当重要的部分,我们必须控制好频率才能满足系统设计的要求,达到设计目的;音强指声波振幅的大小;音长就是声波在振动的时候所能够持续时间的长短,物理学中经常有用到;音色指声音的特色和本质,即“音质”,音色的好能够对听者产生亲和力,本系统设计时要尽量让回放部分回放的声音音质更好。在日常生活中,20赫兹到20k赫兹是我们的耳朵能够听到的声音频率范围,即为音频信号;80赫兹到3400赫兹是我们能够发出的声音的频率的范围,但是正常的生活中我们发出的声音频率在300赫兹到3400赫兹之间,把这个范围的声音信号称为语音信号。多媒体技术主要处理的是音频信号,不同年龄之间的人对音频信号能听到的频率范围也不一样,一般而言,年龄越大,听力越差。人类用语言交流过程是一个复杂的通信系统,了解语音的定义对于研究语音信号处理技术具有重要的意义,同时对于本系统的设计也具有一定的现实意义。 实现录音放音功能的传统方法是是把利用话筒和录音机等设备,把语音信号先转换成电信号,再转换为磁信号,然后记录在录音磁带上。在回放声音的过程中,我们可以利用放音设备将信号还原为电信号,外接功放来和扬声器以实现声音信号的回放。不过,由于这种记录方法受到电磁影响很大,而电磁感应现象在我们的生活中极为常见,因此在放大和传输模拟信号的过程中,各种噪声和干扰影响难以避免。而在每次重放时音质将发生畸变。到了20世纪末期,数字技术突飞猛进,数字音频技术被广泛的用于实际,出现了数字语音磁带,而且在价格上也不断降低,市场接受程度越来越好。在此之后,我们进入了数字信息时代,数字化产品不断更新换代与成熟。数字化处理指的是将声音模拟信号首先经过采样、量化、编码过程变为数字信号,然后再进行处理,之后又还原为模拟信号。语音编码技术即是在数字化处理的过程中产生的,其核心工作就是无失真压缩。语音编码技术的成熟使得对数据进行处理越来越方便与简洁,而利用单片机技术就能够对数字信号进行处理。因此,本系统的设计的核心部分是对语音信号的数字化和利用单片机进行控制。语音信号数字化处理以及单片机技术经历了很长一段时间的发展,也取得了非常不错的成就。0.2 语音处理技术的发展语音信号处理技术2的发展历史可以追溯到1876年贝尔发明电话,实现了人类历史上首次采用声电、电声信号转换技术实现远距离的语音通信,为人类历史做出了巨大贡献,为语音信号数字化处理做出了铺垫。20世纪中期,人类在语音发展史上取得了骄人的成绩,按照时间顺序主要有:实现能够通过使用语音参数应用于模拟电路来模仿人体发声,能够简单的进行语音处理;H.Dudley在1939年率先研制出了人类历史上的声码器,这在人类语音信号处理领域具有相当重要的分量,当时整个业界为之震动,它奠定了语音产生模型的基本思想方法;大约过了10年,美国就率先研制出由语谱图自动合成语音的“语图回放机”,虽然这种方式很单调、呆板。但是它在科学研究上仍然具有相当分量的意义;贝尔实验室于1952年研制出了能够识别10个英文数字Audry系统;到了1956年,第一台声控打字机诞生于世。20世纪60-80年代,随着计算机技术日益发展与壮大,数字计算机技术被引入语音识别系统,语音处理技术得以快速发展,线性预测技术被成功的应用于语音编码和语音识别。20世纪末期,超大规模集成电路技术迅速发展,个人计算机迅速普及促使了计算机技术和人工智能技术迅猛发展,人类社会进入数字时代,数字化语音处理技术得以发展。我国的语音识别研究要比国外晚一些,但是同样取得了很大的进展,语音处理技术也取得了不错的成绩。清华大学在1984年为我国汉语识别方面做出了巨大贡献,它成功研制出了能够识别一千个汉字的汉字语音识别系统;四达公司等单位在几年后推出了首批汉语听些产品,实现了汉语语音技术在人们生活中的首次应用。在国家“863”的大力支持下,我国语音信号处理技术已经取得了丰硕的成果,而且随着科学技术的不断前进,语音识别率也不断提升,已达到95%以上。同时,其广泛应用于各个领域,在自动报时、报警、电话查询服务等方面得以广泛应用。0.3 单片机技术的发展单片机是由微机和一些电路集成在一个芯片上,主要包括RAM和ROM以及I/O接口、定时器等。采用单片机作为核心控制器对语音信号进行处理具有非常好的可调性,能够满足不同场合的要求,而且能够有效的简化设计和操作流程提高工作效率。利用单片机作为核心控制器对语音信号进行处理具有非常好的可调性,能够满足不同场合的要求。选择单片机作为本系统的核心控制器,对简化设计和操作流程具有重要意义。按照数据总线的位数,单片机可以分为以下四种:(1)4位单片机,其处理能力比较低但价格也低,主要有NEC公司的75006X系列;(2)8位单片机,它在我们的日常生活中应用范围非常广泛,以MSC-51系列为主要代表。具有很多优点,比如:体积小、功能强、相对价格低等。(3)16位单片机,相较于8位单片机在性能上有比较大的提高,目前Intel公司在这方面具有很高的水平。(4)32位单片机,它是单片机的发展趋势,随着科技的不断发展,32位单片机将越来越成功。其中以ARM单片机最为显着。ARM单片机在目前被广泛使用于各个领域,给我们的生活带来了极大的方便。单片机技术具有广阔的发展前景,可以通过提高CPU的处理能力、增大存储器的容量、采用光刻工艺提高芯片集成度、制作工艺CMOS化等方法来达到目前越来越高的技术要求。近年来单片机技术发展速度相当迅猛,其中尤以51单片机3为核心代表。目前主要使用的型号是89系列,它占有相当的市场,售价便宜,性能良好,能够极大的吸引消费者的目光。目前单片机已经被应用于人类世界的各个领域,无论是工农业生产(主要有机械电子、石油化工等方面)还是人们的日常生活(主要有家电、通讯等方面),而且在国防军事方面单片机技术也占有重要的一席之地。由此可见,我们必须好好利用好单片机技术。1 引言 1.1 课题所具有的现实意义关于数字化语音存储与回放系统的研究对于人类的生产和生活都具有非常重要的现实意义。语言是人与人之间交流的最为基本的方法,它与人类的生活息息相关。语音处理技术伴随着计算机科学技术的不断发展与进步,在近几十年取得了重要的突破,给我们的生活带来了极大的方便。主要成果有:我们所使用的录音机、复读机、MP3等等都利用了语音处理技术。总而言之,研究语音存储与回放技术对于社会信息化具有非常重要的现实意义。1.2 语音处理技术的发展前景随着科学技术的不断前进与发展,关于音频信息不论是总量还是种类都是越来越多,对如此巨大的信息量进行有效的处理、管理和存储也显得越来越重要。就目前的形式看来,音频处理技术已经拥有相当大的市场量并且将在未来相当长的一段时间内都拥有非常广阔的前景。从已经得以实现的技术来看,数字语音通信、高清电视、DVD、多媒体、远程通话等等都为我们的生活带来了极大的方便。从前景展望来看,低码率高质量的音频编码技术对于未来人类实现信息化高速公路的建设具有不可估量的作用。数字化处理技术 4得以如此广泛的应用的根本依据是数字信号具有诸多的优点或者说是便利。数字信号处理系统具有很高的精度,可以达到10-3以上,而且数字信号可以无损的存储与传输,其灵活性、可靠性都不是模拟信号所能比拟的。除此之外,数字部件可以大规模的集成于电路上,并且数字信号处理器件可以同时处理多个通道中的信号。因此,说数字化技术推动了语音处理技术是实至名归。数字信号处理技术的不断提升使得为语音信号的存储和传送创造了良好的条件,而存储器的不断更新换代使得我们对语音产品的开发变得越来越便捷。目前市场上主要使用的存储器是半导体存储器5。半导体存储器经过最近几十年的快速发展,已经具有非常先进的技术水平。从静态随机存储器技术到动态存储器技术,再到嵌入式存储器技术,无不体现出一代一代人类的智慧。未来几十年,半导体存储器的发展方向将到兆兆位,并且使用更加先进的材料,如已经发现的成果有氢离子在二氧化硅结构中可以作为原始载体具有存储的功能,这种方法具有高密度、低功耗等等诸多优点,甚至能够抗辐射。可以预见的是科学技术将会越来越发达,存储技术也必然越来越进步。语音处理技术目前的主要发展方向是数字信号处理技术结合单片机嵌入式技术,利用嵌入式技术能够集成大规模电路在一个很小的芯片上,而单片机具有体积小。功能强大的特性,能够处理好数字信号,数字信号处理技术则是将模拟的语音信号数字化以方便单片机对其进行处理。科学技术在不断进步,人类文明在不断更新,在这个信息化社会中,语音处理技术已经取得并将更加取得辉煌成就。人与人之间的交流将更加频繁,语音处理技术也将越来越重要。纵观语音处理技术的发展历程,可以发现语音信号处理技术一直朝着数字化方向,利用集成化芯片进行处理。因此,可以预计,语音信号处理技术将会朝着体积越来越小化、功能越来越强化、使用越来越方便化。我们的生活将会越来越简便化。1.3 课题研究任务要求本次课题任务要求综合利用本专业所学知识,设计出一个数字化语音存储与回放系统,其基本要求如下:(1) 前置放大器和末级放大器的增益均为40dB。(2) 带通滤波器的通带要求在300Hz到3400Hz之间。(3) 模数转换(A/D):采样频率fs=8kHz,字长=8位。(4) 数模转换(D/A):变换频率fs=8kHz,字长=8位。(5) 对语音信号进行存储的时间长度不小于10秒。(6) 尽量保证音质。1.4 本文的主要工作内容本次课题主要设计通过利用89C51单片机、滤波放大电路、模数转换(A/D)电路、数模转换(D/A)电路等来实现对语音信号的存储与回放功能,采用低延时码激励线性预测(LD-CELP)编解码方案,能够有效地增加语音存储时间。具体设计过程就是:利用麦克风对语音信号进行采集,将语音信号变成电信号。然后通过运算放大器对信号进行放大。经过带通滤波器滤波,利用A/D转换对模拟的信号进行模数转换将使其变为数字的信号,对信号进行编码压缩后接入单片机对信号进行处理,存储到存储器中。语音回放时则刚好相反,经解码后通过数模转换、滤波和放大再输出,还原成声音信号。本文的工作内容在硬件上,就是几个电路的设计;软件上,则是要求完成系统的软件流程图的设计。2 数字化语音存储与回放系统总体设计2.1 系统设计方案对比 本系统的设计方法主要有以下几种:一种是传统的磁带录音技术,另外一种是利用语音芯片实现录音,还有一种方法就是利用单片机加上A/D、D/A转换芯片等实现对语音信号的录放功能。传统的录音放音技术6主要工作原理是:利用话筒和录音机把语音信号依次转换成模拟电压信号和磁信号,并且在录音磁带等磁体媒介上记录。在语音回放的时厚,我们利用录音机等设备来实现磁信号对模拟电压信号的还原,外加功放来推动扬声器使声音信号回放出来。不过,考虑到这种记录方法受到电磁影响很大,会有各种噪声和干扰影响。在每次重放时磁带的频率特性会发生改变,对音质将产生较大影响。这种以声波信号自有形态直接加以记录和传输的模拟方式的音质依赖于所使用的材料与器件。如果使用非常好的材料和器件来保持音质,所耗费的资源和资金将会非常昂贵,而且这种音质的提升也是十分有限的。直到20世纪后期,数字技术飞速发展,人类将数字音频技术用于实际,推出了数字语音磁带。数字音频技术指的是将声音模拟信号经过采样、量化、编码过程变为数字信号,然后再进行处理,将数据存储于存储器上;在回放语音信号的时候,数字信号变成模拟信号实现还原。语音编码技术在很大程度上丰富了我们的生活,它和嵌入式的联合让语音处理变得轻松。近年来,随着语音识别算法的不断深入研究和集成电路技术的不断发展,语音识别芯片取得了巨大成功,被广泛应用于消费类电子产品中。按照性能和算法的不同,它的分类方法也不同,近期较为先进的语音芯片为语音识别系统级芯片7SOC,它单片机和一大堆电路集成,主要包括的电路有:A/D和D/A转化电路以及预放、功放等电路,只需要外加电源等设备就能够实现对语音信号的识别、合成和回放等功能,具有体积小、性价比高的优点。目前市场上典型的语音识别专用芯片为ISD公司开发的ISD系列的芯片。但是采用语音芯片有一个非常大的缺陷就是缺乏灵活性、不能广泛使用于多个场合。与此同时,单片机技术应运而生,其灵活性好,而且成本低,极受欢迎。利用单片机作为核心控制器,外接放大滤波电路、A/D转换、D/A转换电路以及存储器等就能够实现对语音信号的存储与回放功能。综上所述,我们排除最传统的方案,提出以下两种方案:方案一:我们可以将单片机作为核心控制器件,外接一些电路(如放大器、滤波器、A/D、D/A、存储器等),来完成语音信号的数字化处理,实现对语音信号的录放功能。语音信号经过通话筒转化成电信号,经语音输入前置放大电路放大,通过带通滤波器滤波(主要是防混叠作用),输出信号经模数转换电路(A/D)转换成数字语音信号送入单片机,单片机对信号进行数据处理,将数字语音信号存储在存储器中,在语音回放时,单片机将数字语音信号从存储器中读出,经数模转化(D/A)将数字语音信号转换成模拟语音信号,经过带通滤波器滤波(主要起平滑作用)、放大器放大后通过扬声器输出,实现语音回放功能。其系统框图如图所示:语音放大器单片机话筒A/D转换带通滤波器扬声器功率放大器带通滤波器D/A转换存储器图1.1 方案一系统基本组成框图Fig.2.1 Oprion one the basic block diagram方案二:可以采用单片机和专用的语音处理芯片结合来实现。系统框图如图所示:单片机语音芯片语音输入语音输出图1.2 方案二系统基本组成框图Fig.1.2 Oprion two the basic block diagram对比上面两种方案,方案二中由于语音芯片具有较多固定的参数,其音质虽好,但可调节性低,缺少灵活性,难以满足多种场合;而方案一具有很好的可调节性,功能更加强大且全面,采用滤波、增益补偿和数据压缩技术可以减少失真保持音质,同时满足存储空间的要求,以达到设计的目的。本次设计采用的是LD-CELP编码方法,它属于波形编码方式。它的基本原理是在时域上对模拟信号进行等速率的抽样,并且将采样后的幅度值分层量化,用代码来表示。在接收的时侯,通过解码所得到的数字序列来恢复到原来的模拟信号,我们可以使其不失真,使用这种方法,语音质量好。2.2 系统总体方案确立 本系统实现的基本理论依据是对语音信号进行数字化后并进行控制,其中的核心技术在于如何保证语音信号的高质量存储与还原,实现系统设计要求的功能。本次课题设计采用方案一的设计方法,其过程可以分为两部分,包括语音的存储部分和语音的回放部分。语音存储过程中,语音信号经过麦克风(也就是话筒)转换成模拟的电信号,然后依次通过语音放大器(起放大作用)、带通滤波器(防混叠的作用)、A/D转换电路(将模拟的语音信号转换成数字语音信号)接入单片机,单片机对语音信号进行处理,将数据存放在存储器上,实现语音存储功能;语音回放的过程:单片机将数字语音信号从存储器上读出,经过D/A转换将数字语音信号还原成模拟语音信号,再通过带通滤波器(起平滑作用)和功率放大器(放大功率的作用),最后接至扬声器输出语音信号,实现语音回放功能。在语音信存储过程中,最重要的部分是对模拟的语音信号进行数字化处理过程,要保证其在此过程中不失真,同时还要满足系统设计要求;而在语音信号回放的过程中主要考虑的是单片机控制电路,选择好芯片以实现系统的功能。当然,为了更好的实现人际互动操作过程,我们将单片机和外设键盘连接,以达到更加方便的效果。本次课程设计系统基本组成结构框图如下:单片机A/D转换D/A转换语音编码语音解码放大电路功放电路前置滤波后置滤波话筒扬声器存储器键盘图2.1系统设计框图Fig.2.1 The basic block diagram3 系统硬件设计3.1 话筒话筒也叫麦克风,学名为传声器,由Microphone翻译而来,也称微音器8。它是录音技术的第一环节,它的质量的优劣直接关系着后边语音回放的时候出来的质量。决定麦克风拾音质量的因素有内部因素和外部因素,内部因素主要有麦克风本身的设计结构,外部因素则与声音的外部环境和麦克风的具体位置有关。因此,我们在系统设计和实现过程中,要做到内外结合,综合考虑,力求做到最佳。麦克风经过了长期的发展,麦克风现今被广泛应用于人们的日常生活之中的各个领域,包括语音通信、文化娱乐、电视台、新闻媒体、多媒体教学甚至医学的某些方面都要用到麦克风。自从十九世界末贝尔发明电话开始,麦克风的发展速度就相当惊人,从49年MD4型麦克风被研制出到61年RF射频电容式麦克风的问世再到78年心型动圈式麦克风的出现,现在它也在进行飞速的更新换代。麦克风的声电转换方有由电阻式、电感式、电容式转换,而且大量新式的麦克风正在呈现出来,当前市场上主流的是电容和驻极体麦克风,很容易就能够买到。麦克风的作用实际上就是一个声电转换器的作用,它的主要工作原理是:声音信号以声波的方式被传感器件接收到,使得能量转换机器产生机械振动,得到电信号输出。它是一种将声音信号转换为电信号的能量转换器件,本系统对话筒的设计要求不是很高,只需要市场上一般的麦克风就能满足设计要求,综合价格因素考虑,使用电容式麦克风。 3.2 前置放大电路设计前置增益放大器:声音信号经过话筒转换成电信号,考虑到转化后的电信号比较微弱不易于对信号进行处理,因而使用运算放大器将语音信号放大。语音信号经过话筒输出的实际范围大约为20到25mV,而A/D转换电路输入信号范围为0到5V,使用运放放大100倍就能满足要求。放大器是能够放大电压或者功率,其在许多方面受到广泛应用,比如:电话通信、语音广播、军用雷达、数字电视等方面。双运算放大器NE5532,它是一个集成电路,相比较于其它的运放,它具有低噪声、高性能的优点。它的合适的电源电压范围为±5-15V,输出驱动能力很强高达600欧姆,信号带宽很小。而且本运放价格也不贵,在实验中使用本运放能够满足实验要求。因此,本次课程设计采用NE5532双运算放大器。本电路使用差分放大电路,能够很好的抑制共模信号。将两个麦克风分别接入差分放大电路的正负端,人说话时只会对其中一个话筒产生语音输入,有用的语音信号会得以保存,而外界的噪音会和另一个麦克风里的相抵消,故而能够达到提高音质的目的。需要注意的是对于差分放大电路的分析9多是在参数理想对称条件下进行的,也就是在对称位置的电阻值完全相等两个运算放大器在任何温度下输入特性曲线以及输出特性曲线都完全一样。事实上,由于实际电阻的阻值误差各不相同、运放的特性参数有分散性,任何实际差分放大电路的参数都不可能理想对称。也就是说,理想对称仅仅只是一种理想状态。但使用差分放大电路对减少外界干扰还是有很积极的作用。本次设计的语音放大电路原理图如图3.1所示。 图3.1语音放大电路图Fig.3.1 Voice amplification circuit diagram该输入级别的电压增益计算公式: (1)可以算出此电路能够将语音信号放大100倍,增益达到40dB满足本系统设计要求。考虑到音频信号经过放大电路放大后的信号声音信号强弱差距悬殊,这时可以接入一个控制电路调节增益的大小。其电路图如图3.2所示。图3.2自动增益控制电路图Fig.3.2 Auomatic gain control circuitAGC电路的主要工作原理是:利用场效应管处于可变电阻区,它的漏级电阻会受到栅极电压的控制。我们可以通过改变它的导通电阻,来调整对信号的放大倍数,以实现对受音频信号放大的控制。具体来说,当接受到的信号很强时,放大倍数会减小;反之,当信号弱时放大倍数增大。采用这种方法,我们就能够比较简单的对增益进行控制。3.3 前置带通滤波器设计前向通道中的滤波器,主要起滤波和防止混叠失真的作用,我们将之称为防混叠滤波器。前向信道中的带通滤波器其通带范围是300Hz到3400Hz,它的上下截止频率之比大约为11远远大于2,它是宽带滤波器,不能够通过使用一般的带通滤波器的方法来实现,但是我们可以通过使用一个低通滤波器和一个高通滤波器级联10的方法来实现。利用Matlab软件仿真最终发现选择巴特沃斯滤波器能够满足系统设计要求,将频带调节为300Hz到3400Hz,最终电路图如图3.3所示。图3.3带通滤波器电路图Fig.3.3 Band-pass filter circuit diagram根据品质因数Q的大小的不同,带通滤波器可以分为窄带带通滤波器(Q>10)和宽带带通滤波器(Q<10),在本次设计的电路中,上限频率fH=3400Hz,下限频率fL=300Hz,品质因数的计算公式: (2)得到Q=0.33,得出 Q <10,所以这个滤波器是宽带带通滤波器。该滤波器能够有效滤除低频分量和高频分量、消除混叠失真,满足系统设计需求。3.4 A/D转换电路设计A/D转换电路的作用主要是对信号进行模数转换。考虑到单片机不能够对模拟的语音信号进行处理,它只能够对数字的语音信号进行处理。信号经过放大滤波进行模数转换就能让单片机对其进行处理。A/D转换是一个非常重要的环节,选择A/D转换器11主要从转换精度、分辨率、量化误差以及转换速率这几个方面考虑。常用的转换方法有:双积分式和逐次逼近型。双积分型具有较高的分辨率、精度和很强的抗干扰能力,但是它的转换速度想比较而言慢一些;逐次逼近型则刚好相反它的特点是速度快、功耗低但同时抗干扰能力差。市场上A/D转换芯片的种类有很多,我们都能够买到,从经济和实用双重考虑,我们选择了0809芯片。主要原因是:考虑到人体发出的声音的频率一般都会小于10kHz,在日常通话中的频率范围一般为300Hz到3400Hz之间,根据奈奎斯特采样定律,要保证语音回放时的音质就需要让语音信号能够不失真的回放出来,那么采样频率必须大于两倍最高频率。在本系统中要求它不能够低于8kHz。本次课程设计采用ADC0809这一大规模集成电路芯片,它属于上面讲的第二种转换器也就是逐次逼近式A/D转换器。12它拥有8位的分辨率,其最大允许的采样频率为10kHz>8kHz,能够满足课题要求。而且本芯片具有三态输出锁存器能够直接与单片机实现信息交换,非常方便。其内部结构图如下所示:图3.4 ADC0809芯片内部结构图Fig.3.4 ADC0809 internal structure diagram语音信号的模数转换过程13,对信号数字化是本系统设计过程中极为重要的一步,在这之前要先进行滤波。它的主要原理是:考虑到声音信号为模拟信号,它在时域上和频域上都是连续变化的,因此,对其数字化处理之前要先进行采样和和量化。采样的过程就是在相同时间间隔内对信号进行抽取样本点,两个样本点的时间间隔叫做采样周期,倒数为采样频率。我们多要进行采样的采样频率定为8kHz,这是考虑到奈奎斯特定律。经过采样后,信号在时间上已经是离散的了。但是我们还需要使得其在幅度上也变得离散化,这就是量化过程,它的主要内容是将整个信号的幅度值分为若干个有限区间,并在每一个区间内取一个幅度值代表这个区间。整个数字化过程可以用以下框图表示:编码数字信号量化模拟信号采样图3.5模数转换过程框图Fig.3.5 Digital process block diagramADC0809芯片14具有8位的分辨率,它所能够允许的最大采样频率为10kHz,而人体说话时语音频率一般小于10kHz,而语音通话频率范围一般为300Hz到3400Hz之间,根据奈奎斯特采样定律,要使得语音信号能够不失真的回放出来,采样频率必须大于两倍最高频率,也就是不能低于8kHz。ADC0809这一大规模集成电路芯片的最大允许的采样频率为10kHz>8kHz,能够满足课题要求,而且它的最大不可以调节的误差范围小于±1LSB具有误差比较小的特点,它的转换时间为100s(时钟为640kHz时)。让单片机引入1MHz的时钟,就能使得ADC0809芯片的采样频率达到8kHz,外接LF398采样/保持电路,以保证ADC芯片在转换时间内保持信号不变。选择LF398采样保持器15主要是考虑到它具有快速采样、高精度、保持能力好的特点,而且他的采样时间小于6s 的时候精度可达0.01 %,能够满足我们设计系统的要求。LF398芯片引脚如下:图3.6 LF398芯片电路图Fig.3.6 LF398 chip circuit diagram引脚说明:V+V-为电源的正负极,Input和Output分别为模拟量输入和输出,Ch为保持电容,SAMPLE为采样、HOLD则为保持,引脚8和7分别为逻辑电平和逻辑参考电平,其主要用途是控制工作方式;当8为低电平信号的时侯,电路就会处于采样状态;反之,电路就会工作在保持状态。语音采样保持电路如下所示:图3.7 语音采样保持电路图Fig.3.7 Voice Sample-and-keep circuit diagram考虑到ADC采样时会出现平顶失真,致使语音信号在恢复时会有孔径失真,高频分量会有损失。因此,采用一阶的RC校正网络,能够对高频分量的失真进行修正,以保证语音回放时的音质。经过计算,取R1和R2的阻值都为1000欧姆,取电容C为0.06微法,可以达到近似校正。其电路图如下:图3.8 幅频校正电路图Fig.3.8 Amplitude-frequency correction circuit diagram3.5 语音编码数字信号具有易于存储和能够长距离传输、无积累失真等优点,并且得以广泛应用。但是,考虑到某些数字信号对存储容量要求过大,会造成高价格成本,因此要对数字信号进行压缩就很有必要。并且,根据实验统计分析表明,存在许多种类的冗余信号,也需要对其进行压缩。语音编码技术应运而生。目前,应用语音编码技术在能够解决在语音通信和语音存储中的很多问题。语音编码技术的主要研究内容是在尽量减少失真的情况下,尽可能高效率的对模拟语音信号进行数字,也就是编码压缩。直接将语音信号抽样量化得到的数字语音信号会占用相当大的存储空间,并且对数据的传输也极为不方便。而利用对语音信号进行编码就能对此状况进行改良,使用更小的空间存储更多的资源。语音编码的评价标准就是比特/秒(bit/s),它是度量编码速率的,它的值的大小是每一个语音采样值所需的编码数与采样频率的乘积。按照所需要的数据速率将语音压缩编码分为五类:高速率(32kb/s以上)、中高速率(16-32kb/s)、中速率(4.8-16kb/s)、低速(1.2-4.8kb/s)和极低速率(1.2kb/以下)。由于单片机只能对数字信号进行处理,我们可以使用语音编码技术能对模拟的语音信号进行编码,使其转化成数字信号,而且也能降低传输码率。目前主要有三种编码方法,分别是:参量、波形和混合编码。16波形编码语音音质比较好,适应能力很强,但其所需的编码速率要求很高,一般为64kb/s16kb/s。参数编码将短时间内声音模型特征可视为近似不变,其编码率低约为2.4kb/s-1.2kb/s,但是它的音质差、自然度低,而且外部对噪声很敏感。混合编码结合以上两者的优点,其编码率较参数编码略有上升,音质提升了许多。本系统的采样频率为8kHz,使用外设存储器对采样信号进行存储。考虑到对数据进行压缩能够减少对存储空间的要求,并且在相同存储空间内可以有效提高对语音信号的存储时间,因此,本系统需要对采样数据压缩。目前主要的编码算法和标准主要有:表1 主要编码方法和算法Tab 1 The main coding methods and algorithms类别算法名称数据率应用质量波形编码PCM均匀量化公共网4.0-4.5APCM自适应量化配合DPCM差值量化32kb/sADPCM自适应差值量化64kb/s参数编码LPC线性预测编码2.4kb/s保密话音2.5-3.5混合编码LD-CELP低延时码激励线性预测16kb/sCD5.0脉冲编码调制(PCM)是使用最广泛,但其数据量也是最大。在信号数字化滤波过程后,用二进制数字信号表示采样后得到的样本的幅度量,串行转换后用串行的脉冲表示,方便信号的处理,这就是脉冲编码调制;增量调制(DM)是PCM编码方法的变形;差分脉冲编码调制(DPCM)是利用相邻信号的相关性,通过估算过去的样本值来预测下一个样本信号的大小,预测值与实际信号值之间有一定的差值,DPCM对这个差值进行编码。事实上,差值信号和实际信号的样本位数样相差甚远,利用这个差距将冗余信号剔除,就能实现数据压缩。G.728 16kb/s低延时码激励线性预测编码是世界上第一个标准化的参数语音CODEC。它以CELP为基础,采用自适应线性预测,总编码延时小于2ms。利用语音编码方式能够更加方便快捷的解决数据传输和存储中遇到的问题,为数字化语音存储与回放系统设计过程中存储器提供了更多的选择空间。综合考虑本系统采用LD-CELP17编码方案,它数据率为16kps,能够有效的增加语音存储时间,并且信噪损失比比较小。编码器原理框图如图3.9所示。+增益+5维矢量码书增益预测器50阶LAP后向LPA