毕业设计(论文)人脸识别系统硬件平台.doc
《毕业设计(论文)人脸识别系统硬件平台.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)人脸识别系统硬件平台.doc(23页珍藏版)》请在三一办公上搜索。
1、目 录摘要11 绪论21.1 人脸识别技术21.1.2 本课题研究的内容21.1.3 DSP 技术在图像处理中的应用22人脸识别系统硬件平台的方案设计32.1系统硬件平台的方案比较32.2系统设计中的关键问题32.2.1 DSP的发展32.2.2 定点 DSP 芯片 TMS320C6414 介绍52.2.3 FPGA芯片的选择63 系统硬件平台的设计73.1 系统硬件平台的框图73.2 视频输入模块设计83.2.1 模拟视频信号的采集83.2.3 AD9883 电路的接法84 系统外部存储器接口的设计94.1 SRAM 的选择94. 2 C6414外部存储器的接口设计104. 3 EMIFA接
2、口扩展104.4 FPGA的配置的方法114.4.1 JTAG接口控制114.5 DSP 代码加载方式124.6 电源模块设计124.7 其它外围电路设计144.8 RS232串口通信模块144.9 D/A转换及VGA显示接口设计155 高速PCB板设计165.1 板级设计的基础理论165.1.1 PCB布局165.1.2 一般的布线规则165.1.3 高速布线规则175.1.4高速电路的过孔设计175.2电源层和地层的设计185.2.1电源和地的分配185.2.2电源和地的布线设计186 主要的工作及难点196.1 本设计的主要工作196.2遇到的难点207结束语20致谢20附录:22摘要
3、本论文讨论了人脸识别的硬件平台的搭建。人脸识别的硬件系统主要包括三个模块:图像采集模块、图像处理模块和数据输出模块。图像采集模块主要由摄像头和图像专用数模转换电路组成。专用图像A/D有三个模拟输入端分别接摄像头的R、G、B,分别转换摄像头输出的三种颜色的模拟信号。由于采集的图像是实时的,所以转换后的数据量非常大,系统使用了两路SRAM,组成“乒乓”式存储方式,采集的图像数据先缓存到其中一个SRAM中,当第一个SRAM存满后立即由FPGA切换到另外一个SRAM中,同时第一个SRAM就会经FPGA被读到DSP中进行处理,DSP把处理过的结果即人脸的生物特征值保存在FLASH存储器中,并把采集来的图
4、像转换到VGA设备上以便实时显示采集到的图像内容,以作监视用。控制信号主要是系统对人脸识别正确与否时的相应提示信号,如语音等。关键词:人脸识别,数字信号处理器(DSP),现场可编程逻辑门阵列(FPGA),图像采集 Abstract: This thesis discusses the hardware platform structures of face recognition. The hardware system of face recognition consists of three main modules: image acquisition module, image pro
5、cessing module and the data output module. Image acquisition module mainly consists of camera and special digital-to-analog converter circuit of images. Special digital-to-analog converter circuit of images includes three analog input terminals that were received R, G, B of camera, and were converte
6、d output of the three colors of the analog signal to digital signal separately. Because the image is a collection of real-time, the conversion of data is very large, the system uses two parts of SRAM, formed a ping-pong memory, the image data collection firstly go to a cache SRAM, when the first one
7、 is full ,the image data switch to another SRAM by FPGA immediately. Meanwhile the first SRAM will be read through FPGA by the DSP processing, DSP store the result of the face value of biological characteristics in the FLASH memory, and convert the image acquisition to the VGA for real-time processi
8、ng of image content, to use for surveillance. Control signal is mainly the face recognition system to correct the corresponding prompt signals, such as speech.Key words: Face Recognition, Digital Signal Processing, Field Programmable Gate Array, Image Acquisition1 绪论1.1 人脸识别技术 计算机人脸自动识别技术是利用计算机分析人脸图
9、像,从中提取有效的识别信息,用来辨识身份的一门技术,它涉及到模式识别、图像处理、计算机视觉、生理学、心理学及认知学等诸多学科的知识。人脸识别技术与指纹识别、虹膜识别等其他基于生物特征的识别技术相比,有其独特的方便性、非接触性及准确性。人脸识别已成为当前模式识别和人工智能研究领域的一个重要课题,在公安刑侦中的罪犯身份识别、身份证件的验证、银行及海关等重要场所的监控、自动门禁系统等领域有着广泛的应用。 人脸识别包括动态人脸识别和静态人脸识别。人脸识别的过程一般可以描述为:给定一个静止或动态图像,利用已有的人脸数据库来确认图像中一个或多个人。目前较多的研究针对的是静态人脸识别,但动态人脸识别相比静态
10、人脸识别有更广阔的应用前景,已成为这一领域发展的一个趋势。1.1.2 本课题研究的内容 由于本课题只研究人脸识别的硬件平台的搭建,关于非常复杂的人脸识别算法,则没有深入地考虑,这便于把更多的精力放在系统硬件平台的设计上。1.1.3 DSP 技术在图像处理中的应用随着 DSP(Digital Signal Processing,数字信号处理)技术的迅速发展,应用 DSP 的领域也越来越广泛。DSP 芯片的诞生更是推动了 DSP 技术在通信、计算机、自动控制、图像处理等领域的大量应用与发展。目前高性能的硬件图像处理系统基本上都是基于 DSP 芯片的。DSP 芯片一般具有如下一些主要特征:(1) 在
11、一个指令周期内可完成一次乘加运算;(2) 程序和数据空间分开,可以同时访问指令和数据;(3) 片内的快速 RAM 通常可以通过独立的数据总线在两块中同时访问;(4) 具有低开销或无开销的循环和跳转硬件支持;(5) 具有在单周期内操作的多个硬件地址产生器;(6) 可以并行执行多个操作;(7) 支持流水线操作,使取指、译码和执行等操作可以重叠执行。这些特点决定了 DSP 芯片具有快速处理数据运算的能力。随着高性能 DSP芯片的不断推出,DSP 系统开发已经成为控制与实时处理领域发展的一个新热点。而图像处理领域对于处理速度的要求也越来越高,例如监控系统的处理要求能够实时完成,工厂中的生产线在线检测系
12、统也要求能尽可能快地处理图像数据,总之在图像处理系统特别是动态处理系统中,处理速度始终是衡量性能的一个重要指标。DSP 芯片由于其特殊的硬件结构,具备强大的数据处理功能,并且处理速度很快,因此对图像处理有速度要求的系统可以广泛应用 DSP 芯片来实现。2人脸识别系统硬件平台的方案设计2.1系统硬件平台的方案比较目前的图像处理主要有基于 PC 微机的软件处理与硬件处理两种实现途径。基于 PC 微机进行的图像处理主要是运用软件对图像进行处理,其性能很大程度上依赖于软件算法的优劣以及 CPU 的处理能力,并且速个系统体积庞大,成本较高,而基于硬件的图像处理则没有这些缺点,本文就是研究人脸识别的硬件平
13、台的设计。方案一:基于可编程逻辑器件FPGA的嵌入式系统,在FPGA中嵌入微处理器和相关外围电路来实现对图像的采集、处理、识别等功能。但算法处理并不是可编程逻辑的强项,因此用这种方式实现图像处理系统难度较大。方案二:采用DSP+FPGA组成系统采用 DSP +FPGA系统,进行图像处理和各种算法的实现,FPGA 电路与DSP 相连,利用DSP 处理器强大的I/O功能实现系统内部的通信。从DSP 角度看,FPGA相当于它的宏功能协处理器。外围电路辅助核心电路进行工作。DSP 和FPGA 各自带有RAM,用于存放处理过程所需要的数据及中间结果。FLASH ROM 中存储了DSP 执行程序和FPGA
14、 的配置数据。这种设计方式比较灵活,并且 DSP 芯片处理数据的能力相对较强,由于其特殊的硬件结构,具备强大的数据处理功能,并且处理速度很快,在图像处理中可以充分发挥其特点。DSP + FPGA 系统最大优点是结构灵活,有较强的通用性,适合于模块化设计,从而能够提高算法效率;同时其开发周期较短,系统容易维护和扩展,适合实时信号处理。考虑图像的数据流非常庞大,而且对速度要求也很高,所以选择第二种方案。2.2系统设计中的关键问题(1) 由于系统比较复杂,对硬件的各种要求比较高,所以系统对各种芯片型号的选择尤其重要,需要非常全面地考虑。(2) 电源电路:系统中会出现各种芯片的工作电压不同,所以要有不
15、同的电源转换电路,还要考虑模拟部分与数字部分间的相互干扰问题。(3) 系统的硬件需要合理地布局,并且要考虑(EMC)电磁兼容的问题等。2.2.1 DSP的发展 数字信号处理DSP ( Digital Signal Processing)是一门跨学科、应用面广的新兴学科。随着计算机技术的发展,DSP技术得到了广泛的应用。数字信号处理器DSP(Digital Signal Processors )目前己经成为很多领域嵌入式系统的核心器件,用来快速处理数字化信号,如音频、视频和传感器信号。DSP可以对数字信号流执行快速的数学运算,其运算能力是普通处理器所无法比拟的。这些数学运算包括简单的加、减法和乘
16、法以及复杂的滤波算法和信号分析算法如快速傅立叶变换FFT ( Fast Fourier Transforms )和离散余弦变换DCT( Discrete Cosine Transforms )。其特点是实时、快速、数据运算量大。 1978年AMI公司发布了世界上第一个单片DSP芯片S2811,DSP芯片发展的一个重要里程碑1979年美国lintel公司发布的商用可编程器件2920。这两种芯片内部都没有现代DSP芯片所必须具备的单周期芯片。第一个具有乘法器的商用DSP芯片是1980年日本NEC公司推出的CPD7720。第一个采用CMOS工艺生产浮点DSP芯片的是日本的Hitachi公司,其198
17、2年推出的浮点DSP芯片使DSP处理的吞吐量发生了一个大的飞跃。1983年日本Fujitsu公司推出的MB8764,其指令周期为120ns,具有双内部总线。第一个高性能的浮点DSP芯片是AT&T公司1984年推出的DSP32。在众多的DSP芯片种类中,最成功的是美国德克萨斯仪器公司TI(Texas Instruments)的系列产品。TI公司在1982年成功推出启迪一代DSP芯片TMS32010及其系列产品TMS32011, TMS32C10/C14/C15/C16/C17等之后相继推出了第二代DSP芯片TMS32020,TMS320C25/C26/C28,第三代DSP芯片TMS32C30/C
18、31/C32,第四代DSP芯片TMS32C40/C44,第五代DSP芯片TMS32C50/C51/C52/C53以及集多个DSP于一体的高性能DSP芯片TMS32C80/C82等。自1980年以来,DSP芯片的发展可谓突飞猛进,DSP芯片的应用也越来越广泛。从运算速度来看,MAC(一次乘法和一次加法)时间已经从80年代初的400ns (如TMS32010)降低到0.25ns(如TMS32C6414 ),处理能力提高了1600多倍。DSP芯片的引脚数量从1980年的最多64个增加到现在的200个以上,封装形式也有所变化,引脚数目多的大都采用BGA封装。引脚数量的增加,意味着结构灵活性的增加。此外
19、DSP芯片的发展,使DSP系统的成本、体积、重量和功耗都有很大程度的下降。TMS320 DSP系统发展历程如图2.2.1所示: 图2. 2. 1 DSP TMS320系列发展历程 与标准微处理器相比,DSP有许多相同的地方:以ALU为核心的CPU、地址和数据总线、RAM、 ROM以及I/O端口。但是DSP在体系结构上与通用微处理器有很大的区别: 哈佛结构: DSP采用代码和数据总线分开的“哈佛结构”,哈佛结构的主要特点是将程序和数据存储在不同的存储空间中,即程序存储器和数据存储器是两个相互独立的存储器,每个存储器独立编址,独立访问。与两个存储器相对应的是系统中设置了程序总线和数据总线,从而使数
20、据的吞吐率提高了一倍。由于程序和存储器在两个分开的空间中,因此取指和执行能完全重叠; 流水线操作: DSP芯片采用流水线以减少指令执行的时间,从而增强了处理器的处理能力。处理器可以并行处理二到四条指令,每条指令处于流水线的不同阶段。如图3.1.2示 给出了一个三级流水线操作的例子:取指N N-1 N-2译码N-1 N N-2执行N-2 N-1 N图3.1.2三级流水线操作 专用的硬件乘法器: 信号处理算法往往大量用到乘加运算MAC(multiply-accumulate ), DSP有专用的硬件乘法器,可以在一个时钟周期内完成MAC运算; 特殊的DSP指令: DSP芯片采用特殊的指令; 快速的
21、指令周期: 目前TT公司的TMS320C6000系列及TMS320C5000系列的芯片的最高工作主频己经达到1GHz。指令周期己经降到了1ns; 快速的指令周期、哈佛结构、流水线操作、专用的硬件乘法器、特殊的DSP指令再加上集成电路的优化设计可使DSP芯片的指令周期在2ns以下; 地址发生器: DSP有专用的硬件地址发生单元,可以支持许多信号处理算法所要求的特定数据地址模式。包括前(后)增(减)、环状数据缓冲的模地址以及FFT的比特倒置地址。地址发生器单元与主ALU和乘法器并行工作,进一步增加了DSP可以在一个时钟周期内可以完成的工作量; 高速内部存储器: 许多DSP提供了适量的片内程序和数据
22、存储器。其容量可以满足许多信号处理应用程序所需。除此之外,大多数DSP都可以直接与快速SRAM或者SDRAM无缝连接而无需任何接口逻辑; 低等待时间中断: 许多DSP允许中断仅用几条指令来处理,无需或者只需很小保存现场所需的软件开销。DSP常常包含如下片内外部设备:多个DMA通道,数据可以在外设和存储器间快速转移而不需要或者只需要很少的处理器监控; HPI主机接口,DSP可以接到标准微处理器上,微处理器处理日常工作或者负责监督任务; 扩展存储器EMIF接口,为各种存储单元提供了无缝接口; 中断选择,C6000DSP可以选择12个可执行中断; 多通道缓冲串口McBSPS,支持全双工工作模式,双缓
23、冲数据寄存器确保了数据流的连续收/发时钟独立。 运算速度是衡量DSP芯片的一个最重要的性能指标,也是选择DSP芯片时所需要考虑的一个主要因素。DSP芯片的运算速度主要可以用以下几种性能指标来衡量: 指令周期:即执行一条指令所需要的时间,通常以ns为单位。 MAC时间:即执行一次乘法和一次加法所需要的时间。 FFT执行时间:即运行一个N点FFT程序所需的时间。 MIPS:即每秒执行百万条指令。2.2.2 定点 DSP 芯片 TMS320C6414 介绍DSP 芯片按工作的数据格式来分类,可分为定点 DSP 芯片与浮点 DSP 芯片。定点 DSP 实现的是定点数据运算,浮点 DSP 实现的是浮点数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计 论文 识别 系统 硬件 平台
链接地址:https://www.31ppt.com/p-3977536.html