雷达信号分选方法研究—本科毕业论文.doc
西南科技大学毕业设计(论文)题目名称:雷达信号分选方法研究 雷达信号分选方法研究摘要:当今世界,雷达技术发展迅速,各种雷达层出不穷,雷达工业体制朝着多样化、复杂化发展,并且由于各种体制的综合利用,如何在当今越来越复杂的电磁信号环境中进行雷达信号的正确识别和分选是雷达侦察机的一个重要任务。本文首先对电子对抗环境进行了介绍,并对雷达侦察机的信号环境的时域特征、频域特征、空域特征、功率密度(能量)特征以及极化特征进行了详细的分析,研究了在复杂电磁环境中进行雷达信号分选和电子对抗的常用分选办法并对雷达侦察接收信号分选系统设计的主要依据进行了研究。针对传统雷达信号分选方法存在的一些问题,采用了一种新的数字信号处理技术-独立分量分析(ICA)的方法进行雷达信号分选,仿真结果表明,基于独立分量分析的分选方法能较好的完成复杂的雷达信号分选,而且方法简单,自适应强,是一种较好的雷达信号分选方法。关键词:雷达信号分选;独立分量分析;电子对抗Research on the Sorting Method of Radar SignalAbstract:Nowadays, there are different radars with the development of radar technology. It is an important task of radar scout to identify and sort radar signals correctly in more and more complicated electromagnetic environment. The dissertation introduces the electronic counter environment, then analysis the signal environment of radar scout in detail, including time domain characteristic, frequency domain characteristic, airspace characteristic, power density (energy) and polarization characteristic. The common methods used to sorting radar signals in complex electromagnetic environment are also introduced. Then the new method of radar sorting based on Independent Component Analysis is proposed for the shortcomings of traditional sorting methods. The experimental results show that the proposed method can separate different radar signals from each other perfectly. Theory analysis and simulation results indicate that the method based on ICA is an effective sorting method of radar signals, which has the advantages of simplicity and self-adaptation.Keywords: Radar signal sorting, Independent component analysis, Electronic countermeasure 目 录第1章 绪 论11.1研究背景11.1.1电子对抗的发展11.1.2雷达信号分选的重要性21.2国内外研究现状21.3本文主要研究内容4第2章 常规雷达信号分选方法52.1雷达信号分选的系统组成52.2雷达分选信号源的产生52.3雷达信号预处理62.4常规雷达信号分选方法7第3章 独立分量分析理论103.1概述103.2独立分量分析的基础103.2.1相关理论基础103.2.2主分量分析(PCA)123.2.3独立分量分析(ICA)133.3独立分量分析算法研究163.3.1独立分量分析目标函数173.3.2独立分量分析优化算法193.4独立分量分析的典型应用213.4.1独立分量分析在语音信号处理中的应用213.4.2独立分量分析在图像处理中的应用22第4章 基于ICA的雷达信号分选技术244.1ICA原理的引入244.2基于FastICA算法的雷达信号分选244.2.1信号源模拟244.2.2利用FastICA算法分选雷达信号并仿真264.3FastICA算法与传统算法的比较30结 论32致 谢33参考文献34附录1 预处理函数35附录2 FastICA算法36附录3基于ICA的雷达信号分选函数43第1章 绪 论1.1 研究背景1897 年,Marconi 第一次在英吉利海峡进行的无线电信号收发实验获得成功,揭开了现代通信革命的序幕。每一次科学技术的进步导致战争的发展,人类开始在军事上应用电磁波进行各种斗争与反斗争,从而出现了电子战。电子战是敌对双方利用无线电电子设备所进行的电磁信息斗争,是运用电磁能量来探测、确定或阻碍、破坏敌方的电磁频谱,并保障己方安全、正常使用电磁频谱的军事行动。电子战包括相互斗争的两个方面:电子对抗(ECM,包括电子侦察、电子干扰、电子隐身和电子摧毁)和电子反对抗(ECCM,包括电子反侦察、电子反干扰、电子反隐身和电子反摧毁)。在战乱时期,电子战可用于阻挠敌方利用各种电磁手段进行破坏;在和平时期,可最大限度地获取周围电磁信号以得到及时准确的情报1。1.1.1. 电子对抗的发展近几年的局部战争,使电子战得到迅速发展和完善,不断添加新内容、拓展新领域。电子战已从战争的辅助保障手段发展成战争中不可缺少的重要武器,是现代战争的序幕和先导,并贯穿于战争的全过程。电子战能使军力倍增,是继陆、海、空之后的第四维战场。因此,对于现代战争来说,没有电子战优势和制电磁权,就没有控制战争的主动权,这在科索沃战争和伊拉克战争中已经得到了充分的验证。未来战争中,获胜者必将是善于运用电子战的一方,电子战将作为一种特殊手段将更深入地影响战争的进程和结局。电子对抗是一种综合性的电磁抗争,它包括通信对抗、雷达对抗、导航对抗、制导对抗、红外对抗、激光对抗以及声纳对抗等技术领域。它的战场是电磁波和声波涉及的整个空间。电子对抗利用各种电子侦察系统,截获、分析、识别、定位和记录敌方电子设备的辐射信号,从中获取战略和战术情报,为高层次决策、电子战战术、技术对策研究和电子战装备的发展提供全面的情报依据,为平时、战时电子战和其它作战行动的实施提供实时或接近实时的战术情报资源;利用各种软杀伤和硬摧毁电子战系统,对敌方的 C4I(指挥、控制、通信、计算机、情报)系统、精确制导武器以及隐身目标的薄弱环节实施集中的高强度的电子攻击,造成敌方雷达迷盲、通信中断、武器失控、指挥失灵,从而从整体上瓦解其战斗力,保障已方顺利完成各种作战任务;利用各种电磁防护和作战平台自卫等电子战系统,与其他防空兵器配合,对敌方多方位、多层次、高密度的空袭兵器实施综合电子防空反击,以瘫痪其空中作战指挥,瓦解其空中进攻态势,保证已方作战意图的顺利实现。放眼回眸,电子战从 20 世纪初一诞生便倍受世界各国的青睐,成为战争的宠儿。几乎每次战争中,我们都能找到电子战的痕迹,电子战面世出现于“日俄战争”,经历两次世界大战初试锋芒,再到大规模运用电子战的诺曼底登陆,经过越南战争、中东战争和英阿马岛战争的,直至电子战大显神威的海湾战争和科索沃战争,电子战以其魔法般的神奇效应,让世界各国军事家们倾心。如今,电子战历经无数大大小小的战争,风风雨雨的走过一个世纪。很显然,未来战争是一种打破时空,打破疆域,以信息战为核心的高技术战争,而电子战和网络战则是信息战的两种主要形式23。1.1.2. 雷达信号分选的重要性 雷达信号分选是雷达对抗中一个重要的组成部分,它处理的信号是雷达接收机送来密集交迭的视频脉冲流,信号分选指的是从这种随机交迭的脉冲流中分离出各个雷达脉冲列,并选出有用信号的过程。雷达信号分选在雷达信号处理中占有很重要的作用,通过雷达分选,能够准确的识别出空间中各种不同的雷达以及它们的参数,并将其放入雷达库中以便做进一步的处理,比如定位,跟踪,分析。 雷达信号分选的方法很多,最先发展起来的是单参数分选技术,然后才有多参数分选技术。而目前国际上很热的是将盲信能搞好分离技术应用于雷达信号分选,这又为雷达信号分选开辟了一条新的道路45。1.2 国内外研究现状雷达信号分选,包括基于脉冲到达方向DOA、脉冲宽度PW、脉冲载频RF等做参数相关的预分选和基于脉冲重复周期PRI去交错的主分选。从早期的雷达对抗到现在, 雷达侦察系统的雷达信号主分选主要是基于软件程序实现,这必然涉及软件实现的计算负担问题。因此,在雷达辐射源大量增加,雷达信号形式越来越复杂的现代战场环境下,基于纯软件方式的雷达信号分选的计算负担将急剧增加,以致无法进行雷达信号实时分选,采用软硬件结合,甚至采取专用雷达信号分选器件进行信号实时分选,已是现代雷达对抗技术的必然趋势。从20世纪六七十年代到现代复杂电磁环境下的信号分选,雷达信号分选作为雷达侦察干扰机的关键组成单元,主要经历了纯软件处理、软件与专用器件相结合、到由自适应PDW滤波器组、聚类与直方图分析专用器件、常规频率去交错器和捷变频去交错器等全ASIC器件构成的高度并行处理结构这几个过程。雷达信号分选算法则基本上是基于对脉冲到达方向DOA、脉冲宽度PW、脉冲载频RF等做相关处理进行雷达信号预分选,对密集脉冲流做稀释处理,然后是基于脉冲重复周期PRI去交错处理进行雷达信号主分选,其中对脉冲序列去交错技术一直是雷达信号分选的研究热点和难点。至于雷达信号分选的硬件实现技术方面,20世纪80年代初,Kohonen和Hanna等人首先提出了内容寻址存储器(CAM)和关联比较器(AC)的思想,其设计原理就是同时将输入与所有存储单元的内容进行比较,输出匹配存储空间的地址。20世纪80年代中后期,IBM公司和Coherent公司分别成功研制出用于雷达信号实时分选的关联比较器和内容寻址存储器,极大地提高了雷达信号分选处理算法的并行性,使雷达侦察干扰系统对复杂电磁环境下的高密度信号分选处理能力有了显著提高。在基于脉内特征参数的雷达信号分选方面,利用脉冲特征参数DOA、RF、PW、PA及TOA等进行雷达信号分选是现代雷达对抗中常采用的经典方法。目前,新一代的雷达电子对抗系统,在继续利用5个经典参数来分选雷达信号的同时,都具备了一定的雷达信号脉内特征分析能力。同样的在雷达信号分选技术得到长足发展的同时,国内外都遇到了几个亟待解决的关键性技术问题:1、高精度参数测量技术高精度参数测量技术是保证密集雷达信号分选的高可靠性、高精确性和过程运行实时性的基本前提条件。2、复杂信号分选的并行实现算法与硬件实现技术信号分选的并行处理在软件程序实现上比较困难,但在硬件实现上是可行的,因此开发具有并行信号分选算法的硬件电路具有广泛的应用性。信号分选专用器件的硬件实现技术不但将使复杂信号分选过程具有实时性,而且可使开发出的复杂信号分选算法具有通用性和可移植性。3、高密集雷达脉冲流中的捷变频雷达信号分选与干扰技术。现代战场上的新体制雷达为了反干扰,较多地采用了同组合形式的捷变频雷达侦察信号,现行的雷达信号分选技术对于分选一部捷变频雷达信号已经很困难,到目前为止还未研究出一种有效的多部捷变频雷达信号分选方法,而且,捷变频雷达的主要干扰方式是瞄准式噪声干扰,没有可靠的信号分选就没有有效的干扰,因此提出一种有效的捷变频雷达信号分选算法和硬件实现技术显得非常迫切。在现代战争环境下,雷达探测与雷达对抗技术是不断发展、不断完善、相互推动的过程。随着新体制雷达技术的出现,雷达对抗中的信号分选技术将会遇到越来越多的困难,特别是在雷达辐射源急剧增加,信号形式越来越复杂多样的复杂电磁环境下,雷达信号分选的实时性和信号分选、识别的正确性是雷达信号分选遇到的最大挑战。在现有信号分选技术的基础上,深入研究高精度测频、测向技术,新体制雷达的信号分选技术,信号分选的并行算法与硬件实现技术,雷达信号分选系统的模块化、小型化、低功耗技术,这是未来雷达电子对抗中雷达信号分选领域的前沿研究方向6。1.3 本文主要研究内容本文主要研究了传统雷达信号分选方法与基于ICA算法的雷达信号分选方法,论文主要包括了常用算法的研究和基于ICA算法的雷达信号分选的效果仿真,各章安排如下:第1章介绍了课题背景,电子对抗的发展和现今国内外对雷达信号分选的研究现状。第2章介绍了传统雷达信号分选方法,研究了多参数联合分选方法。第3章介绍了独立分量分析的理论并且对独立分量分析算法进行了研究。第4章介绍了如何利用ICA算法进行信号分选检测,并且以仿真证明算法的正确性。 结论部分介绍了雷达信号分选的发展前景,展望了将ICA算法与硬件结合进行信号分选,以及我自己的体会和收获。第2章 常规雷达信号分选方法2.1 雷达信号分选的系统组成雷达信号分选系统的一般由预处理机、主处理机、已知辐射源数据库以及控制器等几个基本部分组成78,如图 2-1 所示。图2-1雷达信号处理基本系统组成1、预处理机雷达脉冲预处理机的主要任务是接收接收机的脉冲流信号(PDW 形式),根据已知雷达辐射源的主要特征参数及脉内特征参数等先验知识,对随机交迭的雷达脉冲信号流中进行脉冲参数匹配分析,从中分离出已知雷达脉冲列或者扣除友邻和已方雷达脉冲,达到稀释脉冲流密度的目的。2、主处理机主处理机的主要任务是要完成雷达信号的主要分选、雷达识别、威胁等级判别。雷达信号的主分选实质就是去交迭,去交错的处理。3、雷达数据库雷达数据库主要用于存放已知雷达数据以及新发现的雷达数据,同时向预处理器提供雷达数据,以方便进行已知辐射源的分离扣除以及部分雷达的实时跟踪。4、控制器控制器主要用于协调各部分的工作,同时控制器也作为人机的接口,通过控制器,可以控制雷达信号分选各个部分的工作过程。2.2 雷达分选信号源的产生雷达分选系统处理的信号是雷达接收机送来密集交迭的视频脉冲流,信号分选指的是从这种随机交迭的脉冲流中分离出各个雷达脉冲列并选出有用信号的过程。因此信号分选的实质也就是去交迭、去交错的过程。雷达侦察机接收的信号的就是辐射源脉冲列。辐射源脉冲列是截获接收机脉冲流构成的基本元素,辐射源脉冲列及脉冲参数变化形式的复杂性决定了辐射源环境下信号分析与去交错的复杂性。根据辐射源脉冲列可能出现的变化形式,辐射源脉冲列的产生将考虑以下参数:1、时域参数时域参数包括脉冲的到达时间、脉冲的宽度、脉冲的重复周期以及其变化规律等。2、空域参数雷达截获接收机所能获取的目标辐射源参数中,脉冲到达角(DOA)信息是一个与辐射源位置密切相关的信息在某些参数形式变化特别复杂的辐射源去交错处理中,如 PRI 受控、制导指令脉冲群以及频率等参数无规律跳变等情况,DOA可能是唯一的去交错参数。3、频域参数频域参数包括脉冲的载频频率、频谱、频率变化规律以及变化范围等。4、脉冲幅度脉冲辐度参数的平稳性较差,一般不作为辐射源的特征参数用于脉冲列去交错。但是,PA 是脉冲功率(或强度)的指示器,而且脉冲功率对于SNR指数、接收机测量参数的精度等都是非常重要的指标。因此,PA在信号分析与去交错处理中可以作为脉冲参数置信度指标。5、脉冲流密度雷达信号脉冲流密度是描述雷达侦察机信号的主要参数之一,信号密度的大小将影响信号分选的复杂程度以及雷达侦察机的响应时间。如上所述,以上5大参数是构成产生雷达信号源的环境的重要元素,自雷达问世以来,国内外根据这些参数的性质发展出了多种雷达信号分选方法。2.3 雷达信号预处理雷达信号分选的流程如图2-2,分为三部分来完成,首先是预处理,包括了脉冲匹配与扣除,TOA、PW、RF的联合预分选,进行预处理的目的是为了稀释脉冲流,为主分选做准备;第二步是主分选,包括PRI分选和跳频雷达(HOP)分选,将相同参数的雷达分选出来;第三步是后续处理,包括虚假脉冲分析,参差雷达识别,统计雷达参数信息和更新雷达数据库。图2-2雷达信号分选流程由图2-2可以看出,整个预处理过程作为主分选的铺垫,有着非常重要的作用,在利用各个参数模拟形成雷达信号辐射源后,将已知辐射源从脉冲流中扣除和分离,以减轻后续处理的负担,并且通过 PW(脉冲宽度)、RF(射频)、PRI(脉冲重复间隔)的匹配来达到快速分离已知辐射脉冲的过程。然后通过对脉冲流的DOA分选和PW分选、RF分选,为主分选做准备。2.4 常规雷达信号分选方法最初的雷达信号分选是从单参数分选技术发展起来的,后来才研究多参数分选技术,就目前来说利用参数进行雷达分选的最好方法是多参数联合分选方法。下面将介绍一些常规的雷达信号分选方法,根据所采用的分选参数和分选方法,通常有下列一些分选技术:1、重频(PRI)分选脉冲重频分选是用单个参数进行辐射源识别时最具有特征的参数。重频是早采用的信号分选参数8。重频分选既可以用逻辑电路来实现,称为硬件分选,也可以用计算机来实现,称为软件分选。硬件分选具有线路简单,实时性强的优点,但只能对常规雷达信号分选,而且信号密度不能太高。计算机分选可以分选重频变化的信号,并更适于较高密度的信号环境。2、重频(PRI)加脉宽(PW)综合分选PW-PRI 分选属于时域多参数分选,它比单靠重频一个参数的分选功能强得多。在密集信号条件下,只靠重频一个参数进行分选,其分选时间很长,特别是在多个 PRI 抖动、跳变或周期调制情况下,甚至无法实现信号分选。加上脉宽参数的分选,就可以大大缩短重频分选的时间,而且有利于对宽脉冲、窄脉冲等特殊雷达信号的分选和对重复周期变化信号的分选。3、时域、频域多参数分选为了对频率捷变和频率分集雷达进行分选和识别,要求侦察系统必须对每个脉冲的射频、到达时间、脉宽、脉幅等做相关处理,然后进行载频、脉宽、重复周期的多参数的信号分选。4、空域、频域、时域多参数分选当密集的信号流中包含多个频域和时域上变化的脉冲序列时,若只有频域、时域信号参数进行分选就很难完成分选任务,这就需要加上准确的到达方向这一参数进行综合分选。准确的到达方向是最有力的分选参数,由于目标的空间位置是不会发生突变的,因而信号的到达方向也是不会发生突变的。用精确的到达方向作为密集、复杂信号流的预分选,是解决各类频域捷变和时域捷变或多重频参差、PRI 滑变信号分选而不产生虚警和错误的可靠途径。此外雷达的极化方向也可作为分选的一个参数5。综上所述,信号分选可具有几种模式:(1)PRI(或 PRF)时域单参数分选;(2)PRI 加 PW 时域多参数分选;(3)PRI、PW 加 f(载频)多参数综合分选;(4)PRI、PW 加(到达角)多参数综合分选;(5)PRI、PW 加 f、多参数综合分选。在各种分选模式中,PRI 分选是各种分选方法中都需具有的分选程序。因此,其它各种参数的分选都可以看作是预分选,PRI 是最终的主分选,是各种信号分选模式的基础。从上面的介绍可以看出,不管是单参数分选技术,还是多参数分选技术,都存在着各自的优缺点,尤其是在现在越来越复杂的电磁环境中,已经显得不是很适用。要对时域参数变化和频域参数变化的信号进行计算机分选,都需要在单个脉冲的基础上,也就是在单个脉冲的数字描述字(包括到达时间、脉宽、脉幅、载频到达方向脉内调制参数的)基础上进行分选。因此在软件分选之前,需要首先对信号预先处理,对每个脉冲进行到达时间、脉宽、脉幅、载频、到达方向等参数的相关处理,形成单个脉冲的描述字。显然,在上面的几个单个脉冲基础上的多参数综合分选模式中,所用的分选参数越多,其分选的功能就越强,这也就使得每个脉冲描述字的位数增多。因而对计算机的字长、存贮容量就有高的要求,这样在常规雷达信号分选方法与硬件结合时需要克服的困难就越大。由于常规雷达信号的分选方法有着不小的缺点,所以我们迫切地需要一种高效,准确和兼容性较高的雷达信号分选方法,在这里引入一种新的多维数字信号处理方法独立分量分析方法(Independent Component Analysis,简称ICA)应用于雷达信号分选中。第3章 独立分量分析理论3.1 概述盲信号分离是信号处理领域中的一个重要研究方向,在近些年来得到了飞速的发展,成为了研究的热点。盲意味着我们对混合矩阵(环境、信道等等)的先验知识己知的非常有限,或者根本全无。由于盲信号分离技术对环境和目标的信息要求比较少,有着广泛的应用前景,近年来引起了众多研究者的广泛关注,尤其是90年代以来提出了很多有效的算法。对于盲信号分离,最有效的方法之一就是基于统计独立性的独立分量分析方法,它以高阶统计量为基础,是一种自适应优化算法,主要用于揭示和提取多维信号中的潜在部分,是在具有较长研究历史的盲信号分离问题中浮现出的新的信号分析技术。 ICA的基本含义是将多道观测信号根据统计独立的原则通过优化算法分解为多个相互独立的成分,是一种新的多维信号处理方法,与传统的多维信号分析方法截然不同的是,ICA着眼于数据间的高阶统计特性,使得变换后的各分量不仅互不相关,而且还尽可能统计独立。利用ICA技术能够在接收信号瞬时混叠参数未知的情况下,仅根据源信号的一些基本统计特征(统计独立和非高斯分布),将观测信号恢复成源信号。ICA理论的发展可追溯到一世纪80年代初期。目前被ICA研究者广泛采用的算法主要有Infomax算法,扩展的Infomax算法,FastICA算法等等。 ICA算法作为一种信号处理的新方法,在语音信号分离、图像处理、生物医学信号处理、金融数据分析、数据挖掘及通信等诸多领域有着广泛的应用。目前,ICA在遥感技术上的潜在应用已得到检验,尤其在合成孔径雷达图像处理中, ICA技术可以有效提高图像质量、改善像素分类性能。总之,通过解混处理的ICA算法在遥感研究上将会是一种很有用的方法910。3.2 独立分量分析的基础3.2.1. 相关理论基础独立分量分析的相关理论基础主要包括随即变量的高阶统计特性、信息论的相关知识和独立分量的独立统计性。三者对于独立分量分析都有很重要的作用 。1、随机变量的高阶统计特性在信号处理领域中,非高斯信号是比高斯信号更为普遍的一种信号,对非高斯信号来说,一、二阶统计量只是其中一部分信息,它不包含相位信息;同时对图像数据而言,其大部分重要特征信息(如图像的边缘细节部分)与像素间的高阶统计特征有着密切关系。高阶累积量技术在对非高斯、非线性、非因果信号、高斯有色噪声及盲信号处理中,是非常有用的重要分析工具,其独特的优点是可弃除外加干扰噪声的影响,提高分析和辨识精度,有良好的降噪作用。自二十世纪80年代末以来,基于高阶累积量的非高斯信号分析己成为统计信号处理领域的一个重要研究方向,并取得了很多非常有价值的成果。独立分量分析就是其中最具代表性的成果之一14。2、信息论基础信息熵、互信息等这些概念在盲信号分离和独立分量分析(ICA)的研究中非常重要。随机变量可取值于某一连续区间,也可取值于某一离散集合,相应的信源就称为连续信源和离散信源。对于离散随机变量Xn取值于集合A=a1,a2,an。A集合中各元素出现的概率为P1,则离散随机变量的信息熵定义为: (3-1)上式又称为Xn的无条件熵。是对随机变量不确定程度的一种度量,且总是非负的。显然对于确定出现的事件P11或永远不会出现的事件P10,其熵为零。互信息是一个非常重要的概念,可以用来度量随机变量间的相互独立程度,也是ICA分离算法的重要理论依据。对于连续随机变量的熵我们可以借助离散随机变量熵的定义求得。将(3-1)式进行推广,得连续取值的多维随机变量X=x1,x2,xnT的联合微分熵为: (3-2)对X作可逆的现行变化y=Wx,由概率论可知,y的联合概率密度为: (3-3)故有:(3-4)在信息论中有一结论,即所谓的熵极大定理:在所有具有相同协方差矩阵的分布中,高斯分布的熵最大。这个定理说明在一定的条件限制下,可以找到一个特定的分布具有最大的信息熵。而上述这个定理中的这个特定的分布恰好是高斯分布。那么产生一个很自然的想法,以这样一个特定分布作为参考,就可以用信息熵来描述一个分布与高斯分布之间的偏离程度,也即非高斯性,负熵的概念因此产生。3、统计独立性独立分量分析算法的最基本的要求就是分解后的分量是相互独立或者尽量相互独立的,因此独立性的度量决定了独立分量分析算法的实现以及算法效果的好坏。随机事件的独立性概念可以很容易地引出随机变量的情况。以二维为例,设x,y是连续型随机变量,其相互独立的定义为: (3-5)式(3-5)左边为(X,Y)的联合概率密度,右边分别为两个变量的边缘概率密度。可见,独立使得多变元联合函数分解成单变元函数因子乘积的形式,这给计算多维随机变量的联合概率密度函数带来了方便。类似地,两个随机变量相互独立意味着其中一个变量的取值对另一个变量的取值不提供任何信息。式(3-5)的定义可以扩展到任意的N维变量,只不过等式右边变成N项边缘概率密度的乘积。由于独立意味着不相关,许多ICA方法的估计过程都会先给出各独立分量的不相关估计。这样可以减少自由参数的个数,可以使问题简化,便于计算。 3.2.2. 主分量分析(PCA)主分量分析(Principal Independent Component,简称PCA)是一种应用于统计数据分析、特征提取、数据压缩等领域中的经典方法。对于一个多变量的数据集,主分量分析通过去相关来消除变量之间的冗余信息,同时还要求能够尽可能好的描述原有数据集。在这一点上,主分量分析同独立分量分析的目的是相同的。然而,主分量分析消除冗余性的方法是通过消除变量之间的相关性,而独立分量分析的要求则更为严格,它要求变量之间是统计独立的。虽然,主分量分析只利用了数据的二阶统计量对数据进行分析,但对于独立分量分析,主分量分析还是一个很有用的数据预处理方法。但是,当多变量观测数据是由一些彼此独立的源分量线性组合而成时,只有当信息源是高斯分布时,PCA方法才是有效的。但实际上,真正满足高斯分布的随机变量是不多见的,绝大部分随机变量都不满足高斯分布,因此,传统的高斯分布假没下的统计分析方法在很多场合下是难以胜任的。在这种情况下,引进一种在非高斯特性下也能运用的算法是非常有必要的,所以我们就要选用独立分量分析方法。从统计分析的角度看,独立分量分析和主分量分析一样,同属多变量数据分析的线性方法。但ICA以随机变量的非高斯性和相互独立为分析目标,最终是为了从多通道观测数据中分离出相互独立的信源,而不仅仅是一、二阶统计特征的独立,因此比PCA更进了一步。3.2.3. 独立分量分析(ICA)独立分量分析是从多变量数据中发现隐含信息成分的一种方法,是主分量分析的一种延伸。它以随机变量的非高斯性和相互独立为分析目标,最终是为了从多通道观测数据中分离出相互独立的信源,与传统的二阶方法相比,ICA不仅可以去除了信号各分量之间的一、二阶相关性,同时还具有发掘并去除数据间的高阶相关信息的能力,使得输出分量相互独立。换句话说,独立分量分析的目的是寻找一个线性但不一定正交的坐标系来表示多维数据,而PCA构造的是正交坐标系。在很多应用中,非正交的坐标系更符合实际。这样ICA在许多方面对统计方法的重要突破使得其越来越成为信号处理中一个极具潜力的分析工具。1、如何建立基于ICA的系统模型设是一组我们用N个传感器阵列直接获得的N维观测信号,其中下标表示观测信号的通道序数,表示观测数据的长度,而它是由若干隐含变量经过某种混合后产生的。我们希望从这N个观测信号中找出隐含在其中的变量,这些隐含变量可以描述观测信号的最本质特征,同时我们也希望这些隐含变量与产生观测信号的实际物理源有某种必然联系(或者就是物理源)。为解决多变量数据分析问题,通常我们将它简化为一个线性问题进行处理,这样做的目的是为了简化运算便于求解,这在很多实际应用场合是可以满足要求的。该模型如图3-1所示,为一线性瞬时混合模型。图中任一观测信号可表示为: (3-6)图3-1 线性混合模型用矩阵表示为: 即。其中为观测向量,为待求的彼此独立的源信号,A是由混合系数组成的混合矩阵,它的每个行向量中的M个元素作为M个信号源的加权系数对信号进行混合,得到对应的一个观测信号。但有些时候我们更加关心A的列向量。设是A的列向量,模式可写为: (3-7)经过A线性混合后的观测信号的各个分量将不再是独立的,即: (3-8)ICA的目的就是寻找一个A 的线性变换,称之为解混矩阵W,将它施加到观测信号,使得各输出信号尽可能的相互独立。这里的W从信号处理的角度来看可称之为空间滤波器,如果从神经网络的角度就是输入输出间的连接权值。当W通过某种优化算法得到后,便有: (3-9)在这里,输出是源信号的的 一个估计。令P=WA,则P可以衡量ICA算法的分离性能,称为性能矩阵。从盲源分离的观点来看,中的各个分量与相比存在次序的不同以及对应分量幅度相差一个常数项,这种情况称为ICA问题的不确定性,事实上造成这种不确定性的原因正是因为没有相关独立源的先验知识。这里P可以不再是单位矩阵,但具有这样的性质:每行、每列有且仅有一个非零元素。根据矩阵理论,P总可以按下式进行分解: (3-10)式中,R是一个置换矩阵,而S是一个对角阵,这两个矩阵就定义了性能矩阵P。根据P的性质,我们可以得出一个结论:如果各个分量统计独立,则的各个分量仍然相互独立。这一性质同时也间接说明了ICA的输出结果具有次序和幅度的不确定性。对于上述的模型,我们还需设定一些约束条件和假定: (1)独立分量之间统计独立 (2)至多有一个独立分量服从高斯分布,对于多个独立分量服从高斯分布的情况,独立分量分析可以正确的分离出服从非高斯分布的独立分量,但无法把相互独立的服从高斯分布的独立分量分离开来,因此,至多允许有一个服从高斯分布的独立分量。(3)观测到的信号的个数要大于独立源的个数,即该假设不要求必须 满足因为在M<N的情况下,混合矩阵A也可以被估计出来,只是独立源的分离似乎是不可能或者是很困难的,因为此时A是不可逆的。所以条件3的要求与否视具体情况而定910。如果系统满足上述条件,我们就可以确定基于独立分量分析的系统模型。这样就可以建立我们所需要的ICA模型了。2、ICA的预处理在使用ICA算法对信号进行分离之前通常需要对信号进行预处理,通过对信号进行预处理可以使ICA算法更简单更稳定。对原始观测数据进行预处理可以简化盲分离的难度,比如加快收敛速度,减少稳态误差等。大部分算法都是先预处理再分离,一些算法虽然不需要预处理可以直接求解,但经预处理后,可使分离变得容易,而且使算法在个别信号极弱或混合矩阵近似奇异时变得有效。ICA算法的信号预处理包括对信号进行中心化和白化,下面将分别进行介绍。 (1)中心化 中心化即通过对信号减去其均值,使信号的均值为0,也就是去直流的过程。设信号为x,其均值为,则中心化过程为: (3-11)这时的信号x的均值为。这一预处理使ICA算法简单化,它并不意味着均值无法估计。用去直流后的数据进行混合矩阵A的估计后,得到s的估计加上均值向量A-1m,即为对应于观测信号的分离结果。(2)白化 信号的白化即在信号的中心化之后对信号进行线性变换,使变换后信号的各分量互不相关且各分量的方差都为1。设原信号为,白化后的信号为,则。白化就是寻找一个线性变换矩阵V(也称作白化矩阵),使变换后向量z的自相关矩阵为单位阵。对信号的白化可以得到一个新的的混合矩阵B。因x=As,所以有 (3-12)这里,即新的混合矩阵B是正交矩阵。对普通矩阵A,使用ICA算法需要估计n2个参数,而对新的混合矩阵元,由于它是正交矩阵,只需要估计个参数。因此,可以说白化过程为ICA算法减少了一半的工作量。3、ICA的结构经过前两节的理论铺垫,在这里可以给出ICA的总体结构,其结构包括三级,如图3-2所示。图3-2 ICA 结构第一级为预处理,包括对信号进行中心化和白化,白化处理只是去除了图像间的相关性,还没有使其相互独立。若在白化中引入降维处理,舍弃较小的特征值及它们对应的特征向量,这样不仅可以提高图像的信噪比,而且有助于第二级ICA算法的分离。第二级完成独立分量的分离。W是解混矩阵,在算法中一般将其初值赋为模为1的随机阵,迭代过程也就是调整W的过程,其学习规则将在后面的算法中给出。,y是提取的独立分量,至少可认为其各分量已尽可能独立。到此已实现了分离。第三级是估计ICA的基向量。如果仅仅是实现源分离,第三级将没有必要。3.3 独立分量分析算法研究独立分量分析方法的基本思路是将多维观测信号按照统计独立的原则建立目标函数,通过优化算法将观测信号分解为多个独立分量。不同ICA的算法研究主要体现在独立性度量准则的选取,和对代价函数的优化准则的不同上。代价函数在许多文献中还称为目标函数或对照函数。因此,从一般意义上可以把所有的ICA算法简单的表述为: ICA算法=分离准则+优化算法可见这两方面构成了 ICA理论的核心,代价函数的选取决定了ICA算法的一些统计性质,如渐进方差,鲁棒性和一致性。而优化算法则决定了ICA算法的收敛速度、内存需求和计算的稳定性。在某种程度上这两类属性是独立的,不同优化方法可以被用来优化单个目标函数,单个优化方法可以被用来优化