参数估计理论与应用(第三章)课件.ppt
《参数估计理论与应用(第三章)课件.ppt》由会员分享,可在线阅读,更多相关《参数估计理论与应用(第三章)课件.ppt(77页珍藏版)》请在三一办公上搜索。
1、2022/11/26,第三章 参数估计理论与应用,第三章 参数估计理论与应用,3.1 参数估计的评价准则3.2 基于统计分布的参数估计方法3.3 基于模型的参数最小二乘估计 本章小结,2022/11/26,第三章 参数估计理论与应用,在许多情况下,观测数据所服从的概率模型已知的,而模型的未知部分是以未知参数形式出现的。 参数估计的基础是优化理论,即被估计的参数应该在某种准则下是最优的,以及任何获得最优的估计。 非参数估计方法不假定观测数据服从某种特定的概率模型。例如,频域上的谱估计与谱线拟合就是典型的非参数估计方法。,2022/11/26,第三章 参数估计理论与应用,3.1 参数估计的评价准则
2、,参数估计是通过样本去估计总体的某些数字特征或统计量。任何一个统计量都可作为参数的估计量,但其效果的优劣有所差别。3.1.1 无偏性、有效性与相容性 (1)无偏性 设样本的总体分布密度函数为 p(x;), 是未知参数。从总体中抽取容量为 N 的样本 x=x1, , xN , 用样本的估计量 来估计,如果希望多次估计中,平均的估计值没有偏差,即则称 是的无偏估计量。,2022/11/26,第三章 参数估计理论与应用,例3-1 样本均值是总体数学期望的无偏估计。 设x1, , xN 是随机过程 xk 的N个独立观测样本,如果参数是总体的数学期望Ex,即用样本的均值作为的估计量,对该估计量取期望值,
3、有 一个无偏估计量在多次估计中将不会产生系统偏差,但并不意味着有偏估计就不好。如果一个有偏估计是渐进无偏的,即,2022/11/26,第三章 参数估计理论与应用,那么它仍然有可能是一个好的估计。 考虑实随机过程xk的相关函数的两种估计量: 假定数据xk是独立观测的,容易验证 式中,Rx()=Exk+ xk 是随机数据xk的相关函数。 以上二式表明,估计量 1() 是无偏的,而 2()则是有偏的。但是, 2()是渐进无偏的,即,2022/11/26,第三章 参数估计理论与应用,渐进无偏估计量 2()是半正定的,而无偏估计量 1()却不一定是半正定的,故 2()的使用场合较多。 (2)有效性 如果
4、 1 和 2 是两个根据N个独立观测样本得到的无偏估计量,无疑地,对 的平均偏差较小是选择的标准之一。例如,如果则 1的值比 2 的值更密集地聚集在真值的附近。通常将方差(或协方差阵)在所有的无偏估计量中达到最小的 称为有效估计量。 例3-2 设x1,xN 是N个独立观测样本,若被估计参数,2022/11/26,第三章 参数估计理论与应用,=Ex,则对任何满足都是的无偏估计量。利用不等式 可得在估计总体的数学期望时,简单的算术平均比加权平均好。 (3)一致性 估计量的精度是与样本的容量 N 有关系的。一般说来,总是认为N 越大估计的效果应该越好。如果记依赖样本容量 N 的估计为 N ,当满足,
5、2022/11/26,第三章 参数估计理论与应用,则称 N 是的一致性估计量,或相容估计。 例3-3 设总体 x 具有均匀分布,分布密度为其中,1 和2 是未知参数。 总体样本的均值和二阶矩分别为(严格按定义计算)解得,2022/11/26,第三章 参数估计理论与应用,按矩的估计方法,用独立样本的均值和独立样本的二阶矩,分别作为总体均值和二阶矩的估计量,就有 下面说明 1 和 2 分别是1 和2 的相容估计。 设 y1,yN 是具有同分布的独立观测样本,根据大数定律,有令y=x2, 就有,2022/11/26,第三章 参数估计理论与应用,于是3.1.2 Fisher信息和Cramer-Rao不
6、等式 通常希望获得有效的参数估计量。但是,由于不存在导致最小方差无偏估计量的最佳算法,所以通常采用参数无偏估计的Cramer-Rao下限(或CR下界), 作为评价参数估计性能的测度。为了简洁叙述这一的评价测度,先定义一个重要的概念。 Fisher 信息 Fisher 信息用J()表示,定义为(3.1.1),2022/11/26,第三章 参数估计理论与应用,当考虑 N 个观测样本 X= x1,xN , 此时,联合条件分布密度函数可表示为 将式(3.1.1)中的p(x|)改为p(X|)就可给出N个样本变量X的Fisher信息的表达式。 定理(Cramer-Rao不等式) 设观测样本X= x1,xN
7、 , 若参数估计 是真实参数 的无偏估计,并且条件分布密度函数的p(X|) 对参数 的一、二阶偏导数存在,则有(3.1.2) 参数 的方差所能达到的下限(称为CR下限),即上式等号成立的充要条件是,2022/11/26,第三章 参数估计理论与应用,其中, 函数K()0,并与样本向量 X 无关。 当 为有偏估计量时,Cramer-Rao 不等式为 (3.1.3) 式中()为估计偏差,即()=E -,并假定b()是可微分的。 对于多个参数的情况,记=1,p,则用矩阵J() 表示Fisher信息,其元素Jij() 定义为(3.1.4),2022/11/26,第三章 参数估计理论与应用,且Cramer
8、-Rao不等式变为矩阵不等式:(3.1.5) 上式表示无偏估计量的协方差矩阵cov( )与逆Fisher信息阵之差是一半正定矩阵。 Fisher信息是描述从观测数据中得到的 的 “信息” 测度,它给出利用观测数据估计参数的方差下界。但是,满足这一下界的估计量有的时候可能不存在。3.2 基于统计分布的参数估计方法 参数估计量的优劣取决于所采用的评价准则(或代价函数)和估计算法。现在介绍已知总体统计分布的两种最有效的参数估计方法:Bayes 估计和最大似然估计。,2022/11/26,第三章 参数估计理论与应用,3.2.1 Bayes 估计 在参数估计中,估计误差 - 通常不为零。因此,除了采用前
9、面介绍的无偏、有效和相容估计作为评价准则外,还可以利用估计误差的变化范围作为参数估计的测度,这种测度叫做代价函数,用符号C( ,)表示。常用的代价函数有绝对型、二次型和均匀型三种。,2022/11/26,第三章 参数估计理论与应用,本节仅介绍最常用的二次型代价函数,即 当总体的分布密度函数p(X|)已知时,利用X= x1,xN 进行参数估计,通常是采用代价函数的期望值作为评价参数估计量效果的测度,并称之为风险函数。使风险函数最小的参数估计叫做 Bayes 估计;基于二次型风险函数最小的估计称为最小均方误差(minimum mean square error, MMSE)估计。二次型风险函数定义
10、为(3.2.1) 根据条件概率公式,有,2022/11/26,第三章 参数估计理论与应用,其中,p( | x1,xN )是给定N个观测样本X= x1,xN 条件下 的后验分布密度函数。于是,式(3.2.1)可以写成(3.2.2) 为使风险函数RM M S E 最小,对上式取 的偏导,并令其结果为零,便得到由于p(x1,xN ) 是非负的,因此,RM M S E / =0, 等价于上式中=0。故有,2022/11/26,第三章 参数估计理论与应用,(3.2.3) 注意,在式(3.2.3)中,利用了以下事实: 由此可得出重要的结论:未知参数 的MMSE估计是给定样本X条件下的条件均值。 例3-4
11、某一随机参量x 服从高斯N(mx,Cx)分布,用仪器可测量其线性组合y ,即(1)式中,yN 维,kNM 维,x M维,e N 维。,2022/11/26,第三章 参数估计理论与应用,其中,测量误差 e 服从高斯N(0,Ce)分布;k 为给定的常数阵。假设 () e 与 x 独立; () e 与 x 相关,互协方差函数为Cxe 。 试分别求出两种情况下的MMSE估计x(y)和估计误差x (y)的协方差R x(y)。 解 如果将 x 看作未知参数,那么,根据上面讨论, x 的MMSE估计是给定观测样本y1,yN 时 x 的条件均值。因此,可利用公式(1.4.16)和(1.4.17)pp.29 (
12、2)(3)来求解。,2022/11/26,第三章 参数估计理论与应用,对式(1)两边取均值,得到 (4) 将式(1)和(3)代入有关定义式,得(5)(6)(7),2022/11/26,第三章 参数估计理论与应用,(i)当 e与 x 互相独立,Cxe=0。将式(4)(7)代入式(2)和(3),得到x(y)的估计及协方差R x(y)(ii)当 e 与 x 相关,只需注意Cxe 0即可。 这个问题留给读者解决。请构造一组数据,在Matlab 平台上仿真这两种的估计结果。3.2.2 最大似然估计 最大似然估计(maximum likelihood estimate, ML估计)的基本思路是:在给定参数
13、条件下,将观测样本 x,K,2022/11/26,第三章 参数估计理论与应用,联合条件概率密度函数p(x|)视为真实参数 的函数,即似然函数L(x,) (包含未知参数的可能性函数),然后利用容量为 N 的观测样本x= x1,xN ,求出使L(x,)达到最大化的参数 作为=1,p的估计值。在数学上,通常将未知参数 的最大似然估计量记为式中是参数 的值域。故ML估计量 ML就是p(x|)的全局极大点。 由于对数函数是严格单调的,故 L(x,) 的极大点与ln L(x,)的极大点是一致的。通常,将ln L(x,)称为对数似然函数。于是,ML估计量 ML可由(3.2.4),2022/11/26,第三章
14、 参数估计理论与应用,确定。如果 x1,xN 是N个独立的观测样本,则对数似然函数可写作(3.2.5) ML估计量 ML只要能够求出来,总是比较好的估计,它具有以下性质:最大似然估计是有效和一致估计;对于大的N,ML估计量 ML服从高斯分布,并且是无偏的,方差可达CR下界。 例3-5 设样本x= x1,xN 服从高斯分布N(m,),则其对数似然函数为,2022/11/26,第三章 参数估计理论与应用,分别求 lnL 关于 m 和2 的偏导,并令它们等于零,得到解得显然有 可见,均值的ML估计 ML 是无偏的,而方差的ML估计 ML是有偏的。但若将 ML N / (N-1)作为新的估计量,则该估
15、计是无偏的。,2022/11/26,第三章 参数估计理论与应用,计算L(x,)的相对于m 的二阶偏导数,有 由式(3.1.1)得Fisher 信息:Cramer-Rao不等式为等号成立的充要条件是事实上,我们有,2022/11/26,第三章 参数估计理论与应用,因此,只要取K(m)=N/2,ML估计 ML就可达CR下界2/N。这表明ML估计 ML是一有效估计量。 例3-6 (二元阵最大似然测向系统 ) 设二元阵布置在 x轴上,两个基元坐标分别为x1 和x2 ,如图3-2所示。如果取x1=0,则 x2=d,d为两传感器的位置间隔。假设信号为平面波,入射角为,则传感器1相对于传感器2的信号时延为
16、(3.2.6)式中,c 为声速。我们的问题是如何利用二元阵中两个输入过程的时差来测定目标的方位角。,2022/11/26,第三章 参数估计理论与应用,解 设两传感器的零均值接收过程可分别表示为其中,si 为单频平面波信号,wi (i=1,2)为零均值高斯噪声,二者互相独立。 如果采用图3-3所示的时延补偿方法,则单频平面波信号的归一化声程补偿(或指向)向量 v 在所考虑的二元阵中可表示为 下面,我们来推导信号的协方差矩阵和噪声的协方差矩阵,以便于求出观测样本的似,2022/11/26,第三章 参数估计理论与应用,函数。记输入信号和输入噪声的傅立叶系数为设信号和噪声的功率谱分别为S (n) 和N
17、 (n) ,那么,由公式(1.4.6) pp.26, n= 2n / T) 信号和噪声的协方差矩阵可分别表示为(3.2.7),2022/11/26,第三章 参数估计理论与应用,于是,观测样本的似然函数可表示为(3.2.8)式中,X (1)= X1 (1),X2(1)T , ,X (TW) =X1 (TW),X2(TW)T 是传感器的接收过程x=x1,x2T的傅立叶系数阵; T 是过程的持续时间(采样数据的长度),W 是接收过程的带宽。 容易验证,行列式| Cw + Cs | 与时延无关。于是,ML估计就是选择,使ln p(X |)最大,也即使式(3.2.8)的指数函数(3.2.9),2022/
18、11/26,第三章 参数估计理论与应用,最大。下面,我们从式(3.2.9)出发,推导时延参数 的最大似然估计的等效形式。为此,首先引进下列求逆公式(3.2.10)式中,A为nn非奇异矩阵;g为n1列向量。证明留给请读者课外练习【利用恒等式 g(1+gHA-1g)=(A+ gHg)A-1g)】。 利用求逆公式,可知 ,2022/11/26,第三章 参数估计理论与应用,将上式代入式(3.2.9),略去与无关的量T/N (n)。因此,选择使式(3.2.9)最大,等价于使下式(3.2.11) 最大。现引入记号在此将 X(n,) 视为某时间函数 x(t, )在时间(t-T,t)内的傅立叶系数。将上述替换
19、量代入式(3.2.11)后,再应用周期函数的 Parseval 公式,就有,2022/11/26,第三章 参数估计理论与应用,略去无关紧要的常数项1/2,计算 z(x, ) 的结构如图3-4所示。调节时延,使输出 z(x, )达到最大,相应的时延就是真实时延的ML估计 ML。 根据ML估计的传递性,由式(3.2.6)可得真实方位的ML估计 (3.2.12),xH0(t),z(x,),x1(t),x2(t),H0(),()2,图3-4 二元阵最大似然测向系统,exp(-j),2022/11/26,第三章 参数估计理论与应用,二元阵最大似然测向系统与二元阵似然比检测系统具有完全相同的结构。这是因为
20、:在 H1 情况下, p(X | ) 等价于 p(X | H1),后者也可看作是时延参数的函数;而在 H0 情况下,p(X | H0) 与无关。因此,选取 使似然函数最大,也就是使似然比p(X | H1)/ p(X | H0)最大。由此可见,检测问题与参数估计问题是密切相关。 顺便指出,可用测向测距近似公式(3.2.13) 构成最大似然联合测向测距系统。其中,di 表示第i 个传感器与“基准” 传感器位置的间距;D 表示目标与“基准” 传感器位置之间的距离。,2022/11/26,第三章 参数估计理论与应用,3.3 基于模型的参数最小二乘估计,最小二乘法(Least square method
21、,LS)是一种不需要任何先验知识的参数估计方法。在被测系统的静态(稳态)模型和动态模型的参数辨识中,最小二乘法是最常用的参数估计方法,在测控技术领域获得了广泛的应用。3.3.1 最小二乘估计器及其统计特性 在一般的最小二乘问题中,线性系统的参数化模型可以表示为(3.3.1) 其中,u=u1,upT 是模型的输入向量,f1,fn 是u 的已知函数,也可以是未知输入的观测数据; 1, ,n 是待估计,2022/11/26,第三章 参数估计理论与应用,的参数,又称为回归系数; y 是系统的输出。 当 f1,fn 是u 的稳态响应状态或是实测的确定性变量,且 y 是系统的稳态输出,则称式(3.3.1)
22、是描述线性系统的静态模型;当 y 是u 的动态响应或瞬态观测数据,那末式(3.3.1)就是描述线性系统的动态模型。 为了估计未知参数i, 必须做实验来获得数据对u i yi 或 fk (u i) yi, i=1,2,N, k=1,2,n;N n 以构成训练数据。将数据对代入方程 (3.3.1),可以获得一组线性方程: 用矩阵表示方法,将上式写成更简洁的形式,即,2022/11/26,第三章 参数估计理论与应用,(3.3.2)其中 为了唯一地识别出未知参数,通常要求 N n,即数据对的数目多于拟合参数的数目。满足所有 N 个方程的精确解是不可能的,因为观测数据难免受到噪声的污染,或者描述系统的参
23、数化数学模型不够精确。故必须考虑随机噪声或建模误差,在方程(3.3.2)中引入随机误差向量e,得到 (3.3.3),2022/11/26,第三章 参数估计理论与应用,参数的最小二乘估计 LS ,就是使目标函数 (3.3.4) 达到最小值的参数估计。为此,通常都采用求极值的方法。 将式(3.3.4)展开后,得到 对 求导数,有 J 极小化的条件是一般均假设T非奇异,于是,LS 有唯一的解:,2022/11/26,第三章 参数估计理论与应用,(3.3.5) 式中+表示的伪逆。 上述表示误差向量对整体平方误差有相同权重。可以进一步扩展,令每个误差项有不同的权重。设W 为所需的权值矩阵,它是对称和正定
24、的,则加权的目标函数为(3.3.6) 按上述求极小值的方法,可得加权的最小二乘估计量:(3.3.7)显然,当W 选为单位矩阵时, WLS = LS。 例3-7 考虑最简单的一维线性模型(静态的),即只有一个控制变量 u 的情形,这时模型的形式是,2022/11/26,第三章 参数估计理论与应用,求未知参数0 和1的LS估计量。 解 实际过程输出是模型的输出加上一随机误差项,即观测数据对ui, yi的结构应为式中,ei 称为模型的残差或观测噪声,一般认为是零均值、相互独立的随机序列,并具有相同的方差2。将上式写成矩阵形式: 根据式(3.3.5),可得LS估计量:,2022/11/26,第三章 参
25、数估计理论与应用,如果进一步假定 ei 的分布是正态的,则容易验证,方差2 的ML估计量是 作为练习,请读者在Matlab平台上输入以下数据和函数:x=1 2 3 4 5; y=1.3 1.8 2.2 2.9 3.5; p, s=polyfit(x, y, 1)% 生成拟合一次多项式运行结果是:p=0.55 0.69,s=0.1643。即y=0.55x+0.69标准差为0.1643。,2022/11/26,第三章 参数估计理论与应用,例5-8 (可线性化的非线性静态模型曲线回归)假设有一个非线性模型的输出为 其中,x1,x2 为确定性输入变量,a,b和 c为待估计参数。 解 上式两边经简单的代
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数估计 理论 应用 第三 课件
链接地址:https://www.31ppt.com/p-1450823.html