系统辨识-1-概述ppt课件.ppt
课 程 要 求,1 学时:322 目的: (1)培养独立学习一门新课程的能力,为今后学习和研究打下基础。 (2) 掌握基本的辨识理论和辨识技术 (3) 能独立设计辨识实验,并编程计算3 考核: 通过编程对其进行辨识,并写出报告,系 统 辨 识System Identification,系统辩识 System Identification : 又译为“系统识别”和“系统同定”,目前尚无公认的统一定义。中国大百科全书中记述为: 系统辩识是根据系统的输入/输出时间函数,确定系统行为的数学模型,是现代控制理论的一个分支。,(1) 辨识是研究建立系统或生产过程数学模型的一种理论和方法。(2) 辨识是一种从含有噪声的测量数据(输入、输出数据)中提取被研究对象数学模型的一种统计方法。(3) 辨识模型是对象输入输出特性在某种准则意义下的一种近似。近似的程度取决于人们对系统先验知识的认识和对数据集性质的了解程度,以及所选用的辨识方法是否合理。,(4) 辨识技术帮助人们在表征被研究的对象、现象或系统、过程的复杂因果关系时,尽可能准确地确立它们之间的定量依存关系。(5) 辨识是一种实验统计的建模方法。 通俗地说,系统辩识是研究怎样利用对未知系统的试验数据或在线运行数据(输入/输出数据)建立描述系统的数学模型的科学。,“系统辩识”是“系统分析”和“控制系统设计”的逆问题。系统的复杂性:基于实际系统的复杂性,描述其特性的数学模型具有“近似性”和“非唯一性”;辩识方法亦有多样性。没有绝对好的数学模型和绝对好的辩识方法。什么是较好的模型?依据辩识的不同目的,有不同答案。一般说,能够满足目的要求的,比较简单的模型,是较好的模型。,系统辨识的发展三十年代以前:人们主要利用概率统计理论中的统计回归方法等来处理在从事生产实践、社会活动的研究中遇到的大量的数据资料。三十年代到五十年代末:由Nyquist 所倡导的试验研究法丰富了经典理论,但还是仅局限于对动态系统的传递函数或脉冲响应的研究(测试阶跃响应、脉冲响应和频率特性等古典辩识方法 ) 。,六十年代以后:随着现代控制理论的迅速发展,Kalman 滤波理论的广泛应用以及计算机技术的发展,系统辨识这门学科开始迅速而蓬勃发展,进入了现代辨识方法的研究(最小二乘等时域方法)。八十年代以来:由于大系统、系统工程及智能控制等的需要,系统辨识已成功地应用于航空航天、生物医学系统、经济系统及机器人工程等领域。辨识方法也结合人工智能、模糊理论、神经网络等理论获得了更加广泛地应用。,系统辨识的应用 (1) 进行控制。对于经典控制,已知数学模型可以改善系统的动态特性,进行调节器的参数整定等等。对现代控制系统,有了数学模型,可以进行最优控制、自适应控制等等。(2) 进行预报。有了模型就可作一步、二步、短期、中期甚至长期预报。进行准确的预报对国民经济各部门及至地方,企业等等的发展都有重要意义。(3) 进行规划。正确的规划也是以正确的模型为基础。有了模型,才有可能进行各种方案的最优规划。,(4) 进行仿真研究。有了模型,就可以在计算机上对系统进行仿真研究,实验各种不同的策略,观测其结果,从而分析和制定策略。(5) 估计物理参数。如医务界对于体内参数的测定、矿藏区域储藏的测定,可以通过系统辨识的方法来进行。(6) 生产过程的故障诊断。过程参数监视或破损探测均可通过动态模型来反映。如果模型参数发生了变化,即表示过程有了变化或出现了破损,需要及时采取措施进行处理。,系统辨识当前发展的新热点* 非线性系统辨识(机器人);* 快时变与有缺陷样本的辨识;* 生命、生态系统的辨识;* 辨识的专家系统与智能化软件包的开发;* 基于模糊理论、神经网络、小波变换的辨识方法;* 系统辨识与人工智能、人工生命、图象处理、网络技术和多媒体技术的结合。,第一章 辨识的一些基本概念,一 系统和模型 1 系统system(过程process): 钱学森把系统广义概括为“依一定顺序相互联系着的一组事物”。是一个相对独立、又与外界相互联系的对象。 系统包含了:客观存在的事物及其运动状态,有时也称之为“实体” 。,广义的系统概念:世界上一切由各个相互作用,又相互依赖的事物组成的具有某一特定功能的整体都可以认为是一个系统系统有以下几个特征:1 系统具有相对独立性:它的行为不依赖其他环节的状态。2 系统与外界具有相互联系:它通过某些行为与外界发生着联系,这些行为状态可以称为系统的输入、输出。,2 模型 定义:把关于实际过程的本质的部分信息简缩成有用的描述形式。它是用来描述过程的运动规律,是过程的一种客观写照或缩影,是分析、预报、控制过程行为的有力工具。 模型是实体的一种简化描述。模型保持实体的一部分特征,而将其它特征忽略或者变化。不同的简化方法得到不同的模型。,模型的近似 近似不可能考虑所有因素。精度和复杂度之间是相互矛盾的。 标准或准则:模型的输出响应和实际过程的输出响应几乎处处相等,则模型是满意的。,模型的表现形式 “直觉”模型:司机驾驶、地图、建筑模型、照片、软件演示文档等 物理模型:实际过程的缩小(风洞模型、水力学模型、传热学模型、电力系统动态模拟模型等) 图表模型:以图表形式表现过程的特性(阶跃响应、脉冲响应、频率响应等非参数模型) 数学模型:以数学结构的形式反映过程的行为特性(代数方程、微分方程、差分方程、状态方程等参数模型),数学模型的形式 (1)代数方程(2)微分方程,(3)差分方程 其中: 即有:,(4)状态方程离散化,模型的其他分类1 图表模型:如阶跃响应、脉冲响应、频率响应、温度与热电偶输出关系表 解析模型:代数方程、微分方程、差分方程、状态方程 程序模型:神经网络仿真程序 语言模型:模糊关系模型,模型的其他分类2线性与非线性:系统线性和关于参数空间线性、本质和非本质线性动态与静态:确定性与随机性:宏观与微观:,3 建模方法 机理法:“白箱”理论。 测试法:“黑箱”理论。 两者结合:“灰箱”理论。 模糊推理建模法:一种基于模糊推理的关于控制系统的建模方法。,统计数据推演法:某些系统和过程,如地震过程、生态系统、气候变化过程等,其外部激励往往不能测量。此时只能利用(输出的)统计数据来进行建模。一般称这种方法为时间序列建模法,外部激励不能测量时系统的输出为时间序列。,建模的基本原则: 目的性:明确建模的目的,如控制、预测等。因为不同的建模目的牵涉到的建模方法可能不同,它也将决定对模型的类型、精度的要求。 实在性:模型的物理概念要明确。,可辨识性:模型的结构要合理,输入信号必须是持续激励的;另外数据要充足。节省性:待辨识的模型参数个数要尽可能地少。以最简单的模型表达所描述的对象特征。,二 系统辨识 1 辨识定义 Zadeh对辨识的定义(1962年) 辨识就是在输入和输出数据的基础上,从一组给定的模型类中,确定一个与所测系统等价的模型。,Liung 对辨识的的定义(1978年)系统辨识有三个要素数据、模型类和准则。系统辩识是按照一个准则,在模型类中选择一个与数据拟合得最好的模型。 Liung 认为,实际系统的复杂性很难找到一个适用的模型与之等价。因此,系统辩识的任务只是要求从输入输出数据出发,找到一个与实际系统相逼近的模型。该定义体现了逼近的观点。,系统辩识三要素(1) 输入、输出数据:这是辨识的基础。 在进行辨识前,首先要设计合理的输入数据,使其能充分激励系统 。主要包含 a 信号的频谱对于辨识对象要足够宽,最好采用白噪声信号。 b 信号不会对系统的正常工作产生影响.即幅值不能过大;不应该有直流干扰。,(2) 模型类:指要寻找什么类型的模型,即确定描述系统的模型类型。 模型有静态和动态;线性和非线性;确定和随机模型之分。 静态系统任一时刻t的输出仅取决于此时刻的输入; 动态系统的输出则取决于某一段时间 t1 , t2 内的输入和输出,即动态系统是有记忆功能的。 如果t1,t2 是有限区间,则称动态系统具有有限记忆。,若t2 t ,则此刻输出仅取决于以往的输入和输出。此时称系统是因果的。一般的物理系统都是具有无限记忆的因果系统。 当系统的输入u(t)、输出y ( t )之间的关系满足叠加原理时,称为是系统线性的。否则系统是非线性的。如果系统输出关于参数空间是线性的,则称为系统关于参数空间线性。,有些系统模型本来为非线性的,但经过适当的数学变换可以成为线性模型,则这种系统原来的模型称为本质线性,否则称为本质非线性。 此外,还有确定性和随机模型.如果系统模型的输出完全能够由输入决定,则为确定性模型,否则为随机模型。,(3)等价准则: 它是用来衡量模型接近实际过程的标准。通常用一个误差泛函来表示,所以又称为误差准则或损失函数。 函数的一般形式: J()=f(k) 常用形式:,输出误差准则:,Z(k),输入误差准则:,广义误差准则:,2 辨识的内容和步骤 辨识的主要内容:实验设计模型结构辨识模型参数辨识模型检验,(1)实验设计 包含:输出、输入信号(幅度、频带等)采样时间辨识时间(数据长度)开环或闭环辨识离线或在线辨识,A 输出、输入信号设计选择并确定变量 原则:输入变量应能够设置;输出变量应能够直接测量到。持续激励 对输入变量的最低要求:在实验期间,输入信号必须充分激励过程的所有模态。谱分析角度看,输入信号的频谱必须足以覆盖过程的频谱。,幅值设计: 此外还要求u(k)的幅度不宜过大或过小。 幅度过大,会使系统进入非线性区域;而幅度过小,又会使系统中的噪声占主导地位。,数据的零值化处理(去除直流分量) u(k)对系统的“净扰动”要小,即u(k)中所含的直流分量要尽可能地小,以保证系统不会偏离正常工作状态。差分法平均法剔除高频成分(一般采用低通滤波器),最优信号定理(Cramer-Rao不等式 ):考虑一个随机向量Z,它在参数条件下的条件概率密度为P(z |)。在一定的正则条件下,参数的任何无偏估计都将满足不等式其中M为Fisher信息矩阵,Fisher信息矩阵:定理:如果模型噪声向量是零均值白噪声,并设模型噪声服从正态分布,则最小二乘参数估计值是有效估计值,即参数估计值偏差的协方差阵达到Cramr-Rao不等式的下界,最优输入就是使Fisher信息矩阵的逆的一个标量函数达到最小,这个标量函数就可以作为评价模型精度的度量函数。,D最优准则取迹(A最优)取行列式(D最优) D最优结论:如果模型是正确的,且参数估计值是无偏最小方差估计,那么参数估计值的精度通过Fisher信息矩阵M依赖于输入信号。,B 采样时间的选择 满足采样定理,即采样速度不低于信号截止频率的两倍,即T0 不宜太大,太大时信号的信息量损失太大。这将直接影响辨识结果的精度。一般远大于两倍。 但采样间隔T0的选取也不宜太小。这是因为当T0 太小时,由于计算机的截断误差,k + 1 时刻的输入、输出数据的采样值u( k + l ) , z( k + l )与k时刻的u( k ) ,z( k)可能没有差别,这将导致病态方程组。,与模型最终应用时的采样时间尽可能保持一致经验公式:T0 =T95 /(515),T0表示采样时间,T95是过程阶跃响应达到95时的调节时间。,C 确定辨识时间(实验期限)设N 为采样次数,则NT0 实验期限。工程上可选这里Ta 为系统的主要时间常数,可理解为主导极点实部的负值的倒数。主导极点记为 它们是离虚轴最近的一对极点。,动态特性将主要由这一对极点决定,即当 一10 时 ,y(t) y0 从而系统进入稳态。,D 确定采用开环或闭环辨识 一般作开环辨识,原因是我们要求输入 u(k)能设置。对于闭环系统来说,它的输入是输出的函数。从而u(k)不能任意设置。 但有些系统,如生物系统、化工系统等,反馈是系统本身固有的,或当开环系统不稳定时,就要作闭环辨识。,E 确定离线辨识还是在线辨识离线辨识是在所有实验数据采集完了之后才计算结果。,在线辨识中采集数据和计算结果是同时进行的。,(2) 模型结构辨识 模型结构辨识包括模型验前结构的假定和模型结构参数的确定这两部分内容。模型结构辨识指的是:根据辨识的目的,利用已有的知识(如定律,定理,原理等)对要研究的问题进行分析,以确定一个验前假定模型。,为此首先要明确所要建立的模型是:静一动?连续时间一离散时间?(连续时间系统每一个变量的值在任何时刻都可以发生变化;而离散时间系统并非每一个变量都可以在任一时刻发生变化。)线性一非线性? 本课程只研究线性、离散时间系统的辨识问题。,可以证明线性连续时间系统的辨识问题可化为一个等价的离散系统辨识问题。这种系统可用差分方程的形式加以描述: 其中,(3)参数估计当模型结构确定之后,就需要进行参数辨识,即利用输入输出数据u(k) 和z(k)确定 的数值。以后将会看到,辨识过程本身也是一个动态系统,所以还应分析它的动特性。这些是本课程的重点。,(4)模型验证(检验) 模型验证可以有以下几条途径:(a) 检验在辨识输入信号u(k)作用下,模型的输出zm(k)和实际系统的输出z(k)是否吻合。将同一输入u(k)用于得到的模型和实际系统,计算或通过仿真得到模型的输出zm(k)若zm(k)与z(k)在给定的某种意义上是接近的,则可认为模型是可靠的,否则,需要修改模型结构假设,重复进行实验。,模型验证的原理如图所示,其中 p 1,(b) 检验残差的白色性也是一种简单且有效的方法。在相同输入驱动下当系统模型的输出与系统的输出之差具有很好的白色性则模型的特性较好地表达了系统的动态特性。 (c) 因为辨识所用的输入信号和正常工况下的输入信号不一样,而辨识的主要目的是为了控制,也可用正常工况下系统的输入检验模型和实际系统的输出是否吻合,以确定模型的有效性。,(d) 利用不同时间区段内采集的数据,分别建立模型。如果模型的特性基本相符,则模型是可靠的。 (e) 利用两组不同的数据,独立辨识出模型,并分别计算出损失函数,然后数据交叉使用再计算出损失函数。如果没有明显变化则模型是可靠的。 (f) 增加辨识中的数据长度,如果损失函数不再显著下降,则模型是可靠的。,辨识的一般步骤,我们将结合一个长网造纸的实际例子来说明辨识的一般步骤。,长网造纸的流程简图,对于造纸企业来说,质量控制就是要控制好成品纸的定量G与水份W。而纸的定量与水份与纸浆浓度D、纸浆流量F、车速V及蒸汽压力P都有关系:G=f(D,F,V,P)W=g(D,F,V,P)为了采用计算机对上述过程进行控制,需要建立数学模型。,第一步:明确辨识目的。 为了实现实时控制成品纸的定量G与水份W,所建系统模型应该是以G 、W 为输出的动态模型。第二步:收集先验知识。 经过现场调查,我们发现: (1)车速调整存在同步困难,而不同步会引起断纸,因此,通常将车速设为恒定;,(2)流量的改变到定量的改变存在约60秒的延迟,而响应过程只有约2秒;(保持浓度不变)(3 )浓度的改变到定量的改变存在约120秒的延迟,而响应过程约80秒;(保持流量不变)(4 )蒸汽压力的改变到水份的改变存在约45秒的延迟,而响应过程约60秒;(保持浓度与流量不变),第三步:设计辨识试验辨识试验的目的是使采集到的数据能反映系统的动态特性,因此要对系统进行分块,设计对分块后系统施加的激励信号,设计数据采集时的采样频率。对于本例,其中的一个分块为流量和蒸汽压力对定量、水份的影响;,试验时,保持车速和纸浆浓度不变;对流量和蒸汽压力,分别施加伪随机序列扰动,幅度以不引起断纸为限;设定采样频率为2,试验时间为1000秒。采集信号为:定量、水份、纸浆流量和蒸汽压力,第四步:现场准备。现场准备要做以下几件事:向企业申请试验时段;准备扰动信号发生器,并通过预发信号,检验扰动信号是否准确;测验现场信号的干扰情况,必要时设计模拟信号滤波器;准备模数转换设备,调好信号的零迁和放大参数;现场接线,将生产设备、试验设备与计算机连接。,第五步:数据采集。将采集到的数据存盘,并编写数据说明文件;第六步:数据预处理。对采集到的原始数据进行变送器非线性校正、数字滤波、标准化、重抽样等加工,使数据适合辨识工具的处理,同时也应满足模型要求。以上步骤为数据观测过程。,第七步:选择模型类。选择模型类的工作有两部分:其一是选择应用模型,通常应依据辨识目的来选择;其二是选择参考模型,参考模型是便于进行结构辨识和参数估计的模型第八步:结构辨识与参数估计。应用辨识理论和方法编制程序,对第六步所得的数据进行拟合,得到参考模型的阶次和参数。,第九步:模型检验。对所得到的参考模型按评判准则进行检验,如不达要求,则分析问题所在,并返回到前期各相应步骤。第十步:模型转换。将参考模型转换为应用模型。第十一步:应用评价。从应用角度评价模型,如不符合应用要求,应分析问题所在,并返回到相应步骤。,