矩阵的标准型及分解.ppt
第三章 矩阵的标准形与若干分解形式,1 矩阵的相似对角形2 矩阵的约当标准形3 哈密顿-开莱定理及矩阵的最小多项式4 多项式矩阵与史密斯标准形5 多项式矩阵的互质性与既约性6 有理分式矩阵的标准形及其仿分式分解7 系统的传递函数矩阵*8 舒尔定理及矩阵的QR分解9 矩阵的奇异值分解,标准型的理论源自矩阵的相似性,因为相似矩阵有许多相似不变量:特征多项式、特征值(包括代数重数和几何重数)、行列式、迹及秩等,并且特征向量也可以借助于可逆的相似变换矩阵互相求出。这自然导出了寻找相似矩阵集合中的“代表矩阵”的问题。“代表矩阵”当然越简单越好。对于可对角化矩阵,“代表矩阵”就是特征值组成的对角矩阵。特别地,对于正规矩阵,可逆的相似变换矩阵特殊化为酉矩阵或正交矩阵。但是令人非常遗憾的是:一般矩阵未必与对角矩阵相似!,3.2、矩阵的Jordan标准型,由于一般矩阵与对角矩阵不相似,因此我们“退而求其次”,寻找“几乎对角的”矩阵。这就引出了矩阵在相似下的各种标准型问题,其中Jordan标准型是最接近对角的矩阵,只在第1条对角线上取1或0。弄清楚了矩阵相似的本质,理论上、计算上以及应用上的许多问题就容易处理了,当然花费也大了。,一、Jordan标准型的概念,定理 1 设 是复数域 上的线性空间 上的线性变换。令 在 的一组基下的矩阵表示为,如果 的特征多项式可分解因式为,适当选取每个子空间 的基(称为Jordan基),则每个子空间的Jordan基合并起来即为 的Jordan基,并且 在该Jordan基下的矩阵为块对角阵,称 为 的Jordan标准型。并称方阵,为 阶Jordan 块。,定理 2 设。如果 的特征多项式可分解因式为,则 可经过相似变换化成唯一的 Jordan标准型(不计Jordan块的排列次序),即存在可逆矩阵(称为Jordan变换矩阵)使,或者 有Jordan分解,二、Jordan标准型的一种简易求法,把 的同一个特征值的若干个Jordan块排列在一起,就得到Jordan标准型,其中 是 阶的Jordan子矩阵,有 个阶数为 的Jordan块,即,其中 是 阶的矩阵。,根据 的结构,将Jordan变换矩阵 列分块为,由,可知,进一步,根据 的结构,将 列分块为,其中 是 阶矩阵。,由,可知,最后,根据 的结构,设,由,可知,解这个方程组,可得到Jordan链,这个名称也可以这样理解:,其中,是矩阵 关于特征值 的一个特征向量,则称为 的广义特征向量,称 为 的 级根向量。,当所有的 时,可知,此时矩阵没有广义特征向量,的各列是 的线性无关的特征向量,因此Jordan块 都是一阶的,此时Jordan标准型为 即矩阵 是可对角化矩阵。显然正规矩阵是一类最特殊的可对角化矩阵。,例 3 求矩阵 的 Jordan标准型 和相应的Jordan变换矩阵,其中,解:特征值为,所以设,因为特征值 为单根,所以,并从 解得对应的特征向量为,因此 中只有一个Jordan块,即,求解,可得所需的广义特征向量,对重根有几个特征向量,就有几个约旦块,综合上述,可得,例 4 用 Jordan标准型理论求解线性微分方程组,解:方程组的矩阵形式为,这里,其中,由上例,存在可逆线性变换 使得,所以原方程组变为,即,解得,最后,由可逆线性变换 得原方程组的解,例 5 现代控制理论中,线性定常系统(Linear time invariant,LTI)的状态空间描述为,这里矩阵 表示了系统内部状态变量之间的联系,称为系统矩阵;矩阵 称为输入矩阵或控制矩阵;矩阵 称为输出矩阵或观测矩阵;矩阵 称为直接观测矩阵。,做可逆线性变换,则,显然,最简单的 就是 的Jordan标准型。此时虽然没有实现状态变量间的完全解耦,但也达到了可能达到的最简耦合形式。因此线性变换就是状态空间的基底变换,其目的在于寻找描述同一系统的运动行为的尽可能简单的状态空间描述。,求下列状态方程的约当标准型:,这里矩阵 是特征多项式 的友矩阵。,解:,的特征值为,故设,因为特征值 为单根,所以,并从 解得对应的特征向量为,只解得唯一的特征向量为,对于二重特征值,由,因此 中只有一个Jordan块,即,求解,可得所需的广义特征向量,综合上述,可得,因此经过可逆线性变换 后,系统矩阵 和控制矩阵 分别为,例 6 求矩阵 的 Jordan标准型 和相应的Jordan变换矩阵,其中,因为特征值 为单根,所以,解:的特征值为,则,并从 解得对应的特征向量为,因此 中有两个Jordan块,即,求解,无解!,求解,可得所需的广义特征向量,综合上述,可得,综合上述,可得,要特别当心的是,如果选取三重特征值 的特征向量为,求解,无解!,求解,也无解!,这说明,在选取特征值 的 个特征向量,前述求法显然存在有待深化。,这说明,在选取特征值 的 个特征向量,三、Jordan标准型的一般方法,有非零解的最小正整数。,根据前面的分析,这个最小正整数也就是相应于特征值 的最大Jordan块的阶数。,设 为复方阵 的代数重数为 的特征值,为使得等式,成立的最小正整数(称为特征值 的指标),即使得,(3)计算。,按此计算出的 就是 阶Jordan块 的个数。不计顺序,就唯一确定了相应的Jordan标准型。,规定。(1)计算,(2)计算 直至出现,则,则可得最长的Jordan链,取 满足,至于相应的子矩阵 的构造,我们通过一个例子来说明。假定,这里,对于另外两条长为 2 的Jordan链,可这样选取:,例 7 求矩阵 的 Jordan标准型 和相应的Jordan变换矩阵,其中,因为特征值 为单根,所以,解:的特征值为,则,并从 解得对应的特征向量为,对于三重特征值,计算得,从而得最长的Jordan链,解 得非零向量,显然 线性无关。,解 得非零向量,令,可以验证成立等式,3.3、Cayley-Hamilton定理及其应用,Jordan标准型的计算复杂,而特征多项式与之关系密切。由于Cayley和Hamilton发现矩阵的特征多项式是矩阵的零化多项式(相当于零因子式),因此类比多项式的带余除法理论,以适当的零化多项式为商,将矩阵多项式转化为相应的余式,从而降低多项式的次数,就成了另一种思路。,一、Cayley-Hamilton定理,定理1(Cayley-Hamilton定理)阶方阵 是其特征多项式 的“根”,即,定义2 是关于 的多项式。如果,则称 是矩阵 的零化多项式。,显然矩阵 的特征多项式 是矩阵 的一个零化多项式。,例 3 求矩阵 的矩阵多项式,其中,解:矩阵 的特征多项式为,令,则,可知,因此,二、最小多项式(minimal polynomial),定义4在矩阵 的所有零化多项式中,次数最低的首一多项式称为 的最小多项式,记为。,例如矩阵,的最小多项式,因为,定理5 矩阵 的最小多项式 整除 的任一零化多项式。特别地,整除 的特征多项式。,定理5说明可以从矩阵的特征多项式中寻找矩阵的最小多项式。,证明:若 为 的任意零化多项式,则有,因此,由于,所以,由于 的次数小于 的次数,所以,定理6 矩阵 的最小多项式 的根必定是 的特征值;反之,的特征值也必定是 的最小多项式 的根。,特征值与相似关系紧密,相似矩阵的特征多项式相同,那么相似矩阵的最小多项式呢?答案是也相同。所以求矩阵的最小多项式就转化为求其Jordan标准型的最小多项式。但遗憾的是具有相同最小多项式的矩阵未必是相似的(为什么?)。,证明:根据定理5,前半部分显然成立。,若 有特征对,则,因此,那么 的最小多项式为,定理7 矩阵 的最小多项式 是矩阵 的第 个不变因子,也就是说,如果有,这里 为 的Jordan标准型 中包含 的 最大Jordan块的阶数,即指标。,例 8 求矩阵 的 最小多项式,其中,并求矩阵 的矩阵多项式,解:对矩阵 进行初等变换,可得,因此 的最小多项式为,由于,因此,定理9 矩阵 可对角化的充要条件是 的最小多项式没有重根。,例 10 证明幂等矩阵一定相似于对角矩阵。,证明:由于,因此 是 的零化多项式。由于 没有重根,因此 也没有重根。根据定理 9,结论成立。,3.4 Smith标准型,由于Jordan标准型的计算需要特征值、特征向量及广义特征向量的信息,因此与特征多项式关系密切。从函数的眼光看,特征多项式实际上是特殊的函数矩阵(元素是函数的矩阵),这就自然引出对 矩阵的研究,并希望能籍此简化Jordan标准型的繁杂计算。,一、矩阵及其标准型,定义1称矩阵 为 矩阵,其中元素 为数域 上关于 的多项式。,定义2 称 阶 矩阵 是可逆的,如果有 并称 为 的逆矩阵。反之亦然。,注意与数字矩阵不同的是满秩矩阵未必是可逆的。,定理3 矩阵 可逆的充要条件是其行列式 为非零的常数,即,定义4 如果矩阵 经过有限次的初等变换化成矩阵,则称矩阵 与 等价,记为,定理5 矩阵 与 等价的充要条件是存在可逆矩阵,使得,定理6 任意 阶的 矩阵 都必定有一个与之等价的Smith标准型这里,非零对角元是首一(首项系数为1)多项式,并且,例 7 求矩阵 的 Smith标准型,其中,解:对矩阵 进行初等变换,可得,即为所求的Smith标准型。,3.7 传递函数矩阵,一、传递函数阵的引入:,2)MIMO系统,多输入对多输出,故引入传递函数阵G(s),G(s)是一个矩阵,可以表征多个输入对系统输出的影响;,根据传递函数定义,式(1)拉氏变换,并令,得式(2):,1)SISO系统,一输入对一输出,用传递函数G(s)描述,G(s)是一个元素;,整理(2)式得:,注意矩阵求逆,定义传递函数阵:,说明:,1)dim(G(s)=mr,其中dim()表示的维数。m是输出维数,r是输入维数。,3)同一系统,不同的状态空间表达式对应的G(s)是相同的。,例 求由 表述系统的G(s),解:,根据矩阵求逆公式:,由传递函数阵公式得:,求得:,求得传递函数阵为:,例2,求如图所示二输入二输出系统的传递函数阵。,步骤:1、确定G(s)维数。2、确定G(s)中各元素的值。,小结:,第三章 矩阵的标准形与若干分解形式,8.舒尔定理及矩阵的QR分解,3.8 Schur 定理及矩阵的QR分解,QR分解在矩阵计算中占据相当重要的地位。利用QR分解,可以解决各种应用中(例如工程力学、流体力学、图像压缩处理、结构分析等)出现的最小二乘问题、特征值问题等矩阵计算中的核心问题。尤其是基于QR分解的QR算法,是求解小型稠密矩阵特征值问题的最主要的、数值稳定的算法。,使用矩阵语言,就是QR分解:,这里,是酉矩阵或正交矩阵,是上三角阵,此时线性方程组,变成,即三角方程组,例 1 利用Gram-Schmidt方法将下列矩阵进行QR分解:,解:,所以 的QR分解为:,例 9(图像压缩),对于一幅用 像素矩阵 表示的图像,如果传送所有 个数据,显然数据量太大。因此我们希望传送少一些的数据,并且在接收端还能重构原图像。如果我们从矩阵 的SVD中选择 个奇异三元组 来逼近原图像,即用 个数值代替像素矩阵。那么在接收端,我们可得到,从而在接收端近似地重构出原图像。此时,图像的压缩比为,3.9 矩阵的奇异值分解,4.奇异值分解,定理:设,其中,其中V 是正交阵。令,由前式可知,其中,再规范正交化即得,例5、求,的谱分解,的奇异值分解。,解:,标准正交化:,例6、求,的谱分解,的奇异值分解。,解:,