第四章矩阵的标准型.ppt
第四章 矩阵的标准型,标准型的理论源自矩阵的相似性,因为相似矩阵有许多相似不变量:特征多项式、特征值(包括代数重数和几何重数)、行列式、迹及秩等,并且特征向量也可以借助于可逆的相似变换矩阵互相求出。这自然导出了寻找相似矩阵集合中的“代表矩阵”的问题。“代表矩阵”当然越简单越好。对于可对角化矩阵,“代表矩阵”就是特征值组成的对角矩阵。特别地,对于正规矩阵,可逆的相似变换矩阵特殊化为酉矩阵或正交矩阵。但是令人非常遗憾的是:一般矩阵未必与对角矩阵相似!,1、矩阵的Jordan标准型,由于一般矩阵与对角矩阵不相似,因此我们“退而求其次”,寻找“几乎对角的”矩阵。这就引出了矩阵在相似下的各种标准型问题,其中Jordan标准型是最接近对角的矩阵,只在第1条对角线上取1或0。弄清楚了矩阵相似的本质,理论上、计算上以及应用上的许多问题就容易处理了,当然花费也大了。,一、Jordan标准型的概念,定理 1 设 是复数域 上的线性空间 上的线性变换。令 在 的一组基下的矩阵表示为,如果 的特征多项式可分解因式为,适当选取每个子空间 的基(称为Jordan基),则每个子空间的Jordan基合并起来即为 的Jordan基,并且 在该Jordan基下的矩阵为块对角阵,称 为 的Jordan标准型。并称方阵,为 阶Jordan 块。,定理 2 设。如果 的特征多项式可分解因式为,则 可经过相似变换化成唯一的 Jordan标准型(不计Jordan块的排列次序),即存在可逆矩阵(称为Jordan变换矩阵)使,或者 有Jordan分解,二、Jordan标准型的一种简易求法,把 的同一个特征值的若干个Jordan块排列在一起,就得到Jordan标准型,其中 是 阶的Jordan子矩阵,有 个阶数为 的Jordan块,即,其中 是 阶的矩阵。,根据 的结构,将Jordan变换矩阵 列分块为,由,可知,进一步,根据 的结构,将 列分块为,其中 是 阶矩阵。,由,可知,最后,根据 的结构,设,由,可知,解这个方程组,可得到Jordan链,这个名称也可以这样理解:,其中,是矩阵 关于特征值 的一个特征向量,则称为 的广义特征向量,称 为 的 级根向量。,当所有的 时,可知,此时矩阵没有广义特征向量,的各列是 的线性无关的特征向量,因此Jordan块 都是一阶的,此时Jordan标准型为 即矩阵 是可对角化矩阵。显然正规矩阵是一类最特殊的可对角化矩阵。,例 3 求矩阵 的 Jordan标准型 和相应的Jordan变换矩阵,其中,解:特征值为,所以设,因为特征值 为单根,所以,并从 解得对应的特征向量为,因此 中只有一个Jordan块,即,求解,可得所需的广义特征向量,对重根有几个特征向量,就有几个约旦块,综合上述,可得,例 4 用 Jordan标准型理论求解线性微分方程组,解:方程组的矩阵形式为,这里,其中,由上例,存在可逆线性变换 使得,所以原方程组变为,即,解得,最后,由可逆线性变换 得原方程组的解,例 5 现代控制理论中,线性定常系统(Linear time invariant,LTI)的状态空间描述为,这里矩阵 表示了系统内部状态变量之间的联系,称为系统矩阵;矩阵 称为输入矩阵或控制矩阵;矩阵 称为输出矩阵或观测矩阵;矩阵 称为直接观测矩阵。,做可逆线性变换,则,显然,最简单的 就是 的Jordan标准型。此时虽然没有实现状态变量间的完全解耦,但也达到了可能达到的最简耦合形式。因此线性变换就是状态空间的基底变换,其目的在于寻找描述同一系统的运动行为的尽可能简单的状态空间描述。,求下列状态方程的约当标准型:,这里矩阵 是特征多项式 的友矩阵。,解:,的特征值为,故设,因为特征值 为单根,所以,并从 解得对应的特征向量为,只解得唯一的特征向量为,对于二重特征值,由,因此 中只有一个Jordan块,即,求解,可得所需的广义特征向量,综合上述,可得,因此经过可逆线性变换 后,系统矩阵 和控制矩阵 分别为,例 6 求矩阵 的 Jordan标准型 和相应的Jordan变换矩阵,其中,因为特征值 为单根,所以,解:的特征值为,则,并从 解得对应的特征向量为,因此 中有两个Jordan块,即,求解,无解!,求解,可得所需的广义特征向量,综合上述,可得,综合上述,可得,要特别当心的是,如果选取三重特征值 的特征向量为,求解,无解!,求解,也无解!,这说明,在选取特征值 的 个特征向量,前述求法显然存在有待深化。,这说明,在选取特征值 的 个特征向量,三、Jordan标准型的一般方法,有非零解的最小正整数。,根据前面的分析,这个最小正整数也就是相应于特征值 的最大Jordan块的阶数。,设 为复方阵 的代数重数为 的特征值,为使得等式,成立的最小正整数(称为特征值 的指标),即使得,(3)计算。,按此计算出的 就是 阶Jordan块 的个数。不计顺序,就唯一确定了相应的Jordan标准型。,规定。(1)计算,(2)计算 直至出现,则,则可得最长的Jordan链,取 满足,至于相应的子矩阵 的构造,我们通过一个例子来说明。假定,这里,对于另外两条长为 2 的Jordan链,可这样选取:,例 7 求矩阵 的 Jordan标准型 和相应的Jordan变换矩阵,其中,因为特征值 为单根,所以,解:的特征值为,则,并从 解得对应的特征向量为,对于三重特征值,计算得,从而得最长的Jordan链,解 得非零向量,显然 线性无关。,解 得非零向量,令,可以验证成立等式,2、矩阵及其Smith标准型,由于Jordan标准型的计算需要特征值、特征向量及广义特征向量的信息,因此与特征多项式关系密切。从函数的眼光看,特征多项式实际上是特殊的函数矩阵(元素是函数的矩阵),这就自然引出对 矩阵的研究,并希望能籍此简化Jordan标准型的繁杂计算。,一、矩阵及其标准型,定义1称矩阵 为 矩阵,其中元素 为数域 上关于 的多项式。,定义2 称 阶 矩阵 是可逆的,如果有 并称 为 的逆矩阵。反之亦然。,注意与数字矩阵不同的是满秩矩阵未必是可逆的。,定理3 矩阵 可逆的充要条件是其行列式 为非零的常数,即,定义4 如果矩阵 经过有限次的初等变换化成矩阵,则称矩阵 与 等价,记为,定理5 矩阵 与 等价的充要条件是存在可逆矩阵,使得,定理6 任意 阶的 矩阵 都必定有一个与之等价的Smith标准型这里,非零对角元是首一(首项系数为1)多项式,并且,例 7 求矩阵 的 Smith标准型,其中,解:对矩阵 进行初等变换,可得,即为所求的Smith标准型。,二、矩阵的性质,定义8矩阵 的Smith标准型中的非零对角元 称为 的不变因子。,这说明我们可以通过先求Smith标准型,再来确定不变因子。例7就是这么做的。,定义9矩阵 的所有非零 阶子式的首一(最高次项系数为 1)最大公因式 称为 的 阶行列式因子。,定理10等价矩阵具有相同的秩和相同的各级行列式因子。,定理11 矩阵 的Smith标准型是唯一的,并且,定理11说明我们可以用行列式因子来确定不变因子,从而得到唯一的Smith标准型。但行列式因子的计算复杂,所以通过初等变换求Smith标准型显然“胜出”。这在线性代数中处理数字矩阵时也是如此。,定理12矩阵 与 等价的充要条件是它们有相同的行列式因子(或相同的不变因子)。,定义13 将矩阵 的所有非常数不变因子分解为互不相同的一次因式方幂的乘积,所有这些一次因式的方幂(相同的按出现的次数计算)称为 的初等因子。,例如例7中 的不变因子为,因此 的初等因子为,例14 矩阵 的 不变因子为,则矩阵 的 所有初等因子为,如果知道矩阵 的所有初等因子,能否确定相应的不变因子呢?等价矩阵的初等因子是否相同呢?,下面的两个矩阵的初等因子相同,但不变因子不相同,也不是等价矩阵,因为它们的秩不相等:,定理15 矩阵 与 等价的充要条件是它们有相同的初等因子,并且秩相等。,例 16 求矩阵 的 Smith标准型,其中,解:对矩阵 进行初等变换,可得,即为所求的Smith标准型。,例16 中 的不变因子为,因此 的初等因子为,反之,如果还知道 的秩为3,则可知 的三个不变因子,进而可确定 的Smith标准型,因此也可唯一确定相应的Jordan块,即:,总结,等 价,不变因子或行列式因子相同,初等因子相同,秩相同,三、利用Smith标准型求Jordan 标准型,定理17 两个数字方阵相似的充要条件是它们的特征矩阵等价。,定义18 称 阶数字矩阵 的特征矩阵 的行列式因子、不变因子和初等因子为矩阵 的行列式因子、不变因子和初等因子。,定理19 两个数字方阵相似的充要条件是它们有相同的行列式因子(或不变因子)。,不变因子或行列式因子相同,初等因子相同,与 等价,与 相似,与 的秩都为,定理20 复数域上两个数字方阵相似的充要条件是它们有相同的初等因子。,由定理20和例16可知,初等因子 与 阶Jordan块存在一一对应关系。因此可利用特征矩阵的初等因子求矩阵的Jordan标准型。,例21 求矩阵 的 Jordan标准型,其中,解:对矩阵 进行初等变换,可得,因此 的初等因子为,从而所求Jordan标准型为,初等因子法的优缺点都是不能求出Jordan变换矩阵。,3、Cayley-Hamilton定理及其应用,Jordan标准型的计算复杂,而特征多项式与之关系密切。由于Cayley和Hamilton发现矩阵的特征多项式是矩阵的零化多项式(相当于零因子式),因此类比多项式的带余除法理论,以适当的零化多项式为商,将矩阵多项式转化为相应的余式,从而降低多项式的次数,就成了另一种思路。,一、Cayley-Hamilton定理,定理1(Cayley-Hamilton定理)阶方阵 是其特征多项式 的“根”,即,定义2 是关于 的多项式。如果,则称 是矩阵 的零化多项式。,显然矩阵 的特征多项式 是矩阵 的一个零化多项式。,例 3 求矩阵 的矩阵多项式,其中,解:矩阵 的特征多项式为,令,则,可知,因此,二、最小多项式(minimal polynomial),定义4在矩阵 的所有零化多项式中,次数最低的首一多项式称为 的最小多项式,记为。,例如矩阵,的最小多项式,因为,定理5 矩阵 的最小多项式 整除 的任一零化多项式。特别地,整除 的特征多项式。,定理5说明可以从矩阵的特征多项式中寻找矩阵的最小多项式。,证明:若 为 的任意零化多项式,则有,因此,由于,所以,由于 的次数小于 的次数,所以,定理6 矩阵 的最小多项式 的根必定是 的特征值;反之,的特征值也必定是 的最小多项式 的根。,特征值与相似关系紧密,相似矩阵的特征多项式相同,那么相似矩阵的最小多项式呢?答案是也相同。所以求矩阵的最小多项式就转化为求其Jordan标准型的最小多项式。但遗憾的是具有相同最小多项式的矩阵未必是相似的(为什么?)。,证明:根据定理5,前半部分显然成立。,若 有特征对,则,因此,那么 的最小多项式为,定理7 矩阵 的最小多项式 是矩阵 的第 个不变因子,也就是说,如果有,这里 为 的Jordan标准型 中包含 的 最大Jordan块的阶数,即指标。,例 8 求矩阵 的 最小多项式,其中,并求矩阵 的矩阵多项式,解:对矩阵 进行初等变换,可得,因此 的最小多项式为,由于,因此,定理9 矩阵 可对角化的充要条件是 的最小多项式没有重根。,例 10 证明幂等矩阵一定相似于对角矩阵。,证明:由于,因此 是 的零化多项式。由于 没有重根,因此 也没有重根。根据定理 9,结论成立。,