第6章-线性变换和特征值课件.ppt
第六章 线性变换和特征值,6.1 n维空间的线性变换6.2 方阵的特征值和特征向量 6.3 相似矩阵与矩阵的对角化 6.4 实对称矩阵的对角化 6.5 二次型及其标准形 6.6 奇异值分解简介 6.7 应用实例 6.8 习题,6.1 n维空间的线性变换,定义6.1 设 X,Y 是两个非空集合。若对于X 中的任一元素x,按照一定的对应法则T,总有Y中一个确定的元素y与之对应,则称 T 为从集合X到集合Y的映射,记为 或,称y是X在映射T下的像,x是y在 映射T下的源,X称为映射T的源集,像的全体所构成的集合称为像集,记作。,定义6.2 设 是实数域上的向量空间,T是一个从 到 的映射,若映射T满足 1)2)则称T为从 到 的线性映射,或称线性变换。线性映射就是保持线性组合的映射。,例6.1 试证所有矩阵相乘的关系式 即 都是 的线性映射。证:利用矩阵的数乘及乘法运算,是 的映射。显然有 及 即T是 的线性映射。,例6.2 向量空间V中的恒等变换 是线性变换。证明:设,则有 所以恒等变换E是线性变换。,6.2 方阵的特征值和特征向量,6.2.1 特征值和特征向量的定义和计算 定义6.3 设 是 阶方阵,若存在数 和 维非零列向量,使得(6-1)成立,则称数 为方阵A的特征值,称非零向量 为方阵A对应于特征值 的特征向量。将(6-1)式变形为(或)(6-2),满足这个方程的 和 就是我们要求的特征值和特征向量。(6-2)式是含个 方程的 元齐次线性方程组,它有非零解的充要条件是(6-3)记作(6-4)称 为方阵A的特征多项式,方程 称为方阵A的特征方程,特征值即为特征方程的根。由于 是 的 次多项式,所以方程 在复数域内有 个根(重根按重数计算)。,矩阵A的特征值和特征向量的计算步骤:第一步:求特征值。先通过行列式(6-4)的计算,写出其特征多项式,这一步的难度是计算一个高阶的矩阵的行列式,需要很大的计算工作量;第二步:并进行因式分解 然后求出特征方程 的全部根 这就是A的所有特征值;第三步:把每个特征值 分别代入方程,求齐次线性方程组 的非零解,它就是A对应于特征值 的一个特征向量(不是惟一的)。,例6.4 求矩阵 的特征值和特征向量。解:A的特征多项式 所以A的全部特征值为 对于特征值 解齐次线性方程组,即 可得它的一个基础解系,所以 都不为 零)是A对应于特征值 的全部特征向量。对于特征值,解齐次线性方程组,得它的一个基础解系,所以 是A对应于特征值8的全部特征向量。,6.2.2 方阵的特征值和特征向量的性质 性质1 阶矩阵A与其转置矩阵有相同的特征值。性质2 设 是矩阵A的 个特征值,则 1)2)称 为矩阵A的迹,记为,性质3 设 为方阵A的特征值,则 1)当A可逆时,是 的特征值 2)是A的伴随矩阵 的特征值 3)是 的特征值;进而有矩阵A的 次多项式 的特征值为,例6.5 设矩阵 1)求及的特征值;2)进一步求矩阵的特征值。解:1)由A的特征方程 可得A的全部特征值为1,2,-1。的特征值为,即-2,13,-8。,2)解法1:先计算,令,求出特征方程 的根即可。解法2:因为 所以A可逆,为对应于A的特征值 的特征向量,则 又 所以 从而矩阵 的特征值为,即,定理6.1 设 为方阵A的互不相同的特征值,分别为对应于特征值 的特征向量,则 线性无关。推论 矩阵A的 个互不相同特征值所对应的 组各自线性无关的特征向量并在一起仍是线性无关的。,6.2.3 特征值和特征向量的MATLAB求法 MATLAB提供了计算方阵的特征值和特征向量各步骤的函数。这三个步骤是:(1)用f=poly(A)可以计算方阵A的特征多项式系数向量f;(2)用lamda=roots(f)可以求特征多项式f的全部根lamda(表示为列向量);(3)用函数p=null(lamda*I-A)直接给出基础解p,将n个特征列向量p排在一起,就是的特征向量矩阵。,取例6.4为典型,解题的程序ea604为 A=3,2,4;2,0,2;4,2,3;f=poly(A),r=roots(f),r=real(r)B1=r(1)*eye(3)-A;B1=rref(B1,1e-12),p1=null(B1,r)B2=r(2)*eye(3)-A;p2=null(B2,r)B3=r(3)*eye(3)-A;p3=null(B3,r),程序运行的结果为:f=1.0000-6.0000-15.0000-8.0000(特征多项式系数向量)r=8.0000(三个特征根即特征值,后两个是重根)-1.0000+0.0000i(微小虚数可用r=real(r)去除)-1.0000-0.0000i,实际上MATLAB已经把求特征根和特征向量的步骤集成化,其中也包括了处理计算误差的功能,所以一条命令就解决问题了。这个功能强大的子程序名为eig(特征值英文是eigenvalue,特征向量英文是eigenvector),调用的形式是:p,lamda=eig(A)输出变元中的lamda是特征值,p是特征向量。把例6.4的系数矩阵A代入,即可得到:,6.3 相似矩阵与矩阵的对角化,定义6.4 设A和B是 阶方阵,若存在可逆矩阵P,使得,则称矩阵A与B相似,把A变成 的变换称为相似变换,可逆矩阵P被称为把A变成B的相似变换矩阵。相似矩阵具有以下性质。设矩阵A与B相似 1)2),3)A与B的迹相同 4)若A可逆,则B必可逆,且 也相似 定理6.2 设矩阵A与B相似,则它们的特征多项式相同,从而有相同的特征值.推论 若 阶方阵A与对角矩阵 相似,则 是矩阵A的全部特征值。此时,必存在可逆矩阵P,使得,称为把矩阵A对角化,也称矩阵A可对角化。,定理6.3 阶方阵A可对角化的充分必要条件A是有 个线性无关的特征向量。证明:必要性 设 阶方阵A可对角化,则存在可逆矩阵 使,从而 即 于是有,所以 是方阵A的特征值,是对应于特征值 的特征向量。由于矩阵P可逆,det(P)0,必线性无关。,充分性 设 是A的 个特征值,是与之对应的 个线性无关的特征向量,令,则有 即 所以方阵A可对角化。推论 若 阶方阵A的特征值互不相同,则方阵A一定可对角化。,例6.7 判断矩阵 能否对角化?解:由 得A的特 征值为 求得 对应的特征向量,再求 对应的特征向量。把 作行阶梯变换,得到 相当于方程组 它只有一个线性无 关的特征向量,即A总共只有两个线性无关的特征向量,所以A不能对角化。,用MATLAB解此题时,要检验特征向量组的秩,判断独立的特征向量数。故程序如下:A=-1,1,0;-4,3,0;1,0,2,p,lamda=eig(A),rp=rank(p)运行的结果是:由于特征向量组的秩为2,说明只有两个线性无关的特征向量,因此不能对角化。,6.4 实对称矩阵的对角化,定理6.4 实对称矩阵的特征值必为实数。定理6.5 实对称矩阵的不同特征值对应的 特征向量必正交。证明:设A为n阶实对称矩阵,是矩阵A的两个不同的特征值,是矩阵A对应的特征向量,即 因为 于是 由于,所以,即 正交。,定理6.6 设A为n阶对称矩阵,则存在正交矩阵P,使得 这里 是以A的n个特征值为对角元素的对角矩阵。推论1 设A为n阶实对称矩阵,是A的 重特征值,则A必有 个对应于特征值 的线性无关的特征向量.推论2 实对称矩阵一定可对角化.推论3 n阶实对称矩阵A,存在n个正交单位特征向量。,n阶实对称矩阵对角化的步骤 第一步:解特征方程,求出A的全部互不相等的特征值 它们的重数依次为 第二步:求出矩阵A的特征值 对应的特征向量,得到 个线性无关的特征向量;第三步:将每个特征值 对应的 个线性无关的特征向量正交化、单位化,这样得到n个两两正交的单位特征向量;第四步:令,P是正交矩阵,使得。必须注意:中对角元素的排列次序与P中列向量的排列次序要一致。,例6.10 设解:当 时,即 解得 单位特征向量可取为,解得 为任意常数。基础解系中的两个向量恰好正交,只需单位化,可得两个单位正交的特征向量,从而得到正交矩阵 有 本例用MATLAB解时的程序为:A=4,0,0;0,3,1;0,1,3;p,lamda=eig(A)程序运行的结果与笔算的相同,为:,6.5 二次型及其标准形,6.5.1 二次型的概念 定义6.5 含有n个变量 的二次齐次函数:(6-10)称为n元二次型,简称二次型。为实数时,称 为实二次型;为复数时,称 为复二次型。本章书仅讨论实二次型。,令,则二次型(6.10)可写成 用矩阵形式表示为(6-11)其中,例 6.13 写出下列二次型的矩阵 解:由已知的二次型系数,得矩阵元素为:故得的 矩阵为,6.5.2 二次型的标准形及惯性定理 定义6.6 若秩为r 的二次型 通过可逆线性变换x=Cy 可化为只含平方项的二次型,即(6-12)那么,此二次型称为 的标准形,标准形中所含平方项的个数等于二次型 的秩.例6.15 设二次型 分别作下列二个可逆线性变换,求新二次型.,1)=2)解:1)将线性关系直接代入并化简、整理,2)由于 因此,此例表明:二次型 的标准形不是唯一的。,*实二次型的规范形的定义:对秩为r的实系数二次型,设它通过可逆线性变换x=Cy化为下面的标准形:其中()0,若再作如下的可逆变换:则上面的标准形可进一步化为如下的形式:这个二次型称为实二次型的规范形,显然它是唯一的.,定理6.7(惯性定理)设秩为r的实二次型,通过可逆线性变换,可化为如下的标准形:其中 0(),则数p称为实二次型 的正惯性指数,q=r-p称为负惯性指数.惯性定理是指:实二次型的标准形中正系数的平方项的个数是唯一确定的,它等于正惯性指数,而系数为负的平方项的个数也是唯一确定的,它就等于负惯性指数。,6.5.3 化实二次型为标准形的方法 1)正交变换法 正交变换法的具体步骤与求特征值和特征向量相仿 第一步:写出二次型 的矩阵A,并由特征方程 求出全部互不相同特征值 第二步:求出A的对应于 的特征向量,即求齐次线性方程组 的基础解系。如果某些 是重根,则将其对应的特征向量正交化、单位化。这样便可得到n个两两正交的单位特征向量,第三步:令,则P是正交矩阵,二次型 通过正交变换x=Py化为标准形 上述步骤也可用eig函数来完成。其调用格式为:P,lamda=eig(A)P和lamda将分别给出特征向量组(即正交矩阵)和特征向量。此外MATLAB中还提供了一个用以计算正交变换矩阵的函数Rorth(A)。它的结果和eig函数算出的特征向量矩阵是一样的,只是排列的顺序不同.,2)配方法 如果二次型中含有变量 的平方项,则先把含有 的各项集中,按 配方,然后按此法对其它变量配方,直至都配成平方项.如果二次型中不含平方项,但某个 则先作一个可逆线性变换:使二次型 出现平方项,再按上面方法配方。,例6.16 设 令A的二次型 等于常数,这是一个椭圆的方程,其图形如图6.1(a)所示。现要求将它变为标准形并画出图形。,图6.1 两种二次型经坐标变换到主轴方向,(1)正交变换法 如果做一个基坐标的旋转变换,让坐标轴转过45度,这个椭圆的主轴就与新的坐标方向,相同,如图6.1(b)所示,其方程将变为标准形椭圆方程。从解析几何知此变换关系为:cos sin sin cos 写成矩阵形式yPx 其中,或取其逆变换,写成xRy 其中 用此变换式代入二次型的表达式,有 本题的数据是45度,得到,便有 及 所以从几何图形上寻找二次型主轴的问题,在线性代数中就等价于:使矩阵A经过正交变换R实现对角化。(2)用配方法,令 得到 它所对应的变换 图6.1中的(c)和(d)表示了对另一种双曲线二次型的坐标变换,它的方程为:,图6.2 两种对角化方法的不同变换:正交变换法,图形相似(左),配方法,图形崎变(右),6.5.4 二次型的正定和负定 图6.3 二次型曲面的几种类型,一般的,二元变量的二次圆锥曲线 在非退化(指它的二次项系数不全为零)情况下,它的类型决定于其二次项的对称矩阵A的特征值。具体如下:,定义6.8 若对任给定的 1)恒有,则称 为正定(负定)二次型,此时对称矩阵A称为正定(负定)矩阵;2)恒有,则称 为半正定(半负定)二次型,此时对称矩阵A称为半正定(半负定)矩阵。3)其它的二次型称为不定二次型。定理6.8 n元实二次型 正定的充要条件是它的标准形中的n个系数全为正,或 的正惯性指数为n。,证明:设 经过可逆线性变换化为标准形,充分性 若,对任意 有,所以 必要性 设 为正定二次型。假设有,取 时,从而,这与 是正定的相矛盾。所以 推论 实对称矩阵A正定的充分必要条件是A的特征值全大于零。,定义6.9 设 为n阶方阵,依次取A的前k行与前k列所构成的行列式 称为A的k阶顺序主子式。定理 6.9 设n元实二次型 为正定,则下列结论等价:1)对任意n维非零向量 2)的标准形中的n个系数全为正;3)实对称矩阵A的特征值全大于0;4)正惯性指数p=n;,5)实对称矩阵A的各阶顺序主子式全大于0,即 结论5)称为霍尔维茨定理。类似地,n元实二次型 为负定,则下列结论等价 1)的标准形中的n个系数全为负 2)实对称矩阵A的特征值全小于0 3)负惯性指数q=n 4)实对称矩阵A的各阶顺序主子式中,奇数阶的全小于0,偶数阶的全大于0,例6.19 判断二次型 的负定性.解:二次型 的矩阵为 由 可知 为负定二次型 注:本题也可通过判断-A为正定矩阵来解决,例6.20 求 的取值,使得二次型 为正定二次型.解:二次型 的矩阵为 由于 为正定二次型,故所有顺序主子式全大于零,即 解出,即为所求.,6.6 奇异值分解的简介,定义6.10 设矩阵,若存在非负实数 和n维非零向量 m维非零向量v使得(6-13)则称 为A的奇异值,u和v分别称为A对应于奇异值 的右奇异向量和左奇异向量。由式(6-13)可得(6-14)(6-15),定理6.10(矩阵的奇异值分解)设A是mn矩阵,设 是A的奇异值,则,其中U是m阶正交矩阵,V是n阶正交矩阵,而 此式也可以表示为:(6-16)其中,是矩阵U的第i列 是矩阵V的第j列.,MATLAB中设有奇异值分解函数,其调用格式为U,S,V=svd(A),其中U是mm归一化正交矩阵,S是mn对角矩阵,它的左上方是rr rmin(m,n)对角矩阵,其r个特征值已按递减规则,其余各块元素都是全零。排列的V是nn归一化正交矩阵。根据S中大于门限值的特征值数目,就可以求出矩阵的数字秩,rank(A)就是按这个思路编写的。在大于门限值的特征值中,最大和最小的两个元素之比,就是矩阵的条件数,可以调用r=cond(A)算出。,例6.21 设 求它的各奇异值,及条件数。解:这样阶次的问题,只能用计算机来解了。程序为 A=2,7,9,-5,4;-9,-9,5,3,-2;-2,5,-1,-3,5;-4,9,0,9,-4 U,S,V=svd(A),condA=S(1,1)/S(4,4)运行结果为:,不难验证:U,V都是规范正交矩阵,都有 A的四个奇异值为:16.5933 13.9809 11.2638 5.9432,A的条件数为:condA=16.5933/5.9432=2.7920,6.7 应用实例,6.7.1 人口迁徙模型 假设在一个大城市中的总人口是固定的,人口的分布则因居民在市区和郊区之间迁徙而变化。每年有6%的市区居民搬到郊区去住,而有2%的郊区居民搬到市区。假如开始时有30%的居民住在市区,70%的居民住在郊区,问十年后市区和郊区的居民人口比例是多少?30年、50年后又如何?,解:这个问题可以用矩阵乘法来描述。令人口变量 其中 为市区人口所占比例,为郊区人口所占比例,k表示年份的次序。在k0的初始状态为:一年以后,市区人口为 郊区人口 用矩阵乘法可写成:,从初始时间到k年,A不变,因此 用下列MATLAB程序ea661进行计算:A0.94,0.02;0.06,0.98 x00.3;0.7,x1A*x0,x10A10*x0,x30A30*x0,x50A50*x0 程序运行的结果为:,无限增加时间k,市区和郊区人口之比将趋向一组常数0.25/0.75。为了弄清为什么这个过程趋向于一个稳态值,可以改变一下坐标系统,在这个坐标系统中可以更清楚地看到矩阵乘幂的效果,为此将A对角化。令,其中为对角矩阵,则有 于是 对角矩阵的幂次可以化为元素的幂次 所以,它就很容易计算。键入p,lamda=eig(A),得到,令于是整理后得到,式中的第二项会随着k的增大趋向于零。如果只取小数点后两位,则只要k27,这第二项就可以忽略不计,从而得到 可见,适当选择基向量可以使矩阵乘法结果等价于一个简单的实数乘子,使得问题简单化。系统进入稳态的时间取决于特征值 而达到的稳态值取决于特征向量 这也是方阵求特征值的基本思想之一。,