第二十二讲:对角化和的幂
对角化矩阵
上一讲我们提到关键方程,通过得到特征向量,再带回关键方程算出特征向量。
在得到特征值与特征向量后,该如何使用它们?我们可以利用特征向量来对角化给定矩阵。
有矩阵,它的特征向量为,使用特征向量作为列向量组成一个矩阵,即特征向量矩阵, 再使用公式\(\)将对角化。注意到公式中有,也就是说特征向量矩阵必须是可逆的,于是我们需要个线性无关的特征向量。
现在,假设有个线性无关的特征向量,将它们按列组成特征向量矩阵,则,当我们分开做矩阵与每一列相乘的运算时,易看出就是矩阵与自己的特征向量相乘,其结果应该等于。那么。可以进一步化简原式,使用右乘向量按列操作矩阵的方法,将特征值从矩阵中提出来,得到。
于是我们看到,从出发,得到了,特征向量矩阵又一次出现了,后面接着的是一个对角矩阵,即特征值矩阵。这样,再继续左乘就得到了公式。当然,所以运算的前提条件是特征向量矩阵可逆,即矩阵有个线性无关的特征向量。这个式子还要另一种写法,。
我们来看如何应用这个公式,比如说要计算。
- 先从开始,如果两边同乘以,有,于是得出结论,对于矩阵,其特征值也会取平方,而特征向量不变。
- 再从开始推导,则有。同样得到特征值取平方,特征向量不变。
两种方法描述的是同一个现象,即对于矩阵幂运算,其特征向量不变,而特征值做同样的幂运算。对角矩阵。
特征值和特征向量给我们了一个深入理解矩阵幂运算的方法,。
再来看一个矩阵幂运算的应用:如果,则(趋于稳定)的条件是什么?从易得,。再次强调,所有运算的前提是矩阵存在个线性无关的特征向量。如果没有个线性无关的特征向量,则矩阵就不能对角化。
关于矩阵可对角化的条件:
- 如果一个矩阵有个互不相同的特征值(即没有重复的特征值),则该矩阵具有个线性无关的特征向量,因此该矩阵可对角化。
-
如果一个矩阵的特征值存在重复值,则该矩阵可能具有个线性无关的特征向量。比如取阶单位矩阵,具有个相同的特征值,但是单位矩阵的特征向量并不短缺,每个向量都可以作为单位矩阵的特征向量,我们很容易得到个线性无关的特征向量。当然这里例子中的的本来就是对角矩阵,它的特征值直接写在矩阵中,即对角线元素。
同样的,如果是三角矩阵,特征值也写在对角线上,但是这种情况我们可能会遇到麻烦。矩阵,计算行列式值,所以特征值为,带回得到计算的零空间,我们发现,代数重度(algebraic multiplicity,计算特征值重复次数时,就用代数重度,就是它作为多项式根的次数,这里的多项式就是)为,这个矩阵无法对角化。这就是上一讲的退化矩阵。
我们不打算深入研究有重复特征值的情形。
求
从开始,,所有。下一讲涉及微分方程(differential equation),会有求导的内容,本讲先引入简单的差分方程(difference equation)。本例是一个一阶差分方程组(first order system)。
要解此方程,需要将展开为矩阵特征向量的线性组合,即。于是。继续化简原式,。用矩阵的方式同样可以得到该式:。
那么如果我们要求,则只需要将变为,而系数与特征向量均不变。
当我们真的要计算时,就可以使用。
接下来看一个斐波那契数列(Fibonacci sequence)的例子:
,我们要求第一百项的公式,并观察这个数列是如何增长的。可以想象这个数列并不是稳定数列,因此无论如何该矩阵的特征值并不都小于一,这样才能保持增长。而他的增长速度,则有特征值来决定。
已知,但这不是的形式,而且我们只要一个方程,而不是方程组,同时这是一个二阶差分方程(就像含有二阶导数的微分方程,希望能够化简为一阶倒数,也就是一阶差分)。
使用一个小技巧,令,再追加一个方程组成方程组:,再把方程组用矩阵表达得到,于是我们得到了。我们把二阶标量方程(second-order scalar problem)转化为一阶向量方程组(first-order system)。
我们的矩阵是一个对称矩阵,所以它的特征值将会是实数,且他的特征向量将会互相正交。因为是二阶,我们可以直接利用迹与行列式解方程组。在求解之前,我们先写出一般解法并观察,与前面斐波那契数列的递归式比较,我们发现这两个式子在项数与幂次上非常相近。
- 用求根公式解特征值得,得到两个不同的特征值,一定会有两个线性无关的特征向量,则该矩阵可以被对角化。
我们先来观察这个数列是如何增长的,数列增长由什么来控制?——特征值。哪一个特征值起决定性作用?——较大的一个。
,由于在幂增长中趋近于,所以近似的忽略该项,剩下较大的项,我们可以说数量增长的速度大约是。可以看出,这种问题与求解不同,这是一个动态的问题,的幂在不停的增长,而问题的关键就是这些特征值。
- 继续求解特征向量,,因为有根式且矩阵只有二阶,我们直接观察,由于,则其特征向量为,即。
最后,计算初始项,现在将初始项用特征向量表示出来,计算系数得。
来回顾整个问题,对于动态增长的一阶方程组,初始向量是,关键在于确定的特征值及特征向量。特征值将决定增长的趋势,发散至无穷还是收敛于某个值。接下来需要找到一个展开式,把展开成特征向量的线性组合。
下一讲将介绍求解微分方程。