跳转至

第十四讲:正交向量与子空间

在四个基本子空间中,提到对于秩为r的\(m \times n\)矩阵,其行空间(\(dim C(A^T)=r\))与零空间(\(dim N(A)=n-r\))同属于\(\mathbb{R}^n\)空间,其列空间(\(dim C(A)=r\))与左零空间(\(dim N(A^T)\)=m-r)同属于\(\mathbb{R}^m\)空间。

对于向量\(x, y\),当\(x^T \cdot y=0\)\(x_1y_1+x_2y_x+\cdots+x_ny_n=0\)时,有向量\(x, y\)正交(vector orthogonal)。

毕达哥拉斯定理(Pythagorean theorem)中提到,直角三角形的三条边满足:

\[ \begin{aligned} \left\|\overrightarrow{x}\right\|^2+\left\|\overrightarrow{y}\right\|^2 &= \left\|\overrightarrow{x+y}\right\|^2 \\ x^Tx+y^Ty &= (x+y)^T(x+y) \\ x^Tx+y^Ty &= x^Tx+y^Ty+x^Ty+y^Tx \\ 0 &= x^Ty+y^Tx \qquad 对于向量点乘,x^Ty=y^Tx \\ 0 &= 2x^Ty \\ x^Ty &=0 \end{aligned} \]

由此得出,两正交向量的点积为\(0\)。另外,\(x, y\)可以为\(0\)向量,由于\(0\)向量与任意向量的点积均为零,所以\(0\)向量与任意向量正交。

举个例子: \(x=\begin{bmatrix}1\\2\\3\end{bmatrix}, y=\begin{bmatrix}2\\-1\\0\end{bmatrix}, x+y=\begin{bmatrix}3\\1\\3\end{bmatrix}\),有\(\left\| \overrightarrow{x} \right\|^2=14, \left\| \overrightarrow{y} \right\|^2=5, \left\| \overrightarrow{x+y} \right\|^2=19\),而\(x^Ty=1\times2+2\times (-1)+3\times0=0\)

向量\(S\)与向量\(T\)正交,则意味着\(S\)中的每一个向量都与\(T\)中的每一个向量正交。若两个子空间正交,则它们一定不会相交于某个非零向量。

现在观察行空间与零空间,零空间是\(Ax=0\)的解,即\(x\)若在零空间,则\(Ax\)为零向量;

而对于行空间,有 $ \begin{bmatrix}row_1\row_2\ \vdots \row_m\end{bmatrix} \Bigg[x\Bigg]= \begin{bmatrix}0\0\ \vdots\ 0\end{bmatrix} $,可以看出: $$ \begin{bmatrix}row_1\end{bmatrix}\Bigg[x\Bigg]=0 \ \begin{bmatrix}row_2\end{bmatrix}\Bigg[x\Bigg]=0 \ \vdots \ \begin{bmatrix}row_m\end{bmatrix}\Bigg[x\Bigg]=0 \ $$

所以这个等式告诉我们,\(x\)\(A\)中的所有行正交;

接下来还验证\(x\)是否与\(A\)中各行的线性组合正交, $ \begin{cases} c_1(row_1)^Tx=0 \ c_2(row_2)^Tx=0 \ \vdots \ c_n(row_m)^Tx=0 \ \end{cases} \(,各式相加得\)(c_1row_1+c_2row_2+\cdots+c_nrow_m)^Tx=0$,得证。

我们可以说,行空间与零空间将\(\mathbb{R}^n\)分割为两个正交的子空间,同样的,列空间与左零空间将\(\mathbb{R}^m\)分割为两个正交的子空间。

举例,\(A=\begin{bmatrix}1&2&5\\2&4&10\end{bmatrix}\),则可知\(m=2, n=3, rank(A)=1, dim N(A)=2\)

\(Ax=\begin{bmatrix}1&2&5\\2&4&10\end{bmatrix}\begin{bmatrix}x_1\\x_2\\x_3\end{bmatrix}=\begin{bmatrix}0\\0\end{bmatrix}\),解得零空间的一组基\(x_1=\begin{bmatrix}-2\\1\\0\end{bmatrix}\quad x_2=\begin{bmatrix}-5\\0\\1\end{bmatrix}\)

而行空间的一组基为\(r=\begin{bmatrix}1\\2\\5\end{bmatrix}\),零空间与行空间正交,在本例中行空间也是零空间的法向量。

补充一点,我们把行空间与零空间称为\(n\)维空间里的正交补(orthogonal complement),即零空间包含了所有与行空间正交的向量;同理列空间与左零空间为\(m\)维空间里的正交补,即左零空间包含了所有与零空间正交的向量。

接下来看长方矩阵,\(m>n\)。对于这种矩阵,\(Ax=b\)中经常混入一些包含“坏数据”的方程,虽然可以通过筛选的方法去掉一些我们不希望看到的方程,但是这并不是一个稳妥的方法。

于是,我们引入一个重要的矩阵:\(A^TA\)。这是一个\(n \times m\)矩阵点乘\(m \times n\)矩阵,其结果是一个\(n \times n\)矩阵,应该注意的是,这也是一个对称矩阵,证明如下:

\[ (A^TA)^T=A^T(A^T)^T=A^TA \]

这一章节的核心就是\(A^TAx=A^Tb\),这个变换可以将“坏方程组”变为“好方程组”。

举例,有\(\begin{bmatrix}1&1\\1&2\\1&5\end{bmatrix}\begin{bmatrix}x_1\\x_2\end{bmatrix}=\begin{bmatrix}b_1\\b_2\\b_3\end{bmatrix}\),只有当\(\begin{bmatrix}b_1\\b_2\\b_3\end{bmatrix}\)在矩阵的列空间时,方程才有解。

现在来看\(\begin{bmatrix}1&1&1\\1&2&5\end{bmatrix}\begin{bmatrix}1&1\\1&2\\1&5\end{bmatrix}=\begin{bmatrix}3&8\\8&30\end{bmatrix}\),可以看出此例中\(A^TA\)是可逆的。然而并非所有\(A^TA\)都是可逆的,如\(\begin{bmatrix}1&1&1\\3&3&3\end{bmatrix}\begin{bmatrix}1&3\\1&3\\1&3\end{bmatrix}=\begin{bmatrix}3&9\\9&27\end{bmatrix}\)(注意到这是两个秩一矩阵相乘,其结果秩不会大于一)

先给出结论:

\[ N(A^TA)=N(A)\\ rank(A^TA)=rank(A)\\ A^TA可逆当且仅当N(A)为零向量,即A的列线性无关\\ \]

下一讲涉及投影,很重要。


我们一直在努力

apachecn/AiLearning

【布客】中文翻译组