跳转至

第一讲:方程组的几何解释

我们从求解线性方程组来开始这门课,从一个普通的例子讲起:方程组有\(2\)个未知数,一共有\(2\)个方程,分别来看方程组的“行图像”和“列图像”。

有方程组\(\begin{cases}2x&-y&=0\\-x&+2y&=3\end{cases}\),写作矩阵形式有\(\begin{bmatrix}2&-1\\-1&2\end{bmatrix}\begin{bmatrix}x\\y\end{bmatrix}=\begin{bmatrix}0\\3\end{bmatrix}\),通常我们把第一个矩阵称为系数矩阵\(A\),将第二个矩阵称为向量\(x\),将第三个矩阵称为向量\(b\),于是线性方程组可以表示为\(Ax=b\)

我们来看行图像,即直角坐标系中的图像:

%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns

x = [-2, 2, -2, 2]
y = [-4, 4, 0.5, 2.5]

fig = plt.figure()
plt.axhline(y=0, c='black')
plt.axvline(x=0, c='black')

plt.plot(x[:2], y[:2], x[2:], y[2:])

plt.draw()

png

plt.close(fig)

上图是我们都很熟悉的直角坐标系中两直线相交的情况,接下来我们按列观察方程组\(x\begin{bmatrix}2\\-1\end{bmatrix}+y\begin{bmatrix}-1\\2\end{bmatrix}=\begin{bmatrix}0\\3\end{bmatrix}\)(我们把第一个向量称作\(col_1\),第二个向量称作\(col_2\),以表示第一列向量和第二列向量),要使得式子成立,需要第一个向量加上两倍的第二个向量,即\(1\begin{bmatrix}2\\-1\end{bmatrix}+2\begin{bmatrix}-1\\2\end{bmatrix}=\begin{bmatrix}0\\3\end{bmatrix}\)

现在来看列图像,在二维平面上画出上面的列向量:

from functools import partial

fig = plt.figure()
plt.axhline(y=0, c='black')
plt.axvline(x=0, c='black')
ax = plt.gca()
ax.set_xlim(-2.5, 2.5)
ax.set_ylim(-3, 4)

arrow_vector = partial(plt.arrow, width=0.01, head_width=0.1, head_length=0.2, length_includes_head=True)

arrow_vector(0, 0, 2, -1, color='g')
arrow_vector(0, 0, -1, 2, color='c')
arrow_vector(2, -1, -2, 4, color='b')
arrow_vector(0, 0, 0, 3, width=0.05, color='r')

plt.draw()

png

plt.close(fig)

如图,绿向量\(col_1\)与蓝向量(两倍的蓝绿向量\(col_2\))合成红向量\(b\)

接着,我们继续观察\(x\begin{bmatrix}2\\-1\end{bmatrix}+y\begin{bmatrix}-1\\2\end{bmatrix}=\begin{bmatrix}0\\3\end{bmatrix}\)\(col_1,col_2\)的某种线性组合得到了向量\(b\),那么\(col_1,col_2\)的所有线性组合能够得到什么结果?它们将铺满整个平面。

下面进入三个未知数的方程组:\(\begin{cases}2x&-y&&=0\\-x&+2y&-z&=-1\\&-3y&+4z&=4\end{cases}\),写作矩阵形式\(A=\begin{bmatrix}2&-1&0\\-1&2&-1\\0&-3&4\end{bmatrix},\ b=\begin{bmatrix}0\\-1\\4\end{bmatrix}\)

在三维直角坐标系中,每一个方程将确定一个平面,而例子中的三个平面会相交于一点,这个点就是方程组的解。

同样的,将方程组写成列向量的线性组合,观察列图像:\(x\begin{bmatrix}2\\-1\\0\end{bmatrix}+y\begin{bmatrix}-1\\2\\-3\end{bmatrix}+z\begin{bmatrix}0\\-1\\4\end{bmatrix}=\begin{bmatrix}0\\-1\\4\end{bmatrix}\)。易知教授特意安排的例子中最后一个列向量恰巧等于等式右边的\(b\)向量,所以我们需要的线性组合为\(x=0,y=0,z=1\)。假设我们令\(b=\begin{bmatrix}1\\1\\-3\end{bmatrix}\),则需要的线性组合为\(x=1,y=1,z=0\)

我们并不能总是这么轻易的求出正确的线性组合,所以下一讲将介绍消元法——一种线性方程组的系统性解法。

现在,我们需要考虑,对于任意的\(b\),是否都能求解\(Ax=b\)?用列向量线性组合的观点阐述就是,列向量的线性组合能否覆盖整个三维向量空间?对上面这个例子,答案是肯定的,这个例子中的\(A\)是我们喜欢的矩阵类型,但是对另一些矩阵,答案是否定的。那么在什么情况下,三个向量的线性组合得不到\(b\)

——如果三个向量在同一个平面上,问题就出现了——那么他们的线性组合也一定都在这个平面上。举个例子,比如\(col_3=col_1+col_2\),那么不管怎么组合,这三个向量的结果都逃不出这个平面,因此当\(b\)在平面内,方程组有解,而当\(b\)不在平面内,这三个列向量就无法构造出\(b\)。在后面的课程中,我们会了解到这种情形称为奇异矩阵不可逆

下面我们推广到九维空间,每个方程有九个未知数,共九个方程,此时已经无法从坐标图像中描述问题了,但是我们依然可以从求九维列向量线性组合的角度解决问题,仍然是上面的问题,是否总能得到\(b\)?当然这仍取决于这九个向量,如果我们取一些并不相互独立的向量,则答案是否定的,比如取了九列但其实只相当于八列,有一列毫无贡献(这一列是前面列的某种线性组合),则会有一部分\(b\)无法求得。

接下来介绍方程的矩阵形式\(Ax=b\),这是一种乘法运算,举个例子,取\(A=\begin{bmatrix}2&5\\1&3\end{bmatrix},\ x=\begin{bmatrix}1\\2\end{bmatrix}\),来看如何计算矩阵乘以向量:

  • 我们依然使用列向量线性组合的方式,一次计算一列,\(\begin{bmatrix}2&5\\1&3\end{bmatrix}\begin{bmatrix}1\\2\end{bmatrix}=1\begin{bmatrix}2\\1\end{bmatrix}+2\begin{bmatrix}5\\3\end{bmatrix}=\begin{bmatrix}12\\7\end{bmatrix}\)
  • 另一种方法,使用向量内积,矩阵第一行向量点乘\(x\)向量\(\begin{bmatrix}2&5\end{bmatrix}\cdot\begin{bmatrix}1&2\end{bmatrix}^T=12,\ \begin{bmatrix}1&3\end{bmatrix}\cdot\begin{bmatrix}1&2\end{bmatrix}^T=7\)

教授建议使用第一种方法,将\(Ax\)看做\(A\)列向量的线性组合。


我们一直在努力

apachecn/AiLearning

【布客】中文翻译组