Chapter 1.

线性方程组 Linear System

  • 相容(Consistent):线性方程组有至少一组解。

    行观点 Row Picture:方程组相容,则直线 / 平面相交。

    列观点 Column Picture:列向量的和(线性组合):uα+vβ+wγ=bu \vec\alpha + v \vec\beta + w \vec\gamma = \vec b

  • 非奇异(Nonsingular):线性方程组恰有一组解。

  • 等价线性方程组(Equivalent Systems):有相同解集的线性方程组。

高斯消元法

基本操作:

  1. 任意改变两行顺序。

  2. 同行乘以非零数。

  3. 某一行乘上一个非零数后加到另一行上。

不断进行操作 1、3,直到消为上三角矩阵,代入。

矩阵 Matrix

A=[a11a12a1na21a22a2nam1am2amn]=(aij)m×nA = \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \\ \end{bmatrix} = (a_{ij})_{m \times n}

增广矩阵 Augmented Matrix

[Ab]=[a11a12a1nb1a21a22a2nb2an1an2annbn][A \mid b] = \left[\begin{array}{cccc|c} a_{11} & a_{12} & \cdots & a_{1n} & b_1 \\ a_{21} & a_{22} & \cdots & a_{2n} & b_2 \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} & b_n \end{array}\right]

上三角矩阵 (Upper-)Triangle System UU

下三角矩阵 Lower-Triangle System LL

主元 Pivot:非零行的第一个非零元素。

行阶梯型 Row Echelon Form:形如 [111001000]\begin{bmatrix}1 & 1 & 1 \\ 0 & 0 & 1 \\ 0 & 0 & 0\end{bmatrix}

基本运算

矩阵加法(aij)m×n±(bij)m×n=(aij±bij)m×n(a_{ij})_{m \times n} \pm (b_{ij})_{m \times n} = (a_{ij} \pm b_{ij})_{m \times n}。要求两个矩阵大小一致。

矩阵数乘cA=(cai,j)m×ncA = (c a_{i, j})_{m \times n}

矩阵乘法:若 A=(aij)m×nA = (a_{ij})_{m \times n}B=(bij)n×lB = (b_{ij})_{n \times l},则 AB=A(b1,b2,,bl)=(Ab1,Ab2,,Abl)AB = A(b_1, b_2, \cdots, b_l) = (Ab_1, Ab_2, \cdots, Ab_l)。要求 AA 的列数等于 BB 的行数。

解线性方程组即求 Ax=bA x = b 中的 xxxxbb 均为列向量)。

  • 恒等矩阵 / 单位矩阵 II:形如 [111]\begin{bmatrix}1 & & \\ & 1 & \\ & & 1\end{bmatrix}

  • 方阵 Square:行列数相等。

  • 定义 Eij(l)E_{ij}(l) 为恒等矩阵的基础上,第 ii 行第 jj 列为 ll 的矩阵。

    左乘 Eij(l)E_{ij}(l),相当于把第 jj 行乘 ll 加到第 ii 行上。

    右乘 Eij(l)E_{ij}(l),相当于把第 ii 列乘 ll 加到第 jj 列上。

  • 两个下三角矩阵(默认为方阵)的乘积仍为下三角矩阵。

初等行变换

  • 任意改变两行顺序:左乘交换了两行的恒等矩阵。

  • 同行乘以非零数:左乘某个 1c1 \to c 的恒等矩阵。

  • 某一行乘上一个非零数后加到另一行上。

矩阵的次方

要求 AA 是方阵。设 A=(aij)n×nA = (a_{ij})_{n \times n}

  • A0=InA^0 = I_{n}

  • A=[1212]=[11][12]=abA = \begin{bmatrix} 1 & 2 \\ 1 & 2 \end{bmatrix} = \begin{bmatrix} 1 \\ 1 \end{bmatrix} \begin{bmatrix} 1 & 2 \end{bmatrix} = ab,则 An=a(ba)(ba)b=a3n1b=3n1AA^n = a(ba)(ba) \cdots b = a \cdot 3^{n - 1} \cdot b = 3^{n - 1} A

运算律

加法结合律:满足。

加法交换律:满足。

乘法结合律(AB)C=A(BC)(AB)C = A(BC)

证明:设 A=(aij)m×nA = (a_{ij})_{m \times n}B=(bjk)n×sB = (b_{jk})_{n \times s}C=(ckl)s×rC = (c_{kl})_{s \times r}V=AB=(vik)m×sV = AB = (v_{ik})_{m \times s}W=BC=(wjl)n×rW = BC = (w_{jl})_{n \times r},有 vik=j=1naijbjkv_{ik} = \sum_{j = 1}^{n} a_{ij} b_{jk}wjl=k=1sbjkcklw_{jl} = \sum_{k = 1}^{s}b_{jk} c_{kl}

计算 ((AB)C)il=(VC)il=k=1svikckl=k=1sj=1naijbjkckl((AB)C)_{il} = (VC)_{il} = \sum_{k = 1}^{s} v_{ik} c_{kl} = \sum_{k = 1}^{s} \sum_{j = 1}^{n} a_{ij} b_{jk} c_{kl}

计算 (A(BC))il=(AW)il=j=1naijwjl=j=1naijk=1sbjkckl(A(BC))_{il} = (AW)_{il} = \sum_{j = 1}^{n} a_{ij} w_{jl} = \sum_{j = 1}^{n} a_{ij} \sum_{k = 1}^{s}b_{jk} c_{kl}

二者一致。得证。

乘法交换律:不满足。

(αβ)A=α(βA)(\alpha \beta) A = \alpha (\beta A)

α(AB)=A(αB)\alpha (AB) = A (\alpha B)

数乘对数加的分配律(α+β)A=αA+βA(\alpha + \beta) A = \alpha A + \beta A

数乘对矩阵加法的分配律α(A+B)=αA+αB\alpha (A + B) = \alpha A + \alpha B

矩阵乘法对矩阵加法的分配律A(B+C)=AB+ACA (B + C) = AB + AC

初等矩阵 Elementry Matrix

Type I:左乘交换两行,右乘交换两列:(左行右列)

[111]\begin{bmatrix} & 1 & \\ 1 & & \\ & & 1 \end{bmatrix}

Type II:左乘改变第 ii 行,右乘改变第 ii 列:

[211]\begin{bmatrix} 2 & & \\ & 1 & \\ & & 1 \end{bmatrix}

Type IIIEij(l)E_{ij}(l)

[1211]\begin{bmatrix} 1 & & \\ 2 & 1 & \\ & & 1 \end{bmatrix}

LU 分解

UU 就是高斯消元得到的上三角矩阵。

如果一个矩阵能仅通过第三种初等行变换就得到一个上三角矩阵,那么这个矩阵就有一个 LULU 分解。下三角矩阵 LL 中记录了消元过程中的乘子(的相反数)。

LU 分解不具有唯一性。

Ax=b{Lc=bUx=cAx = b \Rightarrow \begin{cases} Lc = b \\ Ux = c \end{cases}

LDU 分解

DD 是对角矩阵,用以将 UU 的对角线全部变成 11

[266361]=[231][133121]\begin{bmatrix} 2 & 6 & 6 \\ & -3 & -6 \\ & & 1 \end{bmatrix} = \begin{bmatrix} 2 & & \\ & -3 & \\ & & 1 \end{bmatrix} \begin{bmatrix} 1 & 3 & 3 \\ & 1 & 2 \\ & & 1 \end{bmatrix}

LDULDU 分解具有唯一性。

分块矩阵 Partitioned Matrix

  • AB=A[b1b2bl]=[Ab1Ab2Abl]=[a1a2an]B=[a1Ba2BanB]\begin{aligned} AB &= A \begin{bmatrix} b_1 & b_2 & \cdots & b_l \end{bmatrix} = \begin{bmatrix} A b_1 & A b_2 & \cdots & A b_l \end{bmatrix} \\ &= \begin{bmatrix} a_1 \\ a_2 \\ \vdots \\ a_n \end{bmatrix} B = \begin{bmatrix} a_1 B \\ a_2 B \\ \vdots \\ a_n B \end{bmatrix} \end{aligned}

    bkb_k 可以是某几列一起,aia_i 也可以是某几行一起。

  • AB=[A11A12A21A22][B11B12B21B22]=[A11B11+A12B21A11B12+A12B22A21B11+A22B21A21B12+A22B22]AB = \begin{bmatrix} A_{11} & A_{12} \\ A_{21} & A_{22} \end{bmatrix} \begin{bmatrix} B_{11} & B_{12} \\ B_{21} & B_{22} \end{bmatrix} = \begin{bmatrix} A_{11}B_{11} + A_{12}B_{21} & A_{11}B_{12} + A_{12}B_{22} \\ A_{21}B_{11} + A_{22}B_{21} & A_{21}B_{12} + A_{22}B_{22} \end{bmatrix}

  • ABAB 的每一列都是 AA 的列向量的线性组合,每一行都是 BB 的行向量的线性组合。

置换矩阵 Permutation Matrix

nn 阶置换矩阵有 n!n! 个。

借助置换矩阵,我们可以使任意矩阵可以被 LU 分解,即:PA=LUPA = LU

逆矩阵 Inverse Matrix

对于 nn 阶方阵 AA,其逆矩阵 A1A^{-1} 满足 AA1=A1A=InA A^{-1} = A^{-1} A = I_n。有 (A1)1=A\left(A^{-1}\right)^{-1} = A

  • 22 阶方阵 [abcd]\begin{bmatrix} a & b \\ c & d \end{bmatrix} 的逆存在,当且仅当 adbc0ad - bc \neq 0。其逆为 1adbc[dbca]\frac{1}{ad - bc}\begin{bmatrix} d & -b \\ -c & a \end{bmatrix}

  • 对角矩阵 [d1dn]\begin{bmatrix} d_1 & & \\ & \ddots & \\ & & d_n \end{bmatrix}di0\forall d_i \neq 0)的逆为 [d11dn1]\begin{bmatrix} d_1^{-1} & & \\ & \ddots & \\ & & d_n^{-1} \end{bmatrix}

注意 (AB)1=B1A1(AB)^{-1} = B^{-1} A^{-1}。【交换顺序】

逆矩阵具有唯一性。

证明:若 B,CB, C 都是 AA 的逆,那么 (BA)C=C=B(AC)=B(BA)C = C = B(AC) = B,即 B=CB = C

Ax=0Ax = 0 有非零解,那么 AA 不可逆。

证明:假设 AA 可逆,那么 A1(Ax)=A10A^{-1} (Ax) = A^{-1} 0,则 x=0x = 0,矛盾。

求逆方法:

  • A1A^{-1}InI_n 分成 nn 列,即求 nn 个方程 Axi=eiAx_i = e_i 的解。

  • 可使用高斯约旦法消元 [AIn][A \mid I_n] 得到

nn 阶方阵 AA 可逆的充要条件:

  • 主元有 nn 个,即高斯约旦法有解。

  • b\forall bAx=bAx = b 非奇异。

    证明:

    • 充分性:

      A1(Ax)=A1bA^{-1}(Ax) = A^{-1} b,得 x=A1bx = A^{-1} b

      A(A1b)=bA (A^{-1} b) = b,得 AA 是非奇异的。

    • 必要性:

      Ax=bAx = b 奇异,则 Ax=0Ax = 0 有非零解,故 AA 不可逆。

可逆 = 非奇异 = nn pivots

上(下)三角矩阵的逆仍是上(下)三角矩阵。

高斯约旦法 Gauss-Jordan

[AIn]=[a11a12a131a21a22a231a31a32a331][A \mid I_n] = \left[\begin{array}{ccc|ccc} a_{11} & a_{12} & a_{13} & 1 & & \\ a_{21} & a_{22} & a_{23} & & 1 & \\ a_{31} & a_{32} & a_{33} & & & 1 \end{array}\right]

先进行高斯消元,使其变为上三角矩阵:

[a11a12a13?a22a23??a33???]\left[\begin{array}{ccc|ccc} a_{11}' & a_{12}' & a_{13}' & ? & & \\ & a_{22}' & a_{23}' & ? & ? & \\ & & a_{33}' & ? & ? & ? \end{array}\right]

再从最后一行开始向上消元,使其变为对角矩阵:

[a11???a22???a33???]\left[\begin{array}{ccc|ccc} a_{11}'' & & & ? & ? & ? \\ & a_{22}'' & & ? & ? & ? \\ & & a_{33}'' & ? & ? & ? \end{array}\right]

最后每一行乘上 1aii\frac{1}{a_{ii}''},变为:

[1???1???1???]\left[\begin{array}{ccc|ccc} 1 & & & ? & ? & ? \\ & 1 & & ? & ? & ? \\ & & 1 & ? & ? & ? \end{array}\right]

此时竖线右边是 A1A^{-1}

转置矩阵 Transpose Matrix

性质:

  • (AT)T=A\left(A^{T}\right)^{T} = A

  • (αA)T=αAT(\alpha A)^T = \alpha A^T

  • (A+B)T=AT+BT(A + B)^T = A^T + B^T

  • (AB)T=BTAT(AB)^T = B^T A^T。【交换顺序】

  • (A1)T=(AT)1\left(A^{-1}\right)^T = \left(A^T\right)^{-1}

对称矩阵 Symetric Matrix

满足 A=ATA = A^Tnn 阶方阵 AA

性质:

  • 对称矩阵的逆也是对称矩阵。

  • 对于任意 m×nm \times n 的矩阵 RRRRTR R^TRTRR^T R 都是对称矩阵。

  • 对称矩阵 A=LDUA = LDU,那么 LT=UL^T = U

矩阵与幂级数

定义 N=[010010]N = \begin{bmatrix}0 & 1 & 0 \\ & 0 & 1 \\ & & 0 \end{bmatrix},则 N2=[001000]N^2 = \begin{bmatrix}0 & 0 & 1 \\ & 0 & 0 \\ & & 0 \end{bmatrix}N3=0N^3 = 0

那么 n=0(aN)n=1+aN+aN2=(1aN)1\sum_{n = 0}^{\infty}(aN)^n = 1 + aN + aN^2 = (1 - aN)^{-1}。(I=1I = 1

更高维度时相同。


Chapter 2.

向量空间 Vector Space

公理:

  • x+y=y+xx + y = y + x

  • (x+y)+z=x+(y+z)(x + y) + z = x + (y + z)

  • 存在唯一的零向量 0\vec 0,使得 x+0=0+x=xx + \vec 0 = \vec 0 + x = x

  • x\forall x,存在唯一的 x-x,使得 x+(x)=0x + (-x) = \vec 0

  • 1x=x1 \cdot x = x

  • (c1c2)x=c1(c2x)(c_1 c_2) x = c_1 (c_2 x)

  • c(x+y)=cx+cyc (x + y) = cx + cy

  • (c1+c2)x=c1x+c2x(c_1 + c_2) x = c_1 x + c_2 x

实向量空间 Real Vector Space:是一个满足加法和数乘的“向量”集合,也即满足上述 8 条公理。它是抽象的。

性质(x,y,zVx, y, z \in V):

  • 0x=00 \cdot x = \vec 0

    证明:0x+x=0x+1x=(0+1)x=x0 \cdot x + x = 0 \cdot x + 1 \cdot x = (0 + 1) \cdot x = x,同理 x+0x=xx + 0 \cdot x = x,所以 0x=00 \cdot x = \vec 0

  • (1)x=x(-1) \cdot x = -x

  • x+y=x+zx + y = x + z,则 x=zx = z

  • β0=0\beta \cdot \vec 0 = \vec 0

  • αx=0\alpha x = \vec 0,则 α=0\alpha = 0x=0x = \vec 0

子空间 SubspaceWWVV 的非空子集,满足:

  • x,yW\forall x, y \in Wx+yWx + y \in W

  • xW,cR\forall x \in W, c \in \RcxWcx \in W

    (任意线性组合也在 WW 中)

    推出:0W\vec 0 \in W

零空间 Zero Space:W={0}W = \left\{\vec 0\right\}

列空间 Column Space

一个 m×nm \times n 的矩阵 AA 的列空间是它所有列的线性组合,记为 C(A)C(A)。显然 C(A)RmC(A) \subseteq \R^m

应用

  • 方程 Ax=bAx = b 有解(相容)等价于 bC(A)b \in C(A)

核空间 Nullspace / 零空间

一个 m×nm \times n 的矩阵 AA 的核空间是所有满足 Ax=0Ax = 0nn 维向量 xx 的集合,记为 N(A)={xRnAx=0}N(A) = \{x \in \R^n \mid Ax = 0\}。显然 N(A)RnN(A) \subseteq \R^n

求核空间

  • 定义行最简型(Reduced Row Echelon Form)矩阵为消元后满足如下条件的矩阵:

    • 非零行都在全零行的上方,且主元列号递增。

    • 主元全为 11

    • 主元所在列其它元素都为 00

  • 定义自由变量为没有主元的列的元素。当未知元的个数(列数 nn)大于主元个数(行数 mm)时,就会出现自由变量;此时 Ax=0Ax = 0 就有非零解。

  • 定义矩阵的(Rank)为化为行最简型后主元的个数,记为 r(A)r(A)rank(A)\text{rank}(A)

求解步骤:

  • 高斯消元,得到行最简型矩阵,例如:

    [13111]\begin{bmatrix} 1 & 3 & & -1 \\ & & 1 & 1 \\ & & & \end{bmatrix}

  • 将每个非零行,把主元写在左边,自由变量写在右边,得到一个方程组,例如:

    {x1=3x2+x4x3=x4\begin{cases} x_1 = -3x_2 + x_4 \\ x_3 = -x_4 \end{cases}

  • 为自由变量设未知数,例如 x2=ax_2 = ax4=bx_4 = b,得到核空间为:

    N(A)={[3a+babb]R4a,bR}N(A) = \left\{\begin{bmatrix} -3a + b \\ a \\ -b \\ b\end{bmatrix} \in \R^4 \mid a, b \in \R\right\}

  • 我们也可以通过设某自由变量为 11,其它自由变量为 00,得到特解:

    x=a[3100]+b[1011]C([31100101])x = a \begin{bmatrix} -3 \\ 1 \\ 0 \\ 0 \end{bmatrix} + b \begin{bmatrix} 1 \\ 0 \\ -1 \\ 1 \end{bmatrix} \Rightarrow C \left(\begin{bmatrix} -3 & 1 \\ 1 & 0 \\ 0 & -1 \\ 0 & 1 \end{bmatrix}\right)

应用

  • 如果找到 Ax=bAx = b 的特解,那么该特解加上核空间内向量可以得到所有解。

    直接求 Ax=bAx = b 的解集

    在求行最简型矩阵过程中,右边增广一列:

    b=[b1b2bn]b = \begin{bmatrix} b_1 \\ b_2 \\ \vdots \\ b_n \end{bmatrix}

    消元得到行最简型时,有解等价于全零行右边全为零。

    由非零行,可以得到如下方程:

    {x1=23x2+x4x3=1x4\begin{cases} x_1 = -2 - 3x_2 + x_4 \\ x_3 = 1 - x_4 \end{cases}

    把所有自由变量设为 00,可以得到一组 Ax=bAx = b 的特解:

    xp=[2010]x_p = \begin{bmatrix} -2 \\ 0 \\ 1 \\ 0 \end{bmatrix}

    那么加上 N(A)N(A) 即可得到解集。

线性无关 Linear Independent

定义:若向量 v1,v2,,vnv_1, v_2, \cdots, v_n 满足方程 c1v1+c2v2++cnvn=0c_1 v_1 + c_2 v_2 + \cdots + c_n v_n = 0 只在 c1=c2==cn=0c_1 = c_2 = \cdots = c_n = 0 时成立,那么这 nn 个向量线性无关。

据此,重新定义 AA 的秩 r(A)r(A) 为最多的线性无关的行的数量。

AA 所有行线性无关,等价于 Ax=0Ax = 0 只有全零解(没有非零解),等价于 N(A)={0}N(A) = \{0\}

判断 nn 个列向量 viRmv_i \in \R^m 是否线性无关nmn \le m):

  • A=[v1v2vn]A = \begin{bmatrix} v_1 & v_2 & \cdots & v_n \end{bmatrix},解 Ax=0Ax = 0

  • N(A)={0}N(A) = \{0\},则线性无关。

判断 nn 个行向量 viRmv_i \in \R^m 是否线性无关nmn \le m):

  • A=[v1v2vn]A = \begin{bmatrix} v_1 \\ v_2 \\ \vdots \\ v_n \end{bmatrix},解 ATx=0A^T x = 0

  • N(AT)={0}N(A^T) = \{0\},则线性无关。

基 Basis

向量空间 VV 由一组向量(Span)出,即 VV 是这组向量的线性组合,记为 V=span{v1,v2,,vn}V = \text{span}\{v_1, v_2, \cdots, v_n\}。等价于,vV\forall v \in V!c1,c2,,cnR\exists! c_1, c_2, \cdots, c_n \in \R,使得 v=c1v1+c2v2++cnvnv = c_1 v_1 + c_2 v_2 + \cdots + c_n v_n。(!\exists! 表示“存在唯一”)

若这组向量线性无关,则我们称这组向量是 VV 的基。

标准基 Standerd Basise1,e2,,ene_1, e_2, \cdots, e_nRn\R^n 的标准基。其中 eie_i 是仅第 ii 个元素为 11、其余元素为 00 的列向量。

定理VV 的所有基的向量个数相等。据此定义向量空间的维数(Dimension)为它的基的向量个数。

证明:假设两个基 V=span(v1,v2,,vm)=span(w1,w2,,wn)V = \text{span}(v_1, v_2, \cdots, v_m) = \text{span}(w_1, w_2, \cdots, w_n),且 m<nm < n

i\forall iwi=a1iv1+a2iv2+amivmw_i = a_{1i} v_1 + a_{2i} v_2 + \cdots a_{mi} v_m,即:

[w1wn]=[v1vm][a11a12a1nam1am2amn]\begin{bmatrix} w_1 & \cdots & w_n \end{bmatrix} = \begin{bmatrix} v_1 & \cdots & v_m \end{bmatrix} \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{bmatrix}

因为 m<nm < n,所以 Ax=0Ax = 0 有无穷多个解。设一个非零解 x=[c1cn]x = \begin{bmatrix} c_1 \\ \vdots \\ c_n \end{bmatrix},那么有:

[w1wn][c1cn]=[v1vm][a11a12a1nam1am2amn][c1cn]=0\begin{bmatrix} w_1 & \cdots & w_n \end{bmatrix} \begin{bmatrix} c_1 \\ \vdots \\ c_n \end{bmatrix} = \begin{bmatrix} v_1 & \cdots & v_m \end{bmatrix} \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{m1} & a_{m2} & \cdots & a_{mn} \end{bmatrix} \begin{bmatrix} c_1 \\ \vdots \\ c_n \end{bmatrix} = 0

c1w1+c2w2+cnwn=0c_1 w_1 + c_2 w_2 + \cdots c_n w_n = 0。故 w1,w2,,wnw_1, w_2, \cdots, w_n 线性相关,不是 VV 的基。矛盾。

判断 v1,v2,,vnRnv_1, v_2, \cdots, v_n \in \R^n 是否是 Rn\R^n 的基

A=[v1v2vn]A = \begin{bmatrix} v_1 & v_2 & \cdots & v_n \end{bmatrix}。由定义,需要满足以下两个条件:

  • span{v1,v2,,vn}=Rn\text{span}\{v_1, v_2, \cdots, v_n\} = \R^n。等价于 b\forall bAx=bAx = b 相容。

  • v1,v2,,vnv_1, v_2, \cdots, v_n 线性无关。等价于 Ax=0Ax = 0 非奇异(没有非零解),即 N(A)={0}N(A) = \{0\}

由上可知,b\forall bAx=bAx = b 非奇异。等价于矩阵 AA 可逆。

四个基本子空间

AAm×nm \times n 的矩阵。

  • C(A)C(A)N(AT)N\left(A^T\right)Rm\R^m 中正交补。

  • C(AT)C\left(A^T\right)N(A)N(A)Rn\R^n 中正交补。

求列空间 C(A)C(A) 的基

  • 主元所在的(AA 中的)列构成 C(A)C(A) 的一组基。

    因此,dimC(A)\dim C(A)列秩)等于 rank(A)\text{rank}(A)

求行空间 C(AT)C\left(A^T\right) 的基

  • 初等行变换不会改变行空间。我们将 AA 消为行阶梯型 UU 后,UU 的每一个非零行都线性无关,这些行构成 C(AT)C\left(A^T\right) 的一组基。

    因此,dimC(AT)\dim C\left(A^T\right)行秩)等于 rank(A)\text{rank}(A)。(行秩等于列秩等于秩,rank(A)=rank(AT)\text{rank}(A) = \text{rank}\left(A^T\right)

求零空间 N(A)N(A) 的基

  • Ax=0Ax = 0 的一组特解构成 N(A)N(A) 的一组基。

    因此,dimN(A)\dim N(A)零化度 Nullity)等于 nrank(A)n - \text{rank}(A)

  • 秩-零化度定理

    dimC(A)+dimN(A)=r+nr=n\dim C(A) + \dim N(A) = r + n - r = n

求左零空间 N(AT)N\left(A^T\right) 的基

  • 即求 ATy=(ATy)T=yTA=0A^T y = \left(A^T y\right)^T = y^T A = 0。根据秩-零化度定理,dimC(AT)+dimN(AT)=m\dim C\left(A^T\right) + \dim N\left(A^T\right) = m,故 dimN(AT)=mrank(A)\dim N\left(A^T\right) = m - \text{rank}(A)

  • 利用 A=LUA = LU,得到:

    L1A=[y1Ty2TymT]A=UL^{-1} A = \begin{bmatrix} y_1^T \\ y_2^T \\ \vdots \\ y_m^T \end{bmatrix} A = U

    其中,yiTy_i^TL1L^{-1} 的每一行。最后 mrm - r 行构成 N(AT)N\left(A^T\right) 的一组基。

    可以直接对 [AIm][A \mid I_m] 消元,左边全零行对应的右边构成基。

总结

  • AA 可逆,等价于:

    • rank(A)=n\text{rank}(A) = n

    • C(A)=C(AT)=RnC(A) = C\left(A^T\right) = \R^n

    • N(A)=N(AT)={0}N(A) = N(A^T) = \{0\}

秩不等式 Rank Inequality

rank(AB)min{rank(A),rank(B)}\text{rank}(AB) \le \min\{\text{rank}(A), \text{rank}(B)\}

  • 推论:任意矩阵 AA 乘上(左乘或右乘)可逆矩阵 PP 秩不变。

    证明:只需证 rank(PA)rank(A)\text{rank}(PA) \ge \text{rank}(A)

    注意到 A=P1PAA = P^{-1} P A,再用一次秩不等式即可。

右逆和左逆 Right-Inverse & Left-Inverse

定义:m×nm \times n 的矩阵 AAn×mn \times m 的矩阵 BB 若满足 AB=InAB = I_n,那么 AABB 的右逆,BBAA 的左逆。

存在性

  • AA 存在右逆的充要条件是 rank(A)=m\text{rank}(A) = m行满秩)。

    AA 存在左逆的充要条件是 rank(A)=n\text{rank}(A) = n列满秩)。

    可以通过例子 A=[10]A = \begin{bmatrix} 1 & 0\end{bmatrix}B=[10]B = \begin{bmatrix} 1 \\ 0 \end{bmatrix}AB=[1]AB = \begin{bmatrix} 1 \end{bmatrix} 来记忆。

  • 推论:AA 既有右逆右有左逆,当且仅当 rank(A)=m=n\text{rank}(A) = m = n

最好的右 / 左逆

  • 若存在右 / 左逆,那就有无穷多个。

    其中最好的右逆为 C=AT(AAT)1C = A^T \left(A A^T\right)^{-1},最好的左逆为 B=(ATA)1ATB = \left(A^T A\right)^{-1} A^T

秩一矩阵 Rank 1 Matrix

定理:任意一个秩一矩阵都可以被写成一个行向量乘以一个列向量。我们已经使用此性质来计算秩一矩阵的 nn 次方。

线性变换 Linear Transformation

n×nn \times n 的矩阵左乘在(列)向量 Rn\in \R^n 上,得到一个新的向量。

  • 伸缩:A=[cc]A = \begin{bmatrix} c & \\ & c \end{bmatrix}A[xy]=[cxcy]A \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} cx \\ cy \end{bmatrix}

  • 旋转:A=[11]A = \begin{bmatrix} & -1 \\ 1 & \end{bmatrix}A[xy]=[yx]A \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} -y \\ x \end{bmatrix}(逆时针旋转 90°90°)。

  • 反射:A=[11]A = \begin{bmatrix} 1 & \\ & -1 \end{bmatrix}A[xy]=[xy]A \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} x \\ -y \end{bmatrix}

  • 投影:A=[1]A = \begin{bmatrix} 1 & \\ & \end{bmatrix}A[xy]=[x0]A \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} x \\ 0 \end{bmatrix}

定义

  • 定义:两个向量空间 V,WV, W 的映射 T:VWT : V \to W 满足:

    • T(v1+v2)=T(v1)+T(v2)T(v_1 + v_2) = T(v_1) + T(v_2)

    • T(cv1)=cT(v1)T(cv_1) = cT(v_1)

    TT线性变换 / 线性映射

  • 性质:原点永远不变。

  • 定理:如果我们知道 VVWW 的基 v1,,vnv_1, \cdots, v_nw1,,wmw_1, \cdots, w_m,那么 TT 可以由 Am×nA_{m \times n} 表示。AA 被称为表示矩阵

    具体地,T(vj)=a1jw1+a2jw2++amjwmT(v_j) = a_{1j} w_1 + a_{2j} w_2 + \cdots + a_{mj} w_m,也即:

    T([v1vn])=[T(v1)T(vn)]=[w1wm]A\begin{aligned} T\left(\begin{bmatrix} v_1 & \cdots & v_n \end{bmatrix}\right) &= \begin{bmatrix} T(v_1) & \cdots & T(v_n)\end{bmatrix} \\ &= \begin{bmatrix} w_1 & \cdots & w_m \end{bmatrix} A \end{aligned}

复合

  • 设线性变换 T:UVT : U \to VS:VWS : V \to W,则 STS \circ T 也是一个线性变换。

    TT 的表示矩阵是 AASS 的表示矩阵是 BB,则 STS \circ T 的表示矩阵是 BABA

坐标变换 Coordinate Transformation

  • 旋转 θ\thetaTθ=[cosθsinθsinθcosθ]T_\theta = \begin{bmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{bmatrix}。易证 TγTθ=Tθ+γT_\gamma \circ T_\theta = T_{\theta + \gamma}

  • 投影到直线 θ\thetaPθ=[cos2θcosθsinθcosθsinθsin2θ]P_\theta = \begin{bmatrix} \cos^2\theta & \cos\theta \sin\theta \\ \cos\theta \sin\theta & \sin^2\theta \end{bmatrix}。易证 PθPθ=PθP_\theta \circ P_\theta = P_\theta

  • 反射在直线 θ\thetaRθ=[cos2θsin2θsin2θcos2θ]R_\theta = \begin{bmatrix} \cos2\theta & \sin2\theta \\ \sin2\theta & -\cos2\theta \end{bmatrix}。易证 RθRθ=IR_\theta \circ R_\theta = I

相似变换

  • T:VVT : V \to VAA 是关于基 v1,,vnv_1, \cdots, v_n 的表示矩阵,BB 是关于基 w1,,wnw_1, \cdots, w_n 的表示矩阵,那么存在矩阵 SS,使得 B=S1ASB = S^{-1}AS

    证明:由 T(vS)=(vS)BT(vS) = (vS)BTT 是线性的,得 T(v)S=v(SB)T(v)S = v(SB)

    T(v)=vAT(v) = vA,故 (vA)S=v(SB)(vA)S = v(SB),即 AS=SBAS = SB,即 B=S1ASB = S^{-1}AS


Chapter 3.

正交 Orthogonal

定义:

  • 长度:x=xi2=xTx\|x\| = \sqrt{\sum x_i^2} = \sqrt{x^T x}

  • 垂直:xyx \perp y 当且仅当 xiyi=xTy=0\sum x_i y_i = x^T y = 0

  • 角度:cosθ=xTyxy\cos\theta = \frac{x^T y}{\|x\| \|y\|}。用柯西证得它的绝对值不超过 11

定理:

  • v1,,vnv_1, \cdots, v_n 互相垂直,则 v1,,vnv_1, \cdots, v_n 线性无关。

  • 余弦定理:yx2=x2+y22xycosθ\|y - x\|^2 = \|x\|^2 + \|y\|^2 - 2 \|x\| \|y\| \cos\theta

正交基

  • 我们称互相垂直且能张出整个空间的一组向量 v1,,vnv_1, \cdots, v_n正交基

正交补 Orthogonal Complement

  • 对于 VUV \subseteq U,定义 V={uUuV}V^{\perp} = \{u \in U \mid u \perp V\}

  • 维数关系:dimV+dimV=dimU\dim V + \dim V^{\perp} = \dim U

  • 性质:(V)=V\left(V^{\perp}\right)^{\perp} = V

四个基本子空间

  • C(A)=N(AT)C(A)^\perp = N\left(A^T\right)N(AT)=C(A)N\left(A^T\right)^\perp = C(A)

    C(AT)=N(A)C\left(A^T\right)^{\perp} = N(A)N(A)=C(AT)N(A)^{\perp} = C\left(A^T\right)

  • 推论:Ax=bAx = b 有解,等价于 bC(A)b \in C(A),等价于 bN(AT)b \perp N\left(A^T\right)

投影 Projection

  • bbaa 方向上的投影为 aTbaTaa=aaTaTab\frac{a^T b}{a^T a} a = \frac{a a^T}{a^T a} b

    P:RnRnbaaTaTab\begin{aligned} P : \R^n &\longrightarrow \R^n \\ b &\longmapsto \frac{a a^T}{a^T a} \cdot b \end{aligned}

  • 易证 P2=PP^2 = PPT=PP^T = P

  • C(P)=span{a}C(P) = \text{span}\{a\}N(P)={vva}N(P) = \{v \mid v \perp a\}

最小平方法 Least Square Solution

ATAx=ATbA^T A x = A^T b

若有截距,则在 AA 右边增广一列全 11 列,xx 的最后一位就是截距。

证明:给出向量 a,ba, b,做拟合 xa=bxa = bxRx \in \R)的误差的平方 E2=xab2E^2 = \|xa - b\|^2 最小时,xaxabbaa 方向上的投影。画图几何分析易证。

给出向量 a1,a2,,an,ba_1, a_2, \cdots, a_n, b,做拟合 x1a1+x2a2++xnan=bx_1 a_1 + x_2 a_2 + \cdots + x_n a_n = b 的误差的平方 E2=x1a1+x2a2++xnanbE^2 = \|x_1 a_1 + x_2 a_2 + \cdots + x_n a_n - b\| 最小时,相似地,答案是 bbC(A)C(A)A=[a1a2an]A = \begin{bmatrix} a_1 & a_2 & \cdots & a_n \end{bmatrix})上的投影(由余弦定理)。设投影点为 p=Ax^p = A \hat xx^\hat x 是向量),则 pbC(A)=N(AT)p - b \in C(A)^{\perp} = N\left(A^T\right),则:

AT(pb)=0ATAx^=ATb\begin{aligned} A^T (p - b) &= 0 \\ A^T A \hat x &= A^T b \end{aligned}

  • 据此定义空间 C(A)C(A) 上的投影:

    P:RnRnbp\begin{aligned} P : \R^n &\longrightarrow R^n \\ b &\longmapsto p \end{aligned}

    其中,rank(A)=n\text{rank}(A) = n,使 ATAA^T A 可逆;x^=(ATA)1ATb\hat x = \left(A^T A\right)^{-1} A^T bp=Ax^=A(ATA)1ATbp = A \hat x = A \left(A^T A\right)^{-1} A^T b

    P=A(ATA)1ATP = A \left(A^T A\right)^{-1} A^Tp=Pbp = Pb

  • rank(A)=n=m\text{rank}(A) = n = m,则 AA 可逆,x^=A1b\hat x = A^{-1} b

投影矩阵 Projection Matrix

  • 定义:nn 阶方阵 PP 是投影矩阵,当且仅当:

    • P2=PP^2 = P

    • PT=PP^T = P

  • 定理:IPI - P 也是投影矩阵。(IP)b=bPb(I - P) b = b - Pb,即 bbC(A)C(A) 作投影的垂线,即 bbN(AT)N\left(A^T\right) 上的投影。

带权重的最小平方问题

mm 个方程的权重分别为 wiw_iE2=i=1mwi2(ai1x1++ainxnbi)2E^2 = \sum_{i = 1}^m w_i^2 (a_{i1} x_1 + \cdots + a_{in} x_n - b_i)^2

wiw_i 乘给 aija_{ij}bib_i 即可。设 mm 阶对角方阵 WWWii=wiW_{ii} = w_i,则:

(WA)T(WA)x^=(WA)T(Wb)AT(WTW)x^=ATWTWb\begin{aligned} (WA)^T (WA) \hat x &= (WA)^T (Wb) \\ A^T \left(W^T W\right) \hat x &= A^T W^T W b \end{aligned}

柯西-施瓦茨不等式的一个证明

证明 (aTb)2ab\left(a^T b\right)^2 \le \|a\| \|b\|

bp2=(bp)T(bp)=bTb2pTbpTp=b22(aTbaaT)aTb+(aTb)2aTa=b2(aTb)2a20\begin{aligned} \|b - p\|^2 &= (b - p)^T (b - p) \\ &= b^T b - 2 p^T b - p^T p \\ &= \|b\|^2 - 2 \left(\frac{a^T b}{a a^T}\right) a^T b + \frac{\left(a^T b\right)^2}{a^T a} \\ &= \|b\|^2 - \frac{\left(a^T b\right)^2}{\|a\|^2} \ge 0 \end{aligned}

正交基 Orthogonal Basis

由单位向量组成的、两两正交的一组基称为规范正交基。

判断 q1,q2,,qmRnq_1, q_2, \cdots, q_m \in \R^n 是否是 RnR^n 的规范正交基

  • Q=[q1q2qm]Q = \begin{bmatrix} q_1 & q_2 & \cdots & q_m \end{bmatrix},若 QTQ=IQ^T Q = I,则它们两两正交。

  • 还需要 m=nm = n。此时,称满足 QTQ=IQ^T Q = I 的方阵 QQ正交矩阵

正交矩阵 Orthogonal Matrix

性质:

  • 保长度:Qx=x\|Qx\| = \|x\|

  • 保内积:(Qx)T(Qy)=xTy(Qx)^T (Qy) = x^T y

  • 保角度。

优势:

  • b=xiqi=(qiTb)qib = \sum x_i q_i = \sum \left(q_i^T b\right) q_i

  • 也就是说,若要求 bRnb \in \R^nQx=bQx = b 下的坐标 xx 时:

    x=Q1b=QTb=[q1TbqnTb]x = Q^{-1} b = Q^T b = \begin{bmatrix} q_1^T b \\ \vdots \\ q_n^T b \end{bmatrix}

  • 几何意义上,xx 的每一项就是 bb 在每一条直线上的投影。

    b2=(qiTb)2\|b\|^2 = \sum \left(q_i^T b\right)^2

结论:

  • QTQ^T 也是正交矩阵。也就是说,QQ 的每一行也两两正交。

格拉姆-施密特正交化 Gram-Schmidt

给出一组基 v1,v2,,vnv_1, v_2, \cdots, v_n,按照如下步骤求其规范正交基:

  • q1=v1v1q_1 = \frac{v_1}{\|v_1\|}

  • 对于 2in2 \le i \le n,我们将 viv_i 减去前面的 qjq_j 上的投影 qjTviqjTqjqj=(qjTvi)qj\frac{q_j^T v_i}{\|q_j^T q_j\|} q_j = \left(q_j^T v_i\right) q_j

    qi=vij=1i1(qjTvi)qjvij=1i1(qjTvi)qj=vipivipiq_i = \frac{v_i - \sum_{j = 1}^{i - 1} \left(q_j^T v_i\right) q_j}{\left\|v_i - \sum_{j = 1}^{i - 1} \left(q_j^T v_i\right) q_j\right\|} = \frac{v_i - p_i}{\|v_i - p_i\|}

    其中:

    pi=j=1i1(qjTvi)qj=[q1qi1][q1Tviqi1Tvi]p_i = \sum_{j = 1}^{i - 1} \left(q_j^T v_i\right) q_j = \begin{bmatrix} q_1 & \cdots & q_{i - 1} \end{bmatrix} \begin{bmatrix} q_1^T v_i \\ \vdots \\ q_{i - 1}^T v_i \end{bmatrix}

    Q=[q1qi1]Q = \begin{bmatrix} q_1 & \cdots & q_{i - 1} \end{bmatrix},则 pip_iQx=viQx = v_i 的最小二乘解,即:

    QTQpi=QTviQ^T Q p_i = Q^T v_i

QR 分解

  • 这对应着 A=[v1v2vn]A = \begin{bmatrix} v_1 & v_2 & \cdots & v_n \end{bmatrix} 的 QR 分解 A=QRA = QR,其中 QQ 满足 QTQ=IQ^T Q = IRR 是对角线元素为正的 上三角矩阵:

    A=[q1q2qn][v1p1q1Tv2q1Tvnv2p2q2Tvnvnpn]A = \begin{bmatrix} q_1 & q_2 & \cdots & q_n \end{bmatrix} \begin{bmatrix} \|v_1 - p_1\| & q_1^T v_2 & \cdots & q_1^T v_n \\ & \|v_2 - p_2\| & \cdots & q_2^T v_n \\ & & \ddots & \vdots \\ & & & \|v_n - p_n\| \end{bmatrix}

    AA 是方阵时,QQ 是正交矩阵。

  • AA 有 QR 分解,当且仅当 AA 列满秩(rank(A)=n\text{rank}(A) = n)。

应用

最小二乘法 ATAx^=ATbA^T A \hat x = A^T b 中的 AA 如果有 QR 分解 A=QRA = QR,那么:

(QR)TQRx^=(QR)TbRTQTQRx^=RTQTbRTRx^=RTQTbRx^=QTb\begin{aligned} (QR)^T QR \hat x &= (QR)^T b \\ R^T Q^T Q R \hat x &= R^T Q^T b \\ R^T R \hat x &= R^T Q^T b \\ R \hat x &= Q^T b \end{aligned}

一般化

定义广义的内积 ,\lang *, * \rangv×vRv \times v \to \R 的映射,满足:

  • 双线性型:

    ax1+bx2,y=ax1,y+bx2,y\lang ax_1 + bx_2, y \rang = a \lang x_1, y \rang + b \lang x_2, y \rang

    x,cy1+dy2=cx,y1+dx,y2\lang x, cy_1 + dy_2 \rang = c \lang x, y_1 \rang + d \lang x, y_2 \rang

  • 对称性:x,y=y,x\lang x, y \rang = \lang y, x \rang

  • 正定性:x,x0\lang x, x \rang \ge 0,当且仅当 x=0x = 0 时取等。

依此定义:

  • 长度:v=v,v\|v\| = \sqrt{\lang v, v \rang}

  • 距离:uv=uv,uv\|u - v\| = \sqrt{\lang u - v, u - v \rang}

  • 垂直:u,v=0\lang u, v \rang = 0

  • 角度:cosθ=u,vuv\cos\theta = \frac{\lang u, v \rang}{\|u\| \|v\|}。需要证明 cosθ1|\cos\theta| \le 1

    证明:由正定性,tR\forall t \in \Ru+tv,u+tv0\lang u + tv, u + tv \rang \ge 0。即:

    u+tv,u+tv=u,u+tv+tv,u+tv=u,u+tu,v+tv,u+t2v,v=u,u+2tu,v+t2v,v0\begin{aligned} & \lang u + tv, u + tv \rang \\ =& \lang u, u + tv \rang + t \lang v, u + tv \rang \\ =& \lang u, u \rang + t \lang u, v \rang + t \lang v, u \rang + t^2 \lang v, v \rang \\ =& \lang u, u \rang + 2t \lang u, v \rang + t^2 \lang v, v \rang \ge 0 \end{aligned}

    根据二次函数 at2+bt+c0at^2 + bt + c \ge 0 的判别式 b24ac0b^2 - 4ac \le 0,得:

    (2u,v)24u,uv,v0\left(2 \lang u, v \rang\right)^2 - 4 \lang u, u \rang \lang v, v \rang \le 0

    即:

    u,v2u,uv,v=uv\lang u, v \rang^2 \le \lang u, u \rang \lang v, v \rang = \|u\| \|v\|

应用:

  • 求一低次函数,对一给定高次函数的最佳逼近,即求该高次函数在此低次函数空间上的投影。

Chapter 4.

行列式 Determinant

定义:

  • nn 阶方阵 AA 可逆,当且仅当其行列式 det(A)0\det(A) \ne 0

几何意义:

  • 高维空间平行多面体的体积。

性质:

  • det(I)=1\det(I) = 1

  • AA 中有两行相同,则 det(A)=0\det(A) = 0

  • det(A)\det(A) 线性依赖于每行。即:

    av1Tv2TvnT+bw1Tv2TvnT=av1T+bw1Tv2TvnTa \begin{vmatrix} v_1^T \\ v_2^T \\ \vdots \\ v_n^T \end{vmatrix} + b \begin{vmatrix} w_1^T \\ v_2^T \\ \vdots \\ v_n^T \end{vmatrix} = \begin{vmatrix} a v_1^T + b w_1^T \\ v_2^T \\ \vdots \\ v_n^T \end{vmatrix}

  • 交换 AA 中两行得 AA',则 det(A)=det(A)\det(A) = -\det(A')

  • 第三种初等行变换不改变行列式。即:

    v1Tv2TvnT=v1T+v2Tv2TvnT\begin{vmatrix} v_1^T \\ v_2^T \\ \vdots \\ v_n^T \end{vmatrix} = \begin{vmatrix} v_1^T + v_2^T \\ v_2^T \\ \vdots \\ v_n^T \end{vmatrix}

    (以上三条性质告诉我们,初等行变换如何影响行列式)

  • AA 有全零行,则 det(A)=0\det(A) = 0

  • 上三角矩阵 UUdet(U)\det(U) 等于主对角线元素的积。

  • AA 奇异,等价于 det(A)=0\det(A) = 0

    AA 可逆,等价于 det(A)0\det(A) \ne 0

  • det(AB)=det(A)det(B)\det(AB) = \det(A) \det(B)

    • 推论:det(A)det(A1)=1\det(A) \det\left(A^{-1}\right) = 1
  • det(A)=det(AT)\det(A) = \det\left(A^T\right)

总结:

  • PA=LUPA = LU,其中 PP 是置换矩阵,则 det(A)=±det(L)det(U)\det(A) = \pm \det(L) \det(U),符号取决于交换行的次数。

计算公式:

  • 对于所有 1n1 \sim n 的排列 PP,计算 nn 阶方阵 AA 的行列式为:

    det(A)=Pdet(P)i=1nai,Pi\det(A) = \sum_P \det(P) \prod_{i = 1}^{n} a_{i, P_i}

    其中,det(P)=(1)inv(P)\det(P) = (-1)^{\text{inv}(P)}inv(P)\text{inv}(P)PP 的逆序对(Inversion)数。

  • 删掉第 ii 行和第 jj 列后得到的 n1n - 1 阶矩阵的行列式,称为余子式(Minor),Mij=det(rest of A)M_{ij} = \det(\text{rest of }A)。加上符号,变成代数余子式(Cofactor),Cij=(1)i+jMijC_{ij} = (-1)^{i + j} M_{ij}

    按第 ii 行展开(按列展开同理),得到 AA 的行列式的递归公式为:

    det(A)=j=1naijCij\det(A) = \sum_{j = 1}^{n} a_{ij} C_{ij}

应用:

  • 求逆 A1A^{-1}:设余子式矩阵为 CC,则:

    A1=CTdet(A)A^{-1} = \frac{C^T}{\det(A)}

  • 克莱恩法则:解 Ax=bAx = b

    x=A1b=CTbdet(A)=1det(A)[i=1nbi1Ci1i=1nbi2Ci2i=1nbinCin]x = A^{-1} b = \frac{C^T b}{\det(A)} = \frac{1}{\det(A)} \begin{bmatrix} \sum_{i = 1}^n b_{i1} C_{i1} \\ \sum_{i = 1}^n b_{i2} C_{i2} \\ \vdots \\ \sum_{i = 1}^n b_{in} C_{in} \end{bmatrix}

    那么,xjx_jAA 的第 jj 列换作 bb 后的行列式(设为 BjB_j),即:

    xj=det(Bj)det(A)x_j = \frac{\det(B_j)}{\det(A)}

  • 计算主元:第 kk 个主元 dkd_k 可由前 kk 阶顺序主子式确定:

    dk=det(Ak)det(Ak1)d_k = \frac{\det(A_k)}{\det(A_{k - 1})}

计算方法:

  • 消元。

  • 大公式。

  • 递归。

  • 对于分块矩阵:

    A1An=CU1Un\begin{vmatrix} A_1 & \cdots & * \\ & \ddots & \vdots \\ & & A_n \end{vmatrix} = C \cdot \begin{vmatrix} U_1 & \cdots & * \\ & \ddots & \vdots \\ & & U_n \end{vmatrix}

    其中,CC 是把 A1,,AnA_1, \cdots, A_n 变成 U1,,UnU_1, \cdots, U_n 的行列式系数之积。

  • AA 可逆,α,βRn\forall \alpha, \beta \in \R^n,有:

    A+αβT=A(1+βTA1α)\left|A + \alpha \beta^T\right| = |A| \left(1 + \beta^T A^{-1} \alpha\right)

    证明:

    AαβT1=A+αβT0βT1=A+αβT=A0βT1+βTA1α=A(1+βTA1α)\begin{aligned} \begin{vmatrix} A & -\alpha \\ \beta^T & 1 \end{vmatrix} &= \begin{vmatrix} A + \alpha \beta^T & 0 \\ \beta^T & 1 \end{vmatrix} = |A + \alpha \beta^T| \\ &= \begin{vmatrix} A & 0 \\ \beta^T & 1 + \beta^T A^{-1} \alpha \end{vmatrix} = |A| \left(1 + \beta^T A^{-1} \alpha\right) \end{aligned}

    • 应用:对于加扰动的秩一矩阵:

      [x1+mx2xnx1x2+mxnx1x2xn+m]=mI+[11][x1xn]\begin{bmatrix} x_1 + m & x_2 & \cdots & x_n \\ x_1 & x_2 + m & \cdots & x_n \\ \vdots & \vdots & \ddots & \vdots \\ x_1 & x_2 & \cdots & x_n + m \end{bmatrix} = mI + \begin{bmatrix} 1 \\ \vdots \\ 1 \end{bmatrix} \begin{bmatrix} x_1 & \cdots & x_n \end{bmatrix}

      得:

      A=mn(1+xim)|A| = m^n \left(1 + \frac{\sum x_i}{m}\right)

      或使用加边法:

      [1x1x2xn0x1+mx2xn0x1x2+mxn0x1x2xn+m]\begin{bmatrix} 1 & x_1 & x_2 & \cdots & x_n \\ 0 & x_1 + m & x_2 & \cdots & x_n \\ 0 & x_1 & x_2 + m & \cdots & x_n \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & x_1 & x_2 & \cdots & x_n + m \end{bmatrix}

      向下消元再向左消元即可。

  • Am×nA_{m \times n}Bn×mB_{n \times m},则:

    ImAB=InBA|I_m - AB| = |I_n - BA|

    证明:

    ImABIn=ImABA0In=ImAB=ImA0InBA=InBA\begin{aligned} \begin{vmatrix} I_m & A \\ B & I_n \end{vmatrix} &= \begin{vmatrix} I_m - AB & A \\ 0 & I_n \end{vmatrix} = |I_m - AB| \\ &= \begin{vmatrix} I_m & A \\ 0 & I_n - BA \end{vmatrix} = |I_n - BA| \end{aligned}

范德蒙德矩阵 Vandermonde Matrix

Δn(x1,x2,,xn)=111x1x2xnx12x22xn2x1n1x2n1xnn1=i>j(xixj)\begin{aligned} \Delta_n(x_1, x_2, \cdots, x_n) &= \begin{vmatrix} 1 & 1 &\cdots & 1 \\ x_1 & x_2 & \cdots & x_n \\ x_1^2 & x_2^2 & \cdots & x_n^2 \\ \vdots & \vdots & \ddots & \vdots \\ x_1^{n - 1} & x_2^{n - 1} & \cdots & x_n^{n - 1} \end{vmatrix} \\ &= \prod_{i > j} (x_i - x_j) \end{aligned}


Chapter 5.

特征值和特征向量

p(A)=AλIp(A) = |A - \lambda I|AA 的特征多项式。

使特征方程 AλI=0|A - \lambda I| = 0λ\lambda,称为 AA 的特征值(Eigenvalue)。

满足 (AλI)x=0(A - \lambda I) x = 0xx,称为对应 λ\lambda 的特征向量(Eigenvector)。

  • 上三角矩阵的特征值是他的对角线元素。

迹 Trace

定义 nn 阶矩阵的迹为:

tr(A)=i=1naii\text{tr}(A) = \sum_{i = 1}^n a_{ii}

性质:

  • λ1++λn=tr(A)\lambda_1 + \cdots + \lambda_n = \text{tr}(A)

  • λ1λn=A\lambda_1 \cdot \cdots \cdot \lambda_n = |A|

代数重数λi\lambda_i 在特征方程中是几重根。

几何重数dimN(AλiI)\dim N(A - \lambda_i I)

可对角化 Diagonalizable

假设 nn 阶方阵 AAnn 组特征值和特征向量 Axi=λixiAx_i = \lambda_i x_i,设 S=[x1xn]S = \begin{bmatrix} x_1 & \cdots & x_n \end{bmatrix},则:

S1AS=Λ=[λ1λn]S^{-1} A S = \Lambda = \begin{bmatrix} \lambda_1 & & \\ & \ddots & \\ & & \lambda_n \end{bmatrix}

其中,称 SS特征向量矩阵;称 Λ\Lambda特征值矩阵。此时,AA 可对角化。

nn 阶方阵 AA 可对角化的条件为:

  • 充分条件:
    • nn 个特征值两两互异。(引理:特征值互异 \Rightarrow 对应的特征向量线性无关)
  • 充要条件:
    • nn 个特征向量线性无关。
    • 所有特征值,代数重数等于几何重数。

性质:

  • AA 可对角化,则 AkA^k 可对角化,且二者特征向量矩阵相同。

  • 两个可对角化 nn 阶矩阵 A,BA, B 有相同的特征向量矩阵,当且仅当 AB=BAAB = BA

差分方程

设差分方程 un+1=Aunu_{n + 1} = A u_n,其中 AAkk 阶方阵且 A=SΛS1A = S \Lambda S^{-1},则 unu_n 的通项为:

un=Anu0=An(c1x1++ckxk)=c1λ1nx1+ckλknxk\begin{aligned} u_n &= A^n u_0 \\ &= A^n (c_1 x_1 + \cdots + c_k x_k) \\ &= c_1 \lambda_1^n x_1 + \cdots c_k \lambda_k^n x_k \end{aligned}

因为 kk 个特征向量线性无关,所以 unu_n 一定可以表示为它们的线性组合。

称该差分方程:

  • 稳定,若所有 λ<1|\lambda| < 1

  • 中稳定,若 AA 是马尔可夫矩阵。

  • 不稳定,若有的 λ>1|\lambda| > 1

马尔可夫矩阵 Markov Matrix

每一列加起来都为 11 的方阵。

性质:

  • 一定有一个特征值为 11

  • 11 对应的特征向量每一项都 >0> 0

  • 其它所有特征值 λ1|\lambda| \le 1

  • aij<0\forall a_{ij} < 0,那么所有特征值 λ<1|\lambda| < 1

复数矩阵 Complex Matrix

复数 Complex

  • 共轭:a+ib=aib\overline{a + ib} = a - ibz2=zz=a2+b2|z|^2 = z \overline{z} = a^2 + b^2

    • z1z2=z1z2\overline{z_1 z_2} = \overline{z_1} \cdot \overline{z_2}
  • 极化:(a+ib)(c+id)=r(cosθ+isinθ)=reiθ(a + ib) (c + id) = r (\cos\theta + i \sin\theta) = r e^{i \theta}

    θ\theta 为辐角。

  • 乘法:z1z2=r1r2ei(θ1+θ2)z_1 z_2 = r_1 r_2 e^{i (\theta_1 + \theta_2)}

复向量空间Cn\mathbb{C}^n

设复向量 xx 的共轭 x\overline{x} 是每一项都与之共轭的复向量,定义:

  • 长度:x2=xTx=xHx\|x\|^2 = \overline{x}^T x = x^H x

  • 内积:x,y=xTy=xHy\lang x, y \rang = \overline{x}^T y = x^H y。(Hermitian Inner Product)

    垂直:x,y=0\lang x, y \rang = 0

    (注意,xHy=yHxx^H y = \overline{y^H x}

设复数矩阵 AA 的共轭 B\overline{B} 是每一项都与之共轭的复数矩阵,则:

  • AB=AB\overline{AB} = \overline{A} \cdot \overline{B}

  • λA=λB\overline{\lambda A} = \overline{\lambda} \cdot \overline{B}

共轭转置 Conjugate Transpose

AH=AT=ATA^H = \overline{A}^T = \overline{A^T}

性质:

  • (AB)H=BHAH(AB)^H = B^H A^H

Hermitian Matrix

满足 AH=AA^H = A 的矩阵。

性质:

  • xCn\forall x \in \mathbb{C}^nxHAxx^H A x 是实数。

  • AA 的所有特征值是实数。

  • AA 的不同特征值的特征向量互相垂直。

谱分解定理 Spectral Theorem(实数版本):

  • AA 是实对称矩阵(AT=AA^T = A),则:

    A=QΛQT=[x1xn][λ1λn][x1TxnT]=λ1x1x1T++λnxnxnT\begin{aligned} A &= Q \Lambda Q^T = \begin{bmatrix} x_1 & \cdots & x_n \end{bmatrix} \begin{bmatrix} \lambda_1 & & \\ & \ddots & \\ & & \lambda_n \end{bmatrix} \begin{bmatrix} x_1^T \\ \cdots \\ x_n^T \end{bmatrix} \\ &= \lambda_1 x_1 x_1^T + \cdots + \lambda_n x_n x_n^T \end{aligned}

    其中 QQ 是正交矩阵(QT=Q1Q^T = Q^{-1})。或者说:Q1AQ=ΛQ^{-1} A Q = \Lambda 是对角矩阵。

  • x1,,xnx_1, \cdots, x_n 都是单位向量,那么 xixiTx_i x_i^T 是投影矩阵。即:AA 可以被分解为 nn 个投影矩阵的和。

  • 把相同的特征值合并,得到:A=λ1P1++λkPkA = \lambda_1 P_1 + \cdots + \lambda_k P_k,其中 PiP_iN(AλiI)N(A - \lambda_i I) 的投影矩阵,且:

    • ij\forall i \ne jPiPj=0P_i P_j = 0
    • P1++Pk=IP_1 + \cdots + P_k = I

Skew-Hermitian Matrix

满足 AH=AA^H = -A 的矩阵。

性质:

  • iAiA 是 Hermitian Matrix。

  • AA 的所有特征值是纯虚数。

  • AA 的不同特征值的特征向量互相垂直。

酉矩阵 Unitary Matrix

满足 UHU=IU^H U = I 的矩阵。

性质:

  • 保长度:Ux=x\|Ux\| = x

  • 保内积:(Ux)H(Uy)=xHy(Ux)^H (Uy)= x^H y

性质:

  • UU 的所有特征值 λ=1|\lambda| = 1,落在单位圆上。(正交矩阵是特殊的酉矩阵,也有此性质)

    推论:奇数阶正交矩阵一定有实特征值 λ=±1\lambda = \pm 1

  • UU 的不同特征值的特征向量互相垂直。

相似矩阵 Similar Matrix

若有可逆矩阵 MM,使得 B=M1AMB = M^{-1} A M,则称 AABB 相似。

特别地,AA 可对角化时,AA 与对角矩阵相似。

性质:

  • AABB 有相同的特征值和特征方程。因此,tr(A)=tr(B)\text{tr}(A) = \text{tr}(B)det(A)=det(B)\det(A) = \det(B)

对于线性变换:

T:RnRnxAx\begin{aligned} T : \R^n &\longrightarrow \R^n \\ x &\longmapsto Ax \end{aligned}

现有新坐标 yy 满足 x=Myx = My,则:

T:RnRnyM1Ax=M1AMy\begin{aligned} T' : \R^n &\longrightarrow \R^n \\ y &\longmapsto M^{-1} A x = M^{-1} A M y \end{aligned}

舒尔引理 Schur Lemma

任意复数矩阵 AA 总是与一个上三角矩阵酉相似,即一定存在酉矩阵 UU,使得 U1AUU^{-1} A U 是上三角矩阵。

AA 对应的酉矩阵 UU

这是一个递归的构造过程:

  1. AA 的特征向量进行格拉姆-施密特正交化,得到酉矩阵 U1=[u1un]U_1 = \left[\begin{array}{c|c|c} u_1 & \cdots & u_n \end{array}\right]。计算:

    A1=U11AU1=[λ1xT0A]A_1 = U_1^{-1} A U_1 = \begin{bmatrix} \lambda_1 & \mathbf{x}^T \\ \mathbf{0} & A' \end{bmatrix}

    其中 AA' 是一个 (n1)(n-1) 阶的子矩阵,xT\mathbf{x}^T 是一个行向量。

  2. 递归处理子矩阵 AA':对 (n1)(n-1) 阶矩阵 AA' 递归应用此过程,找到一个 (n1)(n-1) 阶的酉矩阵 U2U_2,使得 U21AU2U_2^{-1} A' U_2 是上三角矩阵。直到 n1=1n - 1 = 1 时,AA' 本身就是上三角矩阵,Un1=IU_{n - 1} = I

  3. 倒序合并得到最终的 UU

    U=U1[10T0U2]U = U_1 \begin{bmatrix} 1 & \mathbf{0}^T \\ \mathbf{0} & U_2 \end{bmatrix}

    这个 UU 就是所求的酉矩阵。可以验证 UU 是酉矩阵,且 U1AUU^{-1} A U 是上三角矩阵,且此上三角矩阵的对角线元素即为 AA 的特征值。

谱分解定理 Spectral Theorem(虚数版本):

  • 任意 Hermitian 矩阵 AA,存在酉相似矩阵 U1AU=ΛU^{-1} A U = \Lambda 是实对角矩阵。(因为 Hermitian 矩阵的特征值是实数)

  • 定义正规矩阵(Normal Matrix)AA 满足 AHA=AAHA^H A = A A^H。显然 Hermitian 矩阵、Skew Hermitian 矩阵、酉矩阵都是正规矩阵。

    AA 是正规矩阵,则 AA 存在酉相似矩阵 U1AU=TU^{-1} A U = T 是对角矩阵。

约当标准型 Jordan Form

定义约当块 J=[λ11λ21λn11λn]J = \begin{bmatrix} \lambda_1 & 1 & & & \\ & \lambda_2 & 1 & & \\ & & \ddots & \ddots & \\ & & & \lambda_{n - 1} & 1 \\ & & & & \lambda_n \end{bmatrix}

定义约当标准型 J=[J1Js]J = \begin{bmatrix} J_1 & & \\ & \ddots & \\ & & J_s \end{bmatrix}

定理:如果 AA 有至多 ss 个线性无关的特征向量,那么 AA 和有 ss 个约当块的约当标准型相似。


Chapter 6.

正定 Positive Definite

对于齐次二次函数 f(x1,x2)=ax12+2bx1x2+cx22f(x_1, x_2) = a x_1^2 + 2b x_1 x_2 + c x_2^2,其对称的系数矩阵为 A=[abbc]A = \begin{bmatrix} a & b \\ b & c \end{bmatrix}(多变元类似)。那么,f(x)=xTAxf(x) = x^T A x

配方 f=a(x1+bax2)2+acb2ay2f = a \left(x_1 + \frac{b}{a} x_2\right)^2 + \frac{ac - b^2}{a} y^2f>0f > 0acb2>0ac - b^2 > 0a>0a > 0。此时,AA正定矩阵

实对称方阵 AA 是正定的(记为 A>0A > 0),有如下等价命题:

  • xTAx>0x^T A x > 0。(正定的定义)

  • AA 的所有特征值 λ>0\lambda > 0

  • AA 的所有左上子矩阵 AkA_k 满足 det(Ak)>0\det(A_k) > 0。或称所有顺序主子式(Leading Pricipal Minor)Dk>0D_k > 0

  • AA 的所有主元 >0> 0

  • 存在可逆矩阵 RRA=RTRA = R^T R

    • 作谱分解:A=QΛQT=(QΛQT)(QΛQT)=R2A = Q \Lambda Q^T = \left(Q \sqrt{\Lambda} Q^T\right) \left(Q \sqrt{\Lambda} Q^T\right) = R^2,这个 R=AR = \sqrt{A} 是正定的。

      所以,RR 有无穷多个,但是正定的 RR 只有一个。

    • 作 LDU 分解:

      A=LDLT=(LD)(DLT)=RTRA = L D L^T = \left(L \sqrt{D}\right) \left(\sqrt{D} L^T\right) = R^T R,这个 RR 是上三角的。

      所以,RR 有无穷多个,但是上三角的 RR 只有一个。

负定 Negative Definite

xTAx<0x^T A x < 0。记为 A<0A < 0

A>0A > 0,则 A<0-A < 0

等价命题:

  • AA 的所有左上子矩阵 AkA_k 满足 (1)kAk>0(-1)^k |A_k| > 0

半正定 Semipositive Definite

xTAx0x^T A x \ge 0。记为 A0A \ge 0

等价命题:

  • AA 的所有特征值 λ0\lambda \ge 0

  • AA 的所有主子式 PkP_k 满足 Pk0P_k \ge 0

  • AA 的所有主元 0\ge 0

  • 存在矩阵 RRA=RTRA = R^T R

主子式 Principal Minor:删除 AA 的某些行和相同号码的列后的矩阵的行列式,剩下的矩阵为 kk 阶,称为 kk 阶主子式。主子式有 2n12^n - 1 个。例如:

[a11a13a14a31a33a34a41a43a44]\begin{bmatrix} a_{11} & * & a_{13} & a_{14} & * \\ * & * & * & * & * \\ a_{31} & * & a_{33} & a_{34} & * \\ a_{41} & * & a_{43} & a_{44} & * \\ * & * & * & * & * \\ \end{bmatrix}

半负定 Seminegative Definite

xTAx0x^T A x \le 0。记为 A0A \le 0

A0A \ge 0,则 A0-A \le 0

等价命题:

  • AA 的所有主子式 PkP_k 满足 (1)kPk0(-1)^k P_k \ge 0

合同 / 相合 Congruence

f=xTAxf = x^T A x 中的 xxx=Cyx = CyCC 可逆)替换,得到 f=yT(CTAC)yf = y^T (C^T A C) y。令 B=CTACB = C^T A C,称 AABB 合同。

Sylvester’s Law of Inertia 惯性定律

一种形式:

  • 合同矩阵 A,BA, B 拥有相同数量的正特征值 / 负特征值 / 零特征值。

    • 定义正惯性指数(Positive Index of Inertia)pp 为矩阵正特征值的数量。

      定义负惯性指数(Positive Index of Inertia)qq 为矩阵负特征值的数量。

      显然,p+q=rp + q = r

      定义符号差(Signature)为 pqp - q

    所以,p(A)=p(B)p(A) = p(B)q(A)=q(B)q(A) = q(B)rank(A)=rank(B)\text{rank}(A) = \text{rank}(B)

另一种形式:

  • f(x1xn)=xTAxf(x_1 \cdots x_n) = x^T A x,设 rank(A)=r\text{rank}(A) = r,则存在线性变量替换 x=Cyx = Cy,把 ff 变为标准型

    g(y1yn)=y12+y22++yp2yp+12yp+22yr2g(y_1 \cdots y_n) = y_1^2 + y_2^2 + \cdots + y_p^2 - y_{p + 1}^2 - y_{p + 2}^2 - \cdots - y_r^2

二次超曲面分类

定义二次超曲面(Quadric Hypersurfaces)为 xTAx=1x^T A x = 1

  • A=1kInA = \frac{1}{k} I_nk(x12+x22++xn2)=1k (x_1^2 + x_2^2 + \cdots + x_n^2) = 1

    • n=2n = 2:圆
    • n=3n = 3:球
  • AA 是对角矩阵:

    • n=2n = 2:椭圆 / 双曲线

    • n=3n = 3

      曲面 λ1\lambda_1 λ2\lambda_2 λ3\lambda_3
      椭球体 Ellipsoid ++ ++ ++
      单叶双曲面 Hyperboloid of One Sheet ++ ++ -
      双叶双曲面 Hyperboloid of Two Sheets ++ - -
      ×\times - - -
      椭圆柱面 Elliptic Cylinder ++ ++ 00
      双曲柱面 Hyperbolic Cylinder ++ - 00
      ×\times - - 00
      两个平行平面 Two Parallel Planes ++ 00 00
      ×\times - 00 00
      ×\times 00 00 00
  • AA 不是对角矩阵:

    • AA 对角化,A=QΛQTA = Q \Lambda Q^T。令 y=QTxy = Q^T xyTΛy=xTAx=1y^T \Lambda y = x^T A x = 1 是上面的情况。

      AA 的特征值与长短轴有关,特征向量与长短轴位置有关。

SVD 分解 Singular Value Decomposition

任意 m×nm \times n 矩阵 AA 可以被分解为 A=UΣVTA = U \Sigma V^T,其中 UUm×mm \times m 的正交矩阵,Σ\Sigmam×nm \times n 的广义对角矩阵,VVn×nn \times n 的正交矩阵。

rank(A)=rank(AT)=rank(ATA)=rank(AAT)\text{rank}(A) = \text{rank}(A^T) = \text{rank}(A^T A) = \text{rank}(A A^T)

  • UU 的列向量是 AATA A^T 的特征向量。

  • VV 的列向量是 ATAA^T A 的特征向量。

  • Σ\Sigma 的对角线上前 rank(A)\text{rank}(A) 个元素是 AArank(A)\text{rank}(A) 个非零奇异值。后面的元素为 00

    AA奇异值AATA A^TATAA^T A 的非零特征值的平方根。

AAT=(UΣVT)(UΣVT)T=UΣVTVΣTUT=U(ΣΣT)UT\begin{aligned} A A^T &= \left(U \Sigma V^T\right) \left(U \Sigma V^T\right)^T \\ &= U \Sigma V^T V \Sigma^T U^T \\ &= U \left(\Sigma \Sigma^T\right) U^T \end{aligned}

这是 AATA A^T 的谱分解。

步骤:

  • ATAA^T A(或 AATA A^T)的特征值,得到 AA 的奇异值,得到 Σ\Sigma

  • ATAA^T A 的标准正交特征向量,得到 VV

  • iri \le r 时,对于非零的奇异值 σi\sigma_i,对应的 UU 的列向量 uiu_iui=Aviσiu_i = \frac{A v_i}{\sigma_i}。(因为 Avi=σiuiA v_i = \sigma_i u_i

    i>ri > r 时,剩下的 mrm - r 个列向量张成了 N(AT)N\left(A^T\right)。(因为 Avi=0A v_i = 0,我们需要向量张成 C(A)C(A) 的补空间 N(AT)N\left(A^T\right)

性质:

  • UU 的前 rr 列给出了 C(A)C(A) 的规范正交基,后 mrm - r 列给出了 N(AT)N\left(A^T\right) 的规范正交基。

  • VV 的前 rr 列给出了 C(AT)C\left(A^T\right) 的规范正交基,后 nrn - r 列给出了 N(A)N(A) 的规范正交基。

推论:

  • 任何秩为 rr 的矩阵 AA 可以写成 rr 个秩一矩阵的线性组合。

    A=σ1u1v1T+σ2u2v2T++σrurvrTA = \sigma_1 u_1 v_1^T + \sigma_2 u_2 v_2^T + \cdots + \sigma_r u_r v_r^T