线性代数课程学习笔记

目录

坟墓里寂静无比,埋葬你的是你所有没说出口的话

好的,这是转换为简体中文的课程列表:

  1. 第1课 方程组的几何解释
  2. 第2课 矩阵消元
  3. 第3课 矩阵乘法和逆
  4. 第4课 A的LU分解
  5. 第5课 转置、置换、向量空间
  6. 第6课 列空间和零空间
  7. 第7课 Ax=0:主变量、特解
  8. 第8课 Ax=b:可解性及解的结构
  9. 第9课 线性相关性、基、维数
  10. 第10课 四个基本子空间
  11. 第11课 矩阵空间、秩1矩阵和小世界图
  12. 第12课 图和网络
  13. 第13课 复习一
  14. 第14课 正交向量与子空间
  15. 第15课 投影到子空间
  16. 第16课 投影矩阵和最小二乘
  17. 第17课 正交矩阵和格拉姆-施密特
  18. 第18课 行列式性质
  19. 第19课 行列式公式和代数余子式
  20. 第20课 克拉默法则、逆矩阵、体积
  21. 第21课 特征值和特征向量
  22. 第22课 对角化和A的幂
  23. 第23课 微分方程和exp(At)
  24. 第24课 马尔可夫矩阵; 傅里叶级数
  25. 第25课 复习二
  26. 第26课 对称矩阵的正定性
  27. 第27课 复矩阵,快速傅里叶变换
  28. 第28课 正定矩阵和最小值
  29. 第29课 相似矩阵和若尔当标准形
  30. 第30课 奇异值分解
  31. 第31课 线性变换及其矩阵表示
  32. 第32课 基变换;图像压缩
  33. 第33课 单元检测3复习
  34. 第34课 左、右逆,伪逆
  35. 第35课 期末复习

第1课:第1集 方程组的几何解释 — 学习笔记

核心摘要 (Key Takeaways)

  • 线性方程组 Ax=bA\mathbf{x} = \mathbf{b} 有三种核心视角:行图像(row picture)、列图像(column picture)和矩阵形式
  • 行图像:每个方程对应一个几何对象(2D 中是直线,3D 中是平面),解是这些对象的交点。
  • 列图像:将方程组视为对矩阵列向量的线性组合,目标是找到系数 x\mathbf{x} 使得组合结果等于 b\mathbf{b}
  • 矩阵乘法 AxA\mathbf{x} 本质上是列向量的线性组合Ax=x1a1+x2a2++xnanA\mathbf{x} = x_1 \mathbf{a}_1 + x_2 \mathbf{a}_2 + \cdots + x_n \mathbf{a}_n
  • 并非所有方程组对任意 b\mathbf{b} 都有解;当矩阵的列向量线性相关(如共面)时,其线性组合无法覆盖整个空间,此时矩阵为奇异矩阵(不可逆)。

1. 线性方程组的三种视角

1.1 矩阵形式(代数视角)

线性方程组可统一写为:

Ax=b A\mathbf{x} = \mathbf{b}

其中:

  • AAm×nm \times n系数矩阵(rectangular array of numbers),
  • x\mathbf{x}nn未知向量
  • b\mathbf{b}mm右端向量

关键理解:矩阵乘法 AxA\mathbf{x} 的本质是AA 的列向量进行线性组合


1.2 行图像(Row Picture)

  • 思想:逐行看待方程,每行对应一个几何对象。
  • 2D 情况:每个方程是一条直线,解是直线的交点
  • 3D 情况:每个方程是一个平面,解是三个平面的公共交点
  • 高维:每个方程定义一个超平面,解是所有超平面的交集。

例子(2×2 系统):

考虑方程组:

{2xy=0x+2y=3 \begin{cases} 2x - y = 0 \\ -x + 2y = 3 \end{cases}
  • 第一方程 2xy=02x - y = 0

    • 过原点 (0,0)(0,0)
    • 另一点:(1,2)(1,2)(因 2(1)2=02(1) - 2 = 0),
    • 所有点构成一条直线。
  • 第二方程 x+2y=3-x + 2y = 3

    • y=0y=0,得 x=3x = -3 → 点 (3,0)(-3, 0)
    • x=1x = -1,得 (1)+2y=3y=1-(-1) + 2y = 3 \Rightarrow y = 1 → 点 (1,1)(-1, 1)
    • 连接两点得直线。
  • :两直线交点为 (1,2)(1, 2),验证:

    • 2(1)2=02(1) - 2 = 0
    • 1+2(2)=3-1 + 2(2) = 3

例子(3×3 系统):

{2xy+0z=0x+2yz=10x3y+4z=4 \begin{cases} 2x - y + 0z = 0 \\ -x + 2y - z = -1 \\ 0x - 3y + 4z = 4 \end{cases}
  • 每个方程对应一个平面
  • 三个平面(一般位置)交于一点
  • 行图像在 3D 已较难可视化,更高维几乎不可视。

局限性:行图像随维度升高迅速变得难以理解。


1.3 列图像(Column Picture) ✨(重点!)

  • 思想:将方程组视为对列向量的线性组合。

  • 原方程组重写为:

    x[21]+y[12]=[03] x \begin{bmatrix} 2 \\ -1 \end{bmatrix} + y \begin{bmatrix} -1 \\ 2 \end{bmatrix} = \begin{bmatrix} 0 \\ 3 \end{bmatrix}
  • 目标:找到标量 x,yx, y,使得列向量的线性组合等于 b\mathbf{b}

例子(2×2 系统,同上):

  • 列1:a1=[21]\mathbf{a}_1 = \begin{bmatrix} 2 \\ -1 \end{bmatrix}
  • 列2:a2=[12]\mathbf{a}_2 = \begin{bmatrix} -1 \\ 2 \end{bmatrix}
  • 目标:xa1+ya2=[03]x \mathbf{a}_1 + y \mathbf{a}_2 = \begin{bmatrix} 0 \\ 3 \end{bmatrix}

已知解为 x=1,y=2x=1, y=2,验证:

1[21]+2[12]=[221+4]=[03] 1 \cdot \begin{bmatrix} 2 \\ -1 \end{bmatrix} + 2 \cdot \begin{bmatrix} -1 \\ 2 \end{bmatrix} = \begin{bmatrix} 2 - 2 \\ -1 + 4 \end{bmatrix} = \begin{bmatrix} 0 \\ 3 \end{bmatrix}

几何解释:从原点出发,先走 1 倍列1,再从其终点走 2 倍列2,最终到达 b\mathbf{b}

更深层问题:

所有可能的线性组合能覆盖整个平面吗?

  • 若两列向量不共线(线性无关),则其所有线性组合可覆盖整个 R2\mathbb{R}^2
  • 若共线,则只能覆盖一条直线。

2. 矩阵乘法的两种理解方式

给定:

A=[2513],x=[12] A = \begin{bmatrix} 2 & 5 \\ 1 & 3 \end{bmatrix}, \quad \mathbf{x} = \begin{bmatrix} 1 \\ 2 \end{bmatrix}

方式一:按列组合(推荐!)

Ax=1[21]+2[53]=[2+101+6]=[127] A\mathbf{x} = 1 \cdot \begin{bmatrix} 2 \\ 1 \end{bmatrix} + 2 \cdot \begin{bmatrix} 5 \\ 3 \end{bmatrix} = \begin{bmatrix} 2 + 10 \\ 1 + 6 \end{bmatrix} = \begin{bmatrix} 12 \\ 7 \end{bmatrix}

方式二:按行点积(dot product)

  • 第一行:[2,5][1,2]=21+52=12[2, 5] \cdot [1, 2] = 2 \cdot 1 + 5 \cdot 2 = 12
  • 第二行:[1,3][1,2]=11+32=7[1, 3] \cdot [1, 2] = 1 \cdot 1 + 3 \cdot 2 = 7

核心观点AxA\mathbf{x}AA 的列向量的线性组合,系数来自 x\mathbf{x}


3. 可解性与矩阵的“好坏”

核心问题:

对任意 b\mathbf{b},方程 Ax=bA\mathbf{x} = \mathbf{b} 是否总有解?

等价于:

AA 的列向量的所有线性组合是否能填满整个目标空间?

例子(3×3 系统):

A=[210121034] A = \begin{bmatrix} 2 & -1 & 0 \\ -1 & 2 & -1 \\ 0 & -3 & 4 \end{bmatrix}
  • b=[014]\mathbf{b} = \begin{bmatrix} 0 \\ -1 \\ 4 \end{bmatrix},恰好等于第三列 → 解为 (0,0,1)(0, 0, 1)
  • b=列1+列2=[113]\mathbf{b} = \text{列1} + \text{列2} = \begin{bmatrix} 1 \\ 1 \\ -3 \end{bmatrix} → 解为 (1,1,0)(1, 1, 0)

结论:若三列向量线性无关(不共面),则其组合可覆盖整个 R3\mathbb{R}^3,对任意 b\mathbf{b} 有解。

何时失败?——奇异矩阵(Singular Matrix)

  • 情况:若三列共面(如 a3=a1+a2\mathbf{a}_3 = \mathbf{a}_1 + \mathbf{a}_2),
  • 后果:所有线性组合仍落在该平面内,
  • 结果:只有当 b\mathbf{b} 也在该平面内时,方程才有解;否则无解。

此时 AA奇异矩阵(不可逆,non-invertible)。

推广到 n 维:

  • nnnn 维列向量线性无关 → 组合填满 Rn\mathbb{R}^n非奇异矩阵(good matrix)。
  • 若列向量线性相关 → 组合仅覆盖低维子空间(如 8D 平面嵌入 9D 空间)→ 奇异矩阵

实践提示:随机生成的矩阵(如 MATLAB rand(9,9))几乎总是非奇异的。


4. 可视化图表(Mermaid)

虽然字幕未明确描述流程或交互,但为辅助理解列图像的向量加法过程,可构建如下流程图:

flowchart LR
    A[Start at origin] --> B[Add x * column1]
    B --> C[From tip of x*col1, add y * column2]
    C --> D[Arrive at b = x*col1 + y*col2]
flowchart LR
    A[Start at origin] --> B[Add x * column1]
    B --> C[From tip of x*col1, add y * column2]
    C --> D[Arrive at b = x*col1 + y*col2]
flowchart LR
    A[Start at origin] --> B[Add x * column1]
    B --> C[From tip of x*col1, add y * column2]
    C --> D[Arrive at b = x*col1 + y*col2]

解释:该流程图描述了列图像中如何通过首尾相接的方式,将列向量按系数缩放后相加,最终到达目标向量 b\mathbf{b}。这体现了线性组合的几何构造过程。


5. 总结与前瞻

  • 行图像直观但高维失效;列图像揭示了线性代数的核心——向量空间与线性组合
  • 矩阵乘法 = 列组合 是贯穿课程的核心思想。
  • 下一讲将介绍消元法(elimination)——系统求解 Ax=bA\mathbf{x} = \mathbf{b} 的算法,并能判断解是否存在。

“线性组合”是本课程最基础、最重要的操作。务必深刻理解其代数与几何双重含义。

第2课:矩阵消元 — 高质量学习笔记


核心摘要 (Key Takeaways)

  • 高斯消元法是求解线性方程组 Ax=bA\mathbf{x} = \mathbf{b} 的标准算法,通过行操作将系数矩阵 AA 转化为上三角矩阵 UU
  • 消元过程依赖于主元(pivot);若主元为零,可通过行交换(permutation)解决(临时失败),若下方无非零元素则为完全失败(矩阵不可逆)。
  • **回代(back substitution)**用于从上三角系统 Ux=cU\mathbf{x} = \mathbf{c} 中自下而上求解未知数。
  • 每一步消元操作都可表示为**初等矩阵(elementary matrix)**左乘原矩阵;整个消元过程等价于一系列初等矩阵的乘积作用于 AA
  • 矩阵乘法不满足交换律但满足结合律(EF)A=E(FA)(EF)A = E(FA),这使得我们可以将多步操作合并为一个整体变换矩阵。

1. 高斯消元法(Gaussian Elimination)概述

1.1 目标与背景

  • 目标:求解线性方程组 Ax=bA\mathbf{x} = \mathbf{b},其中 AAn×nn \times n 系数矩阵,b\mathbf{b} 是右侧向量。
  • 方法:高斯消元法(非行列式法),是所有数值软件(如 MATLAB)求解线性系统的标准方法。
  • 成功条件:矩阵 AA 是“好矩阵”——即在消元过程中能获得 nn 个非零主元。

关键思想:通过行操作逐步消除变量,将系统转化为上三角形式,便于回代求解。


1.2 示例系统

考虑以下三元线性方程组:

{x+2y+z=23x+8y+z=120x+4y+z=2 \begin{cases} x + 2y + z = 2 \\ 3x + 8y + z = 12 \\ 0x + 4y + z = 2 \end{cases}

对应矩阵形式为:

A=[121381041],b=[2122] A = \begin{bmatrix} 1 & 2 & 1 \\ 3 & 8 & 1 \\ 0 & 4 & 1 \end{bmatrix}, \quad \mathbf{b} = \begin{bmatrix} 2 \\ 12 \\ 2 \end{bmatrix}

2. 消元步骤详解

2.1 第一步:消除第2行的 x 项(位置 (2,1))

  • 主元(pivot)a11=1a_{11} = 1(第一个主元,必须非零)。
  • 乘数(multiplier)l21=a21a11=31=3l_{21} = \frac{a_{21}}{a_{11}} = \frac{3}{1} = 3
  • 操作:第2行 ← 第2行 − 3 × 第1行。

结果

[121022041] \begin{bmatrix} 1 & 2 & 1 \\ 0 & 2 & -2 \\ 0 & 4 & 1 \end{bmatrix}

例子:原第2行为 [3,8,1][3, 8, 1],减去 3×[1,2,1]=[3,6,3]3 \times [1, 2, 1] = [3, 6, 3],得 [0,2,2][0, 2, -2]

右侧向量同步更新:

  • b2=123×2=6b_2 = 12 - 3 \times 2 = 6
  • b=[2,6,2]T\mathbf{b} = [2, 6, 2]^T

2.2 第二步:消除第3行的 x 项(位置 (3,1))

  • 当前 a31=0a_{31} = 0,无需操作。
  • 乘数l31=0l_{31} = 0

说明:即使无需操作,算法仍会检查该位置;若为非零,则需消元。


2.3 第三步:消除第3行的 y 项(位置 (3,2))

  • 新主元a22=2a_{22} = 2(第二个主元)。
  • 乘数l32=a32a22=42=2l_{32} = \frac{a_{32}}{a_{22}} = \frac{4}{2} = 2
  • 操作:第3行 ← 第3行 − 2 × 第2行。

结果(上三角矩阵 UU

U=[121022005] U = \begin{bmatrix} 1 & 2 & 1 \\ 0 & 2 & -2 \\ 0 & 0 & 5 \end{bmatrix}

例子:第3行原为 [0,4,1][0, 4, 1],减去 2×[0,2,2]=[0,4,4]2 \times [0, 2, -2] = [0, 4, -4],得 [0,0,5][0, 0, 5]

右侧向量更新:

  • b3=22×6=10b_3 = 2 - 2 \times 6 = -10
  • 最终 c=[2,6,10]T\mathbf{c} = [2, 6, -10]^T

2.4 主元总结

  • 三个主元分别为:1, 2, 5(全部非零 ⇒ 矩阵可逆)。
  • 行列式det(A)=1×2×5=10\det(A) = 1 \times 2 \times 5 = 10(主元乘积)。

3. 消元失败的情形

3.1 临时失败(可通过行交换解决)

  • 情形1:首元素 a11=0a_{11} = 0
    • 对策:交换第1行与下方某行(该行首元素非零)。
  • 情形2:第二主元位置为零(如将原 a22=8a_{22}=8 改为6,则消元后 a22=0a_{22}' = 0)。
    • 例子:若 A22=6A_{22} = 6,则第2行变为 [0,0,2][0, 0, -2],主元为0。
    • 对策:若第3行对应位置非零(如4),可交换第2、3行。

关键原则:只要主元位置下方存在非零元素,即可通过行交换(permutation)挽救。

3.2 完全失败(不可逆)

  • 情形:某主元位置为零,且其下方所有元素也为零。
  • 例子:若原矩阵最后一行改为 [0,4,4][0, -4, -4],则消元后第3行变为 [0,0,0][0, 0, 0],第三个主元为0。
    • 此时矩阵奇异(singular),无唯一解,不可逆。

结论:消元成功 ⇔ 获得 nn 个非零主元 ⇔ 矩阵可逆。


4. 回代(Back Substitution)

从上三角系统 Ux=cU\mathbf{x} = \mathbf{c} 求解:

{x+2y+z=22y2z=65z=10 \begin{cases} x + 2y + z = 2 \\ \quad\quad 2y - 2z = 6 \\ \quad\quad\quad\quad 5z = -10 \end{cases}

步骤

  1. 由第3式:z=10/5=2z = -10 / 5 = -2
  2. 代入第2式:2y2(2)=62y+4=6y=12y - 2(-2) = 6 \Rightarrow 2y + 4 = 6 \Rightarrow y = 1
  3. 代入第1式:x+2(1)+(2)=2x=2x + 2(1) + (-2) = 2 \Rightarrow x = 2

x=[2,1,2]T\mathbf{x} = [2, 1, -2]^T


5. 消元的矩阵表示

5.1 初等矩阵(Elementary Matrices)

每一步行操作可表示为一个初等矩阵左乘当前矩阵。

第一步:消除 (2,1)

  • 操作:Row2 ← Row2 − 3×Row1
  • 初等矩阵 E21E_{21}E21=[100310001] E_{21} = \begin{bmatrix} 1 & 0 & 0 \\ -3 & 1 & 0 \\ 0 & 0 & 1 \end{bmatrix}
  • 验证:E21AE_{21} A 得到第一步结果。

第二步:消除 (3,2)

  • 操作:Row3 ← Row3 − 2×Row2
  • 初等矩阵 E32E_{32}E32=[100010021] E_{32} = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & -2 & 1 \end{bmatrix}

5.2 整体消元矩阵

整个消元过程:

E32(E21A)=U E_{32} (E_{21} A) = U

结合律(associative law):

(E32E21)A=U (E_{32} E_{21}) A = U

定义整体消元矩阵:

E=E32E21 E = E_{32} E_{21}

重要性质

  • 矩阵乘法不满足交换律ABBAAB \ne BA
  • 满足结合律(AB)C=A(BC)(AB)C = A(BC) —— 这是线性代数证明的核心工具。

5.3 行交换与置换矩阵(Permutation Matrix)

  • 行交换:由置换矩阵 PP 实现(左乘)。

    • 例如,交换2×2矩阵的两行: P=[0110],P[abcd]=[cdab] P = \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix}, \quad P \begin{bmatrix} a & b \\ c & d \end{bmatrix} = \begin{bmatrix} c & d \\ a & b \end{bmatrix}
    • 构造方法:对单位矩阵做相同行交换。
  • 列交换:需右乘置换矩阵(因左乘只影响行)。

规则总结

  • 左乘 → 行操作
  • 右乘 → 列操作

6. 逆矩阵(Inverse)与消元的可逆性

6.1 初等矩阵的逆

  • E21E_{21} 表示“Row2 ← Row2 − 3×Row1”
  • 其逆操作为:“Row2 ← Row2 + 3×Row1”
  • 逆矩阵: E211=[100310001] E_{21}^{-1} = \begin{bmatrix} 1 & 0 & 0 \\ 3 & 1 & 0 \\ 0 & 0 & 1 \end{bmatrix}
  • 验证:E211E21=IE_{21}^{-1} E_{21} = I

一般规则:初等矩阵的逆只需将乘数符号取反。

6.2 消元的可逆性

  • 所有初等矩阵均可逆 ⇒ 若消元成功(无零主元),则 AA 可逆。
  • 且有:A=E211E321UA = E_{21}^{-1} E_{32}^{-1} U

7. 可视化:消元流程图

flowchart LR
    A[原始矩阵 A] -->|E₂₁| B[消除 a₂₁]
    B -->|E₃₁=I| C[无需消除 a₃₁]
    C -->|E₃₂| D[消除 a₃₂]
    D --> E[上三角矩阵 U]
    E --> F[回代求解 x]
flowchart LR
    A[原始矩阵 A] -->|E₂₁| B[消除 a₂₁]
    B -->|E₃₁=I| C[无需消除 a₃₁]
    C -->|E₃₂| D[消除 a₃₂]
    D --> E[上三角矩阵 U]
    E --> F[回代求解 x]
flowchart LR
    A[原始矩阵 A] -->|E₂₁| B[消除 a₂₁]
    B -->|E₃₁=I| C[无需消除 a₃₁]
    C -->|E₃₂| D[消除 a₃₂]
    D --> E[上三角矩阵 U]
    E --> F[回代求解 x]

解释:该流程图展示了高斯消元的前向消元(forward elimination)阶段,每一步由一个初等矩阵驱动,最终得到上三角矩阵 UU,再通过回代求解。


附:关键术语表

  • 主元(Pivot):消元过程中用于消去下方元素的对角线元素,必须非零。
  • 上三角矩阵(Upper Triangular Matrix):主对角线下方元素全为零的矩阵,记为 UU
  • 初等矩阵(Elementary Matrix):单位矩阵经一次初等行变换得到的矩阵。
  • 置换矩阵(Permutation Matrix):用于交换行或列的正交矩阵。
  • 回代(Back Substitution):从上三角系统自下而上求解未知数的过程。
  • 奇异矩阵(Singular Matrix):不可逆矩阵,消元时出现零主元且无法通过行交换解决。

本笔记完整覆盖视频所有概念、例子、失败情形、矩阵表示及逆操作,结构清晰,便于复习与深度理解。

第3课:矩阵乘法与逆矩阵 — 高质量学习笔记

核心摘要 (Key Takeaways)

  • 矩阵乘法有四种等价视角:(1) 元素级点积(行×列)、(2) 列组合(A作用于B的每一列)、(3) 行组合(B的行被A线性组合)、(4) 列×行外积求和。
  • 矩阵乘积 AB=CAB = C 要求 A 的列数 = B 的行数;若 AAm×nm \times nBBn×pn \times p,则 CCm×pm \times p
  • 一个方阵不可逆(奇异) 的充要条件是:存在非零向量 x\mathbf{x} 使得 Ax=0A\mathbf{x} = \mathbf{0},即其列向量线性相关。
  • Gauss-Jordan 消元法 是求逆矩阵的标准算法:对增广矩阵 [AI][A \mid I] 进行行变换,将其左半部分化为单位矩阵 II,右半部分即为 A1A^{-1}
  • AA 可逆,则 A1A=AA1=IA^{-1}A = AA^{-1} = I;对于方阵,左逆等于右逆。

一、矩阵乘法的四种等价方式

1. 元素级定义(行 × 列)

给定矩阵 AAm×nm \times n)与 BBn×pn \times p),其乘积 C=ABC = AB 是一个 m×pm \times p 矩阵,其中第 (i,j)(i,j) 项为:

Cij=k=1nAikBkj C_{ij} = \sum_{k=1}^{n} A_{ik} B_{kj}

例子:计算 C34C_{34}

  • AA 的第 3 行:(A31,A32,,A3n)(A_{31}, A_{32}, \dots, A_{3n})
  • BB 的第 4 列:(B14,B24,,Bn4)(B_{14}, B_{24}, \dots, B_{n4})^\top
  • 点积:C34=A31B14+A32B24++A3nBn4C_{34} = A_{31}B_{14} + A_{32}B_{24} + \cdots + A_{3n}B_{n4}

维度匹配规则

  • AA: m×nm \times n
  • BB: n×pn \times p
  • C=ABC = AB: m×pm \times p

2. 列视角:C 的列是 A 的列的线性组合

BB 按列分块:B=[b1 b2  bp]B = [\mathbf{b}_1\ \mathbf{b}_2\ \cdots\ \mathbf{b}_p],则:

AB=[Ab1 Ab2  Abp] AB = [A\mathbf{b}_1\ A\mathbf{b}_2\ \cdots\ A\mathbf{b}_p]

关键理解

  • 每一列 AbjA\mathbf{b}_jAA 的列向量的线性组合,组合系数来自 bj\mathbf{b}_j
  • 因此,CC 的所有列都位于 AA 的列空间中

例子
A=[234]A = \begin{bmatrix} 2 \\ 3 \\ 4 \end{bmatrix}(视为 3×13 \times 1 矩阵),B=[16]B = \begin{bmatrix} 1 & 6 \end{bmatrix}1×21 \times 2),则

>AB=[234][16]=[212318424]> > AB = \begin{bmatrix} 2 \\ 3 \\ 4 \end{bmatrix} \begin{bmatrix} 1 & 6 \end{bmatrix} = \begin{bmatrix} 2 & 12 \\ 3 & 18 \\ 4 & 24 \end{bmatrix} >
  • 每一列都是 [234]\begin{bmatrix} 2 \\ 3 \\ 4 \end{bmatrix} 的倍数(列空间是一维直线)。

3. 行视角:C 的行是 B 的行的线性组合

AA 按行分块,CC 的每一行是 BB 的行的线性组合,组合系数来自 AA 的对应行。

关键理解

  • CC 的所有行都位于 BB 的行空间中

例子(同上):
AB=[212318424]AB = \begin{bmatrix} 2 & 12 \\ 3 & 18 \\ 4 & 24 \end{bmatrix}

  • 每一行都是 [1 6][1\ 6] 的倍数(行空间是一维直线)。

4. 列 × 行外积求和(第四种方式)

AA 有列 a1,a2,,an\mathbf{a}_1, \mathbf{a}_2, \dots, \mathbf{a}_nBB 有行 r1,r2,,rn\mathbf{r}_1, \mathbf{r}_2, \dots, \mathbf{r}_n,则:

AB=k=1nakrk AB = \sum_{k=1}^{n} \mathbf{a}_k \mathbf{r}_k

例子

>A=[273849],>B=[1600]> > A = \begin{bmatrix} 2 & 7 \\ 3 & 8 \\ 4 & 9 \end{bmatrix}, \quad > B = \begin{bmatrix} 1 & 6 \\ 0 & 0 \end{bmatrix} >



>AB=[234][16]+[789][00]=[212318424]+0> > AB = \begin{bmatrix} 2 \\ 3 \\ 4 \end{bmatrix} \begin{bmatrix} 1 & 6 \end{bmatrix} + \begin{bmatrix} 7 \\ 8 \\ 9 \end{bmatrix} \begin{bmatrix} 0 & 0 \end{bmatrix} = \begin{bmatrix} 2 & 12 \\ 3 & 18 \\ 4 & 24 \end{bmatrix} + \mathbf{0} >

几何意义

  • 此矩阵的行空间是过向量 [1 6][1\ 6] 的直线。
  • 列空间是过向量 [2 3 4][2\ 3\ 4]^\top 的直线。
  • 这是一个秩为 1 的矩阵(极简结构)。

二、分块矩阵乘法(补充方式)

若将 AABB 按兼容方式分块(如 A=[A11A12A21A22]A = \begin{bmatrix} A_{11} & A_{12} \\ A_{21} & A_{22} \end{bmatrix}B=[B11B12B21B22]B = \begin{bmatrix} B_{11} & B_{12} \\ B_{21} & B_{22} \end{bmatrix}),则乘积可按块计算:

AB=[A11B11+A12B21A11B12+A12B22A21B11+A22B21A21B12+A22B22] AB = \begin{bmatrix} A_{11}B_{11} + A_{12}B_{21} & A_{11}B_{12} + A_{12}B_{22} \\ A_{21}B_{11} + A_{22}B_{21} & A_{21}B_{12} + A_{22}B_{22} \end{bmatrix}

要求:块之间的维度必须匹配(如 A12A_{12} 的列数 = B21B_{21} 的行数)。


三、矩阵的逆(Inverse)

1. 定义

方阵 AAn×nn \times n),若存在矩阵 A1A^{-1} 使得:

A1A=AA1=In A^{-1}A = AA^{-1} = I_n

则称 AA 可逆(invertible)非奇异(non-singular)

重要性质:对方阵,若存在左逆(XA=IXA = I),则必存在右逆,且两者相等。


2. 不可逆(奇异)矩阵的判定

以下条件等价(任一成立 ⇒ AA 不可逆):

  • 存在非零向量 x0\mathbf{x} \neq \mathbf{0},使得 Ax=0A\mathbf{x} = \mathbf{0}
  • AA 的列向量线性相关(即某些列是其他列的线性组合)。
  • AA 的列空间不能张成 Rn\mathbb{R}^n(例如所有列共线)。

例子

>A=[1326]> > A = \begin{bmatrix} 1 & 3 \\ 2 & 6 \end{bmatrix} >
  • 列2 = 3 × 列1 ⇒ 列线性相关。
  • x=[31]0\mathbf{x} = \begin{bmatrix} 3 \\ -1 \end{bmatrix} \neq \mathbf{0},则
    >Ax=3[12]1[36]=[00]> > A\mathbf{x} = 3 \begin{bmatrix} 1 \\ 2 \end{bmatrix} - 1 \begin{bmatrix} 3 \\ 6 \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix} >
  • 无法得到单位矩阵的列(如 [1 0][1\ 0]^\top 不在列空间中)⇒ 不可逆

反证法逻辑
假设 A1A^{-1} 存在,且 Ax=0A\mathbf{x} = \mathbf{0},则

>A1(Ax)=A10x=0> > A^{-1}(A\mathbf{x}) = A^{-1}\mathbf{0} \Rightarrow \mathbf{x} = \mathbf{0} >


x0\mathbf{x} \neq \mathbf{0} 矛盾 ⇒ A1A^{-1} 不存在。


3. 求逆方法:Gauss-Jordan 消元法

步骤:

  1. 构造增广矩阵 [AI][A \mid I]
  2. 对整个矩阵进行行变换,将左侧 AA 化为单位矩阵 II
  3. 此时右侧即为 A1A^{-1}

例子:求

>A=[1327]> > A = \begin{bmatrix} 1 & 3 \\ 2 & 7 \end{bmatrix} >


的逆。

步骤演示

初始增广矩阵:

[13102701] \left[\begin{array}{cc|cc} 1 & 3 & 1 & 0 \\ 2 & 7 & 0 & 1 \end{array}\right]
  • Step 1:Row2 ← Row2 − 2×Row1

    [13100121] \left[\begin{array}{cc|cc} 1 & 3 & 1 & 0 \\ 0 & 1 & -2 & 1 \end{array}\right]
  • Step 2:Row1 ← Row1 − 3×Row2

    [10730121] \left[\begin{array}{cc|cc} 1 & 0 & 7 & -3 \\ 0 & 1 & -2 & 1 \end{array}\right]


A1=[7321] A^{-1} = \begin{bmatrix} 7 & -3 \\ -2 & 1 \end{bmatrix}

验证

AA1=[1327][7321]=[1001] AA^{-1} = \begin{bmatrix} 1 & 3 \\ 2 & 7 \end{bmatrix} \begin{bmatrix} 7 & -3 \\ -2 & 1 \end{bmatrix} = \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix}

理论解释(为何有效)?

设一系列初等行变换矩阵为 E1,E2,,EkE_1, E_2, \dots, E_k,其乘积为 E=EkE1E = E_k \cdots E_1
[AI][A \mid I] 应用这些变换,等价于左乘 EE

E[AI]=[EAEI]=[IE] E[A \mid I] = [EA \mid EI] = [I \mid E]

由于 EA=IEA = I,故 E=A1E = A^{-1}。因此右侧结果即为 A1A^{-1}


附:关键术语回顾

  • 可逆矩阵(Invertible Matrix):存在逆矩阵的方阵。
  • 奇异矩阵(Singular Matrix):不可逆的方阵。
  • 列空间(Column Space):矩阵所有列向量张成的子空间。
  • 行空间(Row Space):矩阵所有行向量张成的子空间。
  • 线性相关(Linearly Dependent):存在不全为零的系数使向量组合为零。
  • Gauss-Jordan 消元法:同时求解多个线性系统以计算逆矩阵的算法。

第4课:A 的 LU 分解 — 高质量学习笔记


核心摘要 (Key Takeaways)

  • 矩阵乘积的逆遵循反序法则(AB)1=B1A1(AB)^{-1} = B^{-1}A^{-1}
  • LU 分解将矩阵 AA 分解为一个单位下三角矩阵 LL 与一个上三角矩阵 UU 的乘积:A=LUA = LU(假设无行交换)。
  • 消元过程可被表示为一系列初等消元矩阵 EijE_{ij} 的乘积作用于 AA,即 EA=UEA = U;而 L=E1L = E^{-1},且 LL 的非对角元素直接等于消元时使用的乘子
  • 计算复杂度:高斯消元法对 n×nn \times n 矩阵的运算量约为 13n3\frac{1}{3}n^3 次浮点运算;对每个右侧向量 bb 的回代成本为 O(n2)O(n^2)
  • 置换矩阵(Permutation Matrices) 用于处理主元为零的情况;它们是单位矩阵的行重排,其逆等于其转置P1=PTP^{-1} = P^T

1. 矩阵乘积的逆与转置

1.1 乘积的逆:反序法则

  • AABB 均为可逆方阵,则乘积 ABAB 也可逆,且: (AB)1=B1A1 (AB)^{-1} = B^{-1}A^{-1}
  • 验证(AB)(B1A1)=A(BB1)A1=AIA1=AA1=I (AB)(B^{-1}A^{-1}) = A(BB^{-1})A^{-1} = AIA^{-1} = AA^{-1} = I
  • 直观类比:脱鞋袜的顺序是“先鞋后袜”,穿回时必须“先袜后鞋”。

例子:若先穿袜再穿鞋,逆过程必须先穿袜、再穿鞋——对应矩阵乘法顺序反转。

1.2 转置的逆

  • AA1=IAA^{-1} = I 出发,两边转置: (AA1)T=IT=I (AA^{-1})^T = I^T = I 利用 (XY)T=YTXT(XY)^T = Y^T X^T,得: (A1)TAT=I (A^{-1})^T A^T = I 因此: (AT)1=(A1)T (A^T)^{-1} = (A^{-1})^T
  • 结论:对可逆矩阵 AA转置与求逆可交换顺序

2. LU 分解:高斯消元的矩阵视角

2.1 基本思想

  • 高斯消元将矩阵 AA 化为上三角矩阵 UU
  • 无需行交换(即所有主元非零),则存在单位下三角矩阵 LL(对角线为1),使得: A=LU A = LU
  • 其中:
    • UU:消元后的上三角矩阵;
    • LL:记录消元过程中所用乘子(multipliers) 的下三角矩阵。

2.2 2×2 案例详解

例子:设

>A=[2187]> > A = \begin{bmatrix} 2 & 1 \\ 8 & 7 \end{bmatrix} >
  • 第一步:用第1行消去第2行第1列。乘子为 8/2=48/2 = 4
  • 初等消元矩阵: E21=[1041] E_{21} = \begin{bmatrix} 1 & 0 \\ -4 & 1 \end{bmatrix}
  • 应用后得: U=E21A=[2103] U = E_{21}A = \begin{bmatrix} 2 & 1 \\ 0 & 3 \end{bmatrix}
  • 因此: A=E211U=LU A = E_{21}^{-1} U = L U 其中: L=E211=[1041] L = E_{21}^{-1} = \begin{bmatrix} 1 & 0 \\ 4 & 1 \end{bmatrix}
  • 验证:LU=[1041][2103]=[2187]=ALU = \begin{bmatrix} 1 & 0 \\ 4 & 1 \end{bmatrix} \begin{bmatrix} 2 & 1 \\ 0 & 3 \end{bmatrix} = \begin{bmatrix} 2 & 1 \\ 8 & 7 \end{bmatrix} = A

关键观察LL 的 (2,1) 元素正是消元乘子 4。

2.3 为何使用 L = E^{-1} 而非 E?

  • 消元过程:EA=UE A = U,其中 E=E32E31E21E = E_{32}E_{31}E_{21}(对 3×3)。
  • 但我们希望写成 A=LUA = L U,因此: A=E1U=(E211E311E321)U A = E^{-1} U = (E_{21}^{-1} E_{31}^{-1} E_{32}^{-1}) U 注意:逆的顺序反转
  • 关键优势L=E211E311E321L = E_{21}^{-1} E_{31}^{-1} E_{32}^{-1}下三角矩阵,且其非对角元素直接等于原始乘子,无交叉项。

例子对比(3×3)

  • E21E_{21}2-2E32E_{32}5-5
  • 若直接计算 E=E32E21E = E_{32}E_{21},则 EE 的 (3,1) 位置会出现 (5)(2)=10(-5)(-2) = 10,这是“级联效应”。
  • L=E211E321=[100210051]L = E_{21}^{-1}E_{32}^{-1} = \begin{bmatrix} 1 & 0 & 0 \\ 2 & 1 & 0 \\ 0 & 5 & 1 \end{bmatrix}乘子 2 和 5 各自独立出现在正确位置,无交叉污染

2.4 LDU 分解(可选形式)

  • 有时将主元分离出来: A=LDU A = L D U 其中:
    • LL:单位下三角(对角为1);
    • DD:对角矩阵(含主元);
    • UU:单位上三角(对角为1)。
  • 例子(接上 2×2): A=[1041]L[2003]D[11/201]U A = \underbrace{\begin{bmatrix} 1 & 0 \\ 4 & 1 \end{bmatrix}}_{L} \underbrace{\begin{bmatrix} 2 & 0 \\ 0 & 3 \end{bmatrix}}_{D} \underbrace{\begin{bmatrix} 1 & 1/2 \\ 0 & 1 \end{bmatrix}}_{U}

3. 计算复杂度分析

3.1 消元阶段(处理矩阵 A)

  • n×nn \times n 矩阵,第 kk 步消元需处理 (nk)×(nk+1)(n - k) \times (n - k + 1) 子矩阵。
  • 每步操作数 ≈ (nk)2(n - k)^2(因需更新下方所有行)。
  • 总操作数: k=1n1(nk)2=j=1n1j2=(n1)n(2n1)613n3(当 n 很大时) \sum_{k=1}^{n-1} (n - k)^2 = \sum_{j=1}^{n-1} j^2 = \frac{(n-1)n(2n-1)}{6} \approx \frac{1}{3}n^3 \quad \text{(当 } n \text{ 很大时)}
  • 结论:高斯消元的主导项为 13n3\frac{1}{3}n^3,即 O(n3)O(n^3)

类比微积分j=1nj20nx2dx=13n3\sum_{j=1}^n j^2 \approx \int_0^n x^2 dx = \frac{1}{3}n^3

3.2 处理右侧向量 b

  • 消元阶段对 bb 的操作:每步更新一个元素,共约 n2/2n^2/2 次操作。
  • 回代阶段:约 n2/2n^2/2 次操作。
  • 总计:对每个 bb,成本为 O(n2)O(n^2)
  • 优势:若有多组 bb,只需一次 O(n3)O(n^3)LULU 分解,之后每组 bb 仅需 O(n2)O(n^2)

4. 行交换与置换矩阵(Permutation Matrices)

4.1 何时需要行交换?

  • 当主元位置为 0 时,需交换行使非零元素上移。

4.2 置换矩阵定义

  • 置换矩阵 PP:单位矩阵的行重排。
  • 性质
    • 每行每列恰有一个 1,其余为 0;
    • P1=PTP^{-1} = P^T
    • 所有 n×nn \times n 置换矩阵共 n!n! 个。

例子(3×3 置换矩阵,共 6 个)

  1. I=[100010001]I = \begin{bmatrix}1&0&0\\0&1&0\\0&0&1\end{bmatrix}
  2. P12=[010100001]P_{12} = \begin{bmatrix}0&1&0\\1&0&0\\0&0&1\end{bmatrix}
  3. P13=[001010100]P_{13} = \begin{bmatrix}0&0&1\\0&1&0\\1&0&0\end{bmatrix}
  4. P23=[100001010]P_{23} = \begin{bmatrix}1&0&0\\0&0&1\\0&1&0\end{bmatrix}
  5. 循环:[010001100]\begin{bmatrix}0&1&0\\0&0&1\\1&0&0\end{bmatrix}
  6. 逆循环:[001100010]\begin{bmatrix}0&0&1\\1&0&0\\0&1&0\end{bmatrix}

关键性质:置换矩阵构成一个——乘积和逆仍在集合中。

4.3 带行交换的分解

  • 当需要行交换时,消元过程变为: PA=LU PA = LU 其中 PP 是若干行交换的复合置换矩阵。

5. 可视化:LU 分解流程(Mermaid)

flowchart LR
    A[原始矩阵 A] -->|应用 E_21, E_31, E_32| U[上三角矩阵 U]
    E[E = E_32 E_31 E_21] -->|E A = U| U
    E -->|取逆,反序| L[L = E_21⁻¹ E_31⁻¹ E_32⁻¹]
    L -->|A = L U| A
flowchart LR
    A[原始矩阵 A] -->|应用 E_21, E_31, E_32| U[上三角矩阵 U]
    E[E = E_32 E_31 E_21] -->|E A = U| U
    E -->|取逆,反序| L[L = E_21⁻¹ E_31⁻¹ E_32⁻¹]
    L -->|A = L U| A
flowchart LR
    A[原始矩阵 A] -->|应用 E_21, E_31, E_32| U[上三角矩阵 U]
    E[E = E_32 E_31 E_21] -->|E A = U| U
    E -->|取逆,反序| L[L = E_21⁻¹ E_31⁻¹ E_32⁻¹]
    L -->|A = L U| A

解释
该流程图展示了高斯消元的矩阵形式。初等消元矩阵 EijE_{ij} 从左乘 AA 得到 UU;而 LL 是这些 EE 的逆按相反顺序相乘的结果,从而满足 A=LUA = LU。关键在于,LL 的结构简洁,直接存储了消元乘子。


总结

  • LU 分解是高斯消元的紧凑矩阵表达,揭示了消元过程的代数结构。
  • 反序法则在矩阵逆和转置中反复出现,是线性代数的基本对称性。
  • 计算成本n3n^3 为主导,但一旦分解完成,解多右端系统极为高效。
  • 置换矩阵处理数值稳定性问题,其群结构和正交性(PT=P1P^T = P^{-1})是重要性质。

实践建议:在编程实现时,可直接将消元乘子填入 LL 的对应位置,无需显式构造或求逆 EE 矩阵——这是 LU 分解高效实现的核心思想。

第5课:转置、置换与向量空间 — 高质量学习笔记


核心摘要 (Key Takeaways)

  • 置换矩阵 PP 用于执行行交换,在高斯消元中处理主元为零的情况,使得一般矩阵分解变为 PA=LUPA = LU
  • 转置操作 将矩阵 AA 的行列互换,记作 ATA^T;若 AT=AA^T = A,则 AA对称矩阵
  • 对称矩阵的重要构造:对任意矩阵 RR,乘积 RTRR^T R 总是对称的。
  • 向量空间 是对向量加法和标量乘法封闭的集合,必须包含零向量。
  • 子空间 是向量空间的子集,本身也满足向量空间的全部性质;例如 R2\mathbb{R}^2 的子空间只有:零向量、过原点的直线、整个 R2\mathbb{R}^2
  • 列空间(Column Space)是由矩阵各列的所有线性组合构成的子空间,是理解 Ax=bAx = b 解的存在性的关键。

1. 置换矩阵(Permutation Matrices)

1.1 定义与作用

  • 置换矩阵 PP 是通过对单位矩阵的行进行重排得到的矩阵。
  • 用于执行行交换(row exchanges),在高斯消元中当主元(pivot)为零时,通过行交换将非零元素移到主元位置。
  • 例子
    • 单位矩阵 II 是“不做任何操作”的置换矩阵。
    • 交换第1行和第2行的 3×33 \times 3 置换矩阵为: P=[010100001] P = \begin{bmatrix} 0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{bmatrix}

1.2 数量与性质

  • n×nn \times n 置换矩阵共有 n!n! 个(即 nn 行的所有可能重排数)。
    • 例如:4×44 \times 44!=244! = 24 个;5×55 \times 55!=1205! = 120 个。
  • 关键性质:置换矩阵是正交矩阵,满足: PTP=IP1=PT P^T P = I \quad \Rightarrow \quad P^{-1} = P^T
    • 例子:将 PP 与其转置相乘,各行/列的“1”会精准对齐,得到单位矩阵。

1.3 在 LU 分解中的应用

  • 标准 LU 分解假设无需行交换,即 A=LUA = LU
  • 当需要行交换时,分解变为: PA=LU PA = LU
    • 其中 PP 是将 AA 的行调整为“良好顺序”(使消元过程中主元非零)的置换矩阵。
  • 数值计算现实:如 MATLAB 不仅检查主元是否为零,还检查其是否足够大(避免数值不稳定),因此即使代数上不需要,也可能执行行交换。

2. 转置(Transpose)与对称矩阵(Symmetric Matrices)

2.1 转置的定义

  • 对任意矩阵 AA,其转置 ATA^T 满足: (AT)ij=Aji (A^T)_{ij} = A_{ji}
    • 行列索引互换
  • 例子A=[124331]AT=[132341] A = \begin{bmatrix} 1 & 2 & 4 \\ 3 & 3 & 1 \end{bmatrix} \quad \Rightarrow \quad A^T = \begin{bmatrix} 1 & 3 \\ 2 & 3 \\ 4 & 1 \end{bmatrix}
    • 原为 3×23 \times 2,转置后为 2×32 \times 3

2.2 转置的运算规则

  • 乘积的转置:顺序反转 (AB)T=BTAT (AB)^T = B^T A^T
    • 推导示例(RTR)T=RT(RT)T=RTR(R^T R)^T = R^T (R^T)^T = R^T R,说明 RTRR^T R 对称。

2.3 对称矩阵

  • 定义:满足 AT=AA^T = A 的矩阵。
  • 例子A=[179725953](关于主对角线对称) A = \begin{bmatrix} 1 & 7 & 9 \\ 7 & 2 & 5 \\ 9 & 5 & 3 \end{bmatrix} \quad \text{(关于主对角线对称)}
  • 重要构造:对任意矩阵 RR(不必为方阵),RTRR^T R 总是对称矩阵
    • 数值验证例子R=[124],RT=[124]RTR=[1242484816] R = \begin{bmatrix} 1 \\ 2 \\ 4 \end{bmatrix},\quad R^T = \begin{bmatrix} 1 & 2 & 4 \end{bmatrix} \quad \Rightarrow \quad R^T R = \begin{bmatrix} 1 & 2 & 4 \\ 2 & 4 & 8 \\ 4 & 8 & 16 \end{bmatrix}
      • 注意:(1)(2)=2(1)(2) = 2(2)(1)=2(2)(1) = 2 对称;(1)(4)=4(1)(4) = 4(4)(1)=4(4)(1) = 4 对称,等等。
    • 代数证明(RTR)T=RT(RT)T=RTR (R^T R)^T = R^T (R^T)^T = R^T R 因此 RTRR^T R 对称。

3. 向量空间(Vector Spaces)

3.1 定义与基本要求

  • 向量空间 是一个集合,其中的元素(向量)满足:
    1. 对加法封闭:若 u,vVu, v \in V,则 u+vVu + v \in V
    2. 对标量乘法封闭:若 vVv \in VcRc \in \mathbb{R},则 cvVc v \in V
    3. 必须包含零向量(因为 0v=00 \cdot v = 0)。
  • 这两个操作必须满足八条公理(如结合律、分配律等),但在 Rn\mathbb{R}^n 中自然成立。

3.2 标准例子:\mathbb{R}^n

  • Rn\mathbb{R}^n:所有含 nn 个实数分量的列向量构成的空间。
    • 例子
      • R2\mathbb{R}^2:所有形如 [xy]\begin{bmatrix} x \\ y \end{bmatrix} 的向量,对应平面
      • R3\mathbb{R}^3:所有三维向量,如 [320]R3\begin{bmatrix} 3 \\ 2 \\ 0 \end{bmatrix} \in \mathbb{R}^3(注意:即使某分量为0,仍属 R3\mathbb{R}^3)。

3.3 非向量空间的反例

  • 第一象限(含边界):所有满足 x0,y0x \geq 0, y \geq 0 的向量。
    • 问题:对标量乘法不封闭
      • 例子[32]\begin{bmatrix} 3 \\ 2 \end{bmatrix} \in 第一象限,但 5[32]=[1510]-5 \cdot \begin{bmatrix} 3 \\ 2 \end{bmatrix} = \begin{bmatrix} -15 \\ -10 \end{bmatrix} \notin 第一象限。
    • 关键词:不封闭(not closed)。

4. 子空间(Subspaces)

4.1 定义

  • 子空间 是向量空间 VV 的子集 SS,且 SS 本身也是一个向量空间(即对加法和标量乘法封闭,并包含零向量)。

4.2 \mathbb{R}^2 的所有子空间

  1. 零空间:仅含零向量 {[00]}\left\{ \begin{bmatrix} 0 \\ 0 \end{bmatrix} \right\}
  2. 过原点的直线:所有形如 c[ab]c \cdot \begin{bmatrix} a \\ b \end{bmatrix}cRc \in \mathbb{R})的向量。
    • 关键:必须过原点!否则乘以0会离开该集合。
    • 反例:不过原点的直线(如 y=x+1y = x + 1)不是子空间。
  3. 整个 R2\mathbb{R}^2

注意:过原点的直线虽“像” R1\mathbb{R}^1,但其向量有两个分量,故不等于 R1\mathbb{R}^1

4.3 \mathbb{R}^3 的子空间

  • 零向量
  • 过原点的直线
  • 过原点的平面
  • 整个 R3\mathbb{R}^3

5. 由矩阵生成的子空间:列空间(Column Space)

5.1 定义

  • 给定矩阵 AA,其列空间 C(A)C(A)AA 的各列向量的所有线性组合构成的集合: C(A)={c1a1+c2a2++ckakciR} C(A) = \left\{ c_1 \mathbf{a}_1 + c_2 \mathbf{a}_2 + \cdots + c_k \mathbf{a}_k \mid c_i \in \mathbb{R} \right\}
    • 其中 ai\mathbf{a}_iAA 的第 ii 列。
  • 列空间一定是子空间(因对线性组合封闭)。

5.2 几何解释(以 3 \times 2 矩阵为例)

  • A=[132341] A = \begin{bmatrix} 1 & 3 \\ 2 & 3 \\ 4 & 1 \end{bmatrix}
    • 列1:[124]\begin{bmatrix} 1 \\ 2 \\ 4 \end{bmatrix},列2:[331]\begin{bmatrix} 3 \\ 3 \\ 1 \end{bmatrix}
  • 若两列线性无关(不在同一直线上),则 C(A)C(A)R3\mathbb{R}^3 中一个过原点的平面
  • 若两列共线,则 C(A)C(A) 是一条过原点的直线
  • 若所有列为零,则 C(A)={0}C(A) = \{ \mathbf{0} \}

5.3 一般情况

  • m×nm \times n 矩阵,列空间是 Rm\mathbb{R}^m 的子空间。
  • 关键点:列空间的维度取决于列向量的线性无关性,而非列数。

6. 可视化图表(Mermaid)

虽然字幕未明确描述流程或交互,但可基于子空间层级结构构建概念图:

flowchart TD
    A[向量空间 V] --> B[子空间 S ⊆ V]
    B --> C1[零子空间 {0}]
    B --> C2[真子空间: 直线/平面等]
    B --> C3[V 本身]
    C2 --> D1[必须包含 0 向量]
    C2 --> D2[对加法和标量乘法封闭]
flowchart TD
    A[向量空间 V] --> B[子空间 S ⊆ V]
    B --> C1[零子空间 {0}]
    B --> C2[真子空间: 直线/平面等]
    B --> C3[V 本身]
    C2 --> D1[必须包含 0 向量]
    C2 --> D2[对加法和标量乘法封闭]
flowchart TD
    A[向量空间 V] --> B[子空间 S ⊆ V]
    B --> C1[零子空间 {0}]
    B --> C2[真子空间: 直线/平面等]
    B --> C3[V 本身]
    C2 --> D1[必须包含 0 向量]
    C2 --> D2[对加法和标量乘法封闭]

解释:该流程图展示了向量空间与其子空间的包含关系。任何子空间必须满足两个核心条件:包含零向量,且对向量加法和标量乘法封闭。子空间可以是平凡的(仅零向量或全空间),也可以是中间维度的结构(如直线、平面)。


总结

本课从置换与转置的矩阵操作,过渡到向量空间这一线性代数的核心抽象概念。关键在于理解:

  • 结构稳定性:子空间必须在运算下“自洽”。
  • 构造性思维:如何从具体对象(如矩阵的列)生成抽象空间(列空间)。
  • 几何直觉:在 R2\mathbb{R}^2R3\mathbb{R}^3 中可视化子空间,为高维推广打下基础。

这些概念是后续理解 Ax=bAx = b 解的存在性、秩、零空间等主题的基石。

第6课:列空间与零空间 — 高质量学习笔记


核心摘要 (Key Takeaways)

  • 向量空间必须对加法标量乘法封闭,等价于对所有线性组合封闭。
  • 子空间是向量空间的子集,且自身也构成向量空间;必须包含零向量
  • 列空间 C(A)C(A) 是矩阵 AA 所有列向量的线性组合构成的子空间;Ax=bAx = b 有解当且仅当 bC(A)b \in C(A)
  • 零空间 N(A)N(A) 是所有满足 Ax=0Ax = 0 的向量 xx 构成的子空间;它位于 Rn\mathbb{R}^nnn 为未知数个数)。
  • 两个子空间的并集一般不是子空间,但它们的交集一定是子空间

1. 向量空间与子空间

1.1 向量空间的定义

一个向量空间是一组向量的集合,满足以下两个封闭性条件:

  • 加法封闭:任意两个向量相加仍在该集合中。
  • 标量乘法封闭:任意向量乘以任意标量(实数)仍在该集合中。

✅ 等价表述:所有线性组合 c1v+c2wc_1 \mathbf{v} + c_2 \mathbf{w} 都在该空间中。

1.2 子空间(Subspace)

  • 子空间是原向量空间的一个子集,且自身也构成向量空间
  • 关键性质:任何子空间必须包含零向量 0\mathbf{0}

例子(在 \mathbb{R}^3 中)

  • 整个空间 R3\mathbb{R}^3 是一个向量空间。
  • 过原点的平面:例如 P={(x,y,z)ax+by+cz=0}P = \{ (x,y,z) \mid ax + by + cz = 0 \},是一个子空间。
    • 验证:平面上任意两向量相加仍在平面;标量倍仍在平面。
  • 过原点的直线:例如 L={tvtR}L = \{ t \cdot \mathbf{v} \mid t \in \mathbb{R} \},是一个子空间。

反例:不过原点的平面或直线不是子空间(不包含 0\mathbf{0})。


2. 子空间的运算:并集 vs 交集

2.1 并集(Union)通常不是子空间

  • PP 为过原点的平面,LL 为过原点但不在该平面内的直线。
  • 考察 PLP \cup L:包含所有在 PPLL 中的向量。
  • 反例:取 vP\mathbf{v} \in PwL\mathbf{w} \in L,则 v+w\mathbf{v} + \mathbf{w} 通常既不在 PP 也不在 LL,故不在 PLP \cup L 中。
  • 结论PLP \cup L 不是子空间

2.2 交集(Intersection)一定是子空间

  • 定义:ST={vvS 且 vT}S \cap T = \{ \mathbf{v} \mid \mathbf{v} \in S \text{ 且 } \mathbf{v} \in T \}
  • 证明
    • v,wST\mathbf{v}, \mathbf{w} \in S \cap T,则 v,wS\mathbf{v}, \mathbf{w} \in ST\in T
    • S,TS, T 均为子空间,故 v+wS\mathbf{v} + \mathbf{w} \in ST\in Tv+wST\mathbf{v} + \mathbf{w} \in S \cap T
    • 同理,cvSTc\mathbf{v} \in S \cap T
  • 例子:上述 PL={0}P \cap L = \{ \mathbf{0} \}(因直线不在平面内),而 {0}\{ \mathbf{0} \} 是子空间。

3. 列空间(Column Space)

3.1 定义

  • m×nm \times n 矩阵 AA,其列空间 C(A)C(A)AA 的所有列向量的线性组合构成的集合: C(A)={Ax=x1a1+x2a2++xnanxRn} C(A) = \left\{ A\mathbf{x} = x_1 \mathbf{a}_1 + x_2 \mathbf{a}_2 + \cdots + x_n \mathbf{a}_n \mid \mathbf{x} \in \mathbb{R}^n \right\}
  • C(A)C(A)Rm\mathbb{R}^m 的子空间(因列向量有 mm 个分量)。

3.2 示例分析

考虑矩阵:

A=[112213314415] A = \begin{bmatrix} 1 & 1 & 2 \\ 2 & 1 & 3 \\ 3 & 1 & 4 \\ 4 & 1 & 5 \end{bmatrix}
  • 列向量为 a1=[1234],a2=[1111],a3=[2345]\mathbf{a}_1 = \begin{bmatrix}1\\2\\3\\4\end{bmatrix}, \mathbf{a}_2 = \begin{bmatrix}1\\1\\1\\1\end{bmatrix}, \mathbf{a}_3 = \begin{bmatrix}2\\3\\4\\5\end{bmatrix}
  • 观察发现:a3=a1+a2\mathbf{a}_3 = \mathbf{a}_1 + \mathbf{a}_2
  • 因此,第三列是冗余的,不增加新的方向。
  • 结论C(A)C(A)a1,a2\mathbf{a}_1, \mathbf{a}_2 张成,是 R4\mathbb{R}^4 中的二维子空间

3.3 与线性方程组的联系

  • 方程 Ax=bA\mathbf{x} = \mathbf{b} 有解bC(A)\mathbf{b} \in C(A)
  • 例子
    • b=[1234]=a1\mathbf{b} = \begin{bmatrix}1\\2\\3\\4\end{bmatrix} = \mathbf{a}_1 ⇒ 解为 x=[100]\mathbf{x} = \begin{bmatrix}1\\0\\0\end{bmatrix}
    • b=[1111]=a2\mathbf{b} = \begin{bmatrix}1\\1\\1\\1\end{bmatrix} = \mathbf{a}_2 ⇒ 解为 x=[010]\mathbf{x} = \begin{bmatrix}0\\1\\0\end{bmatrix}
    • b=[0000]\mathbf{b} = \begin{bmatrix}0\\0\\0\\0\end{bmatrix} ⇒ 总有解 x=0\mathbf{x} = \mathbf{0}

注意:由于 AA 只有 3 列,其列空间无法充满 R4\mathbb{R}^4(最多三维,实际二维)。


4. 零空间(Null Space)

4.1 定义

  • 零空间 N(A)N(A) 是所有满足 Ax=0A\mathbf{x} = \mathbf{0} 的解 x\mathbf{x} 构成的集合: N(A)={xRnAx=0} N(A) = \left\{ \mathbf{x} \in \mathbb{R}^n \mid A\mathbf{x} = \mathbf{0} \right\}
  • N(A)N(A)Rn\mathbb{R}^n 的子空间。

4.2 示例分析(同上矩阵 A)

求解 Ax=0A\mathbf{x} = \mathbf{0}

  • 显然 x=0\mathbf{x} = \mathbf{0} 是解。
  • 观察列关系:a1+a2a3=0\mathbf{a}_1 + \mathbf{a}_2 - \mathbf{a}_3 = \mathbf{0}
  • x=[111]\mathbf{x} = \begin{bmatrix}1\\1\\-1\end{bmatrix} 是非零解。
  • 所有解为:x=c[111], cR\mathbf{x} = c \begin{bmatrix}1\\1\\-1\end{bmatrix},\ c \in \mathbb{R}

结论N(A)N(A)R3\mathbb{R}^3过原点的一条直线(一维子空间)。

4.3 零空间是子空间的证明

  • 加法封闭:若 Av=0A\mathbf{v} = \mathbf{0}Aw=0A\mathbf{w} = \mathbf{0},则
    A(v+w)=Av+Aw=0+0=0 A(\mathbf{v} + \mathbf{w}) = A\mathbf{v} + A\mathbf{w} = \mathbf{0} + \mathbf{0} = \mathbf{0}
  • 标量乘法封闭:若 Av=0A\mathbf{v} = \mathbf{0},则
    A(cv)=c(Av)=c0=0 A(c\mathbf{v}) = c(A\mathbf{v}) = c\mathbf{0} = \mathbf{0}
  • 利用了矩阵乘法的线性性(分配律与齐次性)。

5. 非齐次方程的解集不是子空间

  • 考虑 Ax=bA\mathbf{x} = \mathbf{b},其中 b0\mathbf{b} \neq \mathbf{0}(如 b=[1234]\mathbf{b} = \begin{bmatrix}1\\2\\3\\4\end{bmatrix})。
  • 已知一个特解:xp=[100]\mathbf{x}_p = \begin{bmatrix}1\\0\\0\end{bmatrix}
  • 另一个解:x=[011]\mathbf{x} = \begin{bmatrix}0\\-1\\1\end{bmatrix}(因 a2+a3=a1=b-\mathbf{a}_2 + \mathbf{a}_3 = \mathbf{a}_1 = \mathbf{b}
  • 但解集不是子空间,因为:
    • 零向量不是解A0=0bA\mathbf{0} = \mathbf{0} \neq \mathbf{b}
    • 解集是仿射空间(affine space):形如 xp+N(A)\mathbf{x}_p + N(A),即平移后的零空间不过原点

📌 关键区别

  • 齐次方程 Ax=0A\mathbf{x} = \mathbf{0} 的解集 = 子空间(零空间)
  • 非齐次方程 Ax=bA\mathbf{x} = \mathbf{b} 的解集 = 仿射子空间(不是向量空间)

6. 描述子空间的两种方式

方式 描述方法 例子
生成式(Span) 给出一组生成向量,取其所有线性组合 列空间 C(A)=span{a1,a2,}C(A) = \text{span}\{\mathbf{a}_1, \mathbf{a}_2, \dots\}
约束式(Equations) 给出线性方程组,解集即为子空间 零空间 N(A)={xAx=0}N(A) = \{ \mathbf{x} \mid A\mathbf{x} = \mathbf{0} \}

✅ 两种方式等价,是构造子空间的核心方法


7. 可视化总结(Mermaid 流程图)

flowchart LR
    A[矩阵 A] --> B[列空间 C A ]
    A --> C[零空间 N A ]
    B --> D[子空间 of R^m]
    C --> E[子空间 of R^n]
    D --> F[Ax = b 有解 ⇔ b ∈ C A ]
    E --> G[Ax = 0 的所有解]
flowchart LR
    A[矩阵 A] --> B[列空间 C A ]
    A --> C[零空间 N A ]
    B --> D[子空间 of R^m]
    C --> E[子空间 of R^n]
    D --> F[Ax = b 有解 ⇔ b ∈ C A ]
    E --> G[Ax = 0 的所有解]
flowchart LR
    A[矩阵 A] --> B[列空间 C A ]
    A --> C[零空间 N A ]
    B --> D[子空间 of R^m]
    C --> E[子空间 of R^n]
    D --> F[Ax = b 有解 ⇔ b ∈ C A ]
    E --> G[Ax = 0 的所有解]

解释
该流程图展示了矩阵 AAm×nm \times n)如何自然导出两个关键子空间:

  • 列空间 C(A)RmC(A) \subseteq \mathbb{R}^m,决定方程 Ax=bAx = b 的可解性;
  • 零空间 N(A)RnN(A) \subseteq \mathbb{R}^n,刻画齐次方程的解结构。

:本课为理解线性代数核心结构(四大子空间之二)奠定基础,后续将通过高斯消元法系统计算列空间与零空间。

第7课:Ax = 0 —— 主变量、自由变量与特解

高质量学习笔记


🔑 核心摘要 (Key Takeaways)

  • 主变量(pivot variables)自由变量(free variables) 的划分由矩阵消元后的主元列决定;自由变量可任意赋值,主变量则通过回代求解。
  • 特解(special solutions) 是通过依次将每个自由变量设为1、其余设为0,再求解主变量得到的;特解个数 = 自由变量个数 = nrn - rnn 为列数,rr 为秩)。
  • 零空间(null space) 是所有特解的线性组合构成的子空间,即 Null(A)=span{特解1,,特解nr}\text{Null}(A) = \text{span}\{\text{特解}_1, \dots, \text{特解}_{n-r}\}
  • 矩阵的秩 rr 等于主元个数,也等于独立行/列的个数;它决定了方程组中真正有效的方程数量。
  • 简化行阶梯形(Reduced Row Echelon Form, RREF) 矩阵 RR 具有标准结构:主元为1,主元上下均为0,且主元列构成单位子矩阵;特解可直接从 RR 的自由列读出(符号取反)。

📚 全面内容解析

1. 问题背景:求解 A\mathbf{x} = \mathbf{0}

  • 目标:描述矩阵 AA 的零空间(null space),即所有满足 Ax=0A\mathbf{x} = \mathbf{0} 的向量 x\mathbf{x}
  • 核心思想:将定义(零空间)转化为算法(高斯消元 + 回代)。
  • 关键性质:初等行变换不改变零空间(因为对等式两边做相同合法操作,解集不变),但会改变列空间。

2. 示例矩阵与消元过程

考虑矩阵:

A=[246836810] A = \begin{bmatrix} 2 & 4 & 6 & 8 \\ 3 & 6 & 8 & 10 \end{bmatrix}
  • 观察
    • 第2列 = 2 × 第1列 → 列线性相关。
    • 第3行(若存在)= 第1行 + 第2行 → 行线性相关(本例为2行,但原视频中为3行,此处以视频为准:实际为3行4列)。

:视频中实际矩阵为 3 行 4 列:

>A=[>2468>36810>5101418>]> > A = \begin{bmatrix} > 2 & 4 & 6 & 8 \\ > 3 & 6 & 8 & 10 \\ > 5 & 10 & 14 & 18 > \end{bmatrix} >

且第3行 = 第1行 + 第2行。

消元得上阶梯形 U

执行高斯消元(允许列跳过无主元的情况):

U=[246800240000] U = \begin{bmatrix} 2 & 4 & 6 & 8 \\ 0 & 0 & 2 & 4 \\ 0 & 0 & 0 & 0 \end{bmatrix}
  • 主元位置:第1列、第3列 → 主元列(pivot columns)
  • 非主元列:第2列、第4列 → 自由列(free columns)
  • 秩(rank)r=2r = 2(主元个数)。

关键结论:秩 rr = 独立方程数 = 独立列数 = 独立行数。


3. 主变量 vs. 自由变量

  • 变量总数n=4n = 4(列数)。
  • 主变量:对应主元列的变量 → x1,x3x_1, x_3
  • 自由变量:对应非主元列的变量 → x2,x4x_2, x_4
  • 自由变量个数nr=42=2n - r = 4 - 2 = 2

💡 为什么叫“自由”?因为可任意赋值,再通过方程解出主变量。


4. 构造特解(Special Solutions)

步骤:

  1. 对每个自由变量,依次设其为1,其余自由变量为0。
  2. 通过回代求解主变量。
  3. 得到一个特解。
特解 1:设 x_2 = 1, x_4 = 0
  • Ux=0U\mathbf{x} = \mathbf{0} 得方程: {2x1+4x2+6x3+8x4=02x3+4x4=0{x1+2x2+3x3+4x4=0x3+2x4=0 \begin{cases} 2x_1 + 4x_2 + 6x_3 + 8x_4 = 0 \\ 2x_3 + 4x_4 = 0 \end{cases} \Rightarrow \begin{cases} x_1 + 2x_2 + 3x_3 + 4x_4 = 0 \\ x_3 + 2x_4 = 0 \end{cases}
  • 代入 x2=1,x4=0x_2=1, x_4=0
    • x3=0x_3 = 0
    • x1=2x_1 = -2
  • 特解 1x(1)=[2100]\mathbf{x}^{(1)} = \begin{bmatrix} -2 \\ 1 \\ 0 \\ 0 \end{bmatrix}

例子解释:该解表示 2col1+1col2=0-2 \cdot \text{col}_1 + 1 \cdot \text{col}_2 = \mathbf{0},验证了第2列是第1列的2倍。

特解 2:设 x_2 = 0, x_4 = 1
  • 代入得:
    • x3=2x_3 = -2
    • x1=2x_1 = 2
  • 特解 2x(2)=[2021]\mathbf{x}^{(2)} = \begin{bmatrix} 2 \\ 0 \\ -2 \\ 1 \end{bmatrix}

例子解释2col12col3+1col4=02 \cdot \text{col}_1 - 2 \cdot \text{col}_3 + 1 \cdot \text{col}_4 = \mathbf{0},验证列间线性关系。


5. 零空间的完整描述

  • 零空间 = 所有特解的线性组合Null(A)={c1[2100]+c2[2021]|c1,c2R} \text{Null}(A) = \left\{ c_1 \begin{bmatrix} -2 \\ 1 \\ 0 \\ 0 \end{bmatrix} + c_2 \begin{bmatrix} 2 \\ 0 \\ -2 \\ 1 \end{bmatrix} \,\middle|\, c_1, c_2 \in \mathbb{R} \right\}
  • 这是一个二维子空间(平面)嵌入在 R4\mathbb{R}^4 中。

通用公式:若 AAm×nm \times n 矩阵,秩为 rr,则零空间维数 = nrn - r


6. 简化行阶梯形(RREF)与矩阵 R

UU 进一步化简:

  1. 主元上方消为0。
  2. 主元归一化为1。

得:

R=[120200120000] R = \begin{bmatrix} 1 & 2 & 0 & -2 \\ 0 & 0 & 1 & 2 \\ 0 & 0 & 0 & 0 \end{bmatrix}
  • 结构分析
    • 主元列(1, 3)构成 2×22 \times 2 单位矩阵 II
    • 自由列(2, 4)构成矩阵 F=[2202]F = \begin{bmatrix} 2 & -2 \\ 0 & 2 \end{bmatrix}
    • 整体结构:R=[IF00]R = \begin{bmatrix} I & F \\ \mathbf{0} & \mathbf{0} \end{bmatrix}

从 R 直接读出特解

  • 方程 Rx=0R\mathbf{x} = \mathbf{0} 即:

    [IF][xpivotxfree]=0xpivot+Fxfree=0xpivot=Fxfree \begin{bmatrix} I & F \end{bmatrix} \begin{bmatrix} \mathbf{x}_{\text{pivot}} \\ \mathbf{x}_{\text{free}} \end{bmatrix} = \mathbf{0} \Rightarrow \mathbf{x}_{\text{pivot}} + F \mathbf{x}_{\text{free}} = \mathbf{0} \Rightarrow \mathbf{x}_{\text{pivot}} = -F \mathbf{x}_{\text{free}}
  • xfree=[10]\mathbf{x}_{\text{free}} = \begin{bmatrix} 1 \\ 0 \end{bmatrix}xpivot=[20]\mathbf{x}_{\text{pivot}} = -\begin{bmatrix} 2 \\ 0 \end{bmatrix} → 特解 = [2100]\begin{bmatrix} -2 \\ 1 \\ 0 \\ 0 \end{bmatrix}

  • xfree=[01]\mathbf{x}_{\text{free}} = \begin{bmatrix} 0 \\ 1 \end{bmatrix}xpivot=[22]=[22]\mathbf{x}_{\text{pivot}} = -\begin{bmatrix} -2 \\ 2 \end{bmatrix} = \begin{bmatrix} 2 \\ -2 \end{bmatrix} → 特解 = [2021]\begin{bmatrix} 2 \\ 0 \\ -2 \\ 1 \end{bmatrix}

结论:特解 = [FI]\begin{bmatrix} -F \\ I \end{bmatrix},其中 II(nr)×(nr)(n-r) \times (n-r) 单位阵。


7. 第二个例子:A^\top 的零空间

AA^\top(原 AA 为 3×4,则 AA^\top 为 4×3):

A^\top = \begin{bmatrix} 2 & 3 \\ 4 & 6 \\ 6 & 8 \\ 8 & 10 \end{bmatrix} \quad \text{(实际应为 4×3,但视频中为转置原3×4矩阵)}

视频中实际为

>A=[>2468>36810>]>A=[>23>46>68>810>]> > A = \begin{bmatrix} > 2 & 4 & 6 & 8 \\ > 3 & 6 & 8 & 10 > \end{bmatrix} > \Rightarrow A^\top = \begin{bmatrix} > 2 & 3 \\ > 4 & 6 \\ > 6 & 8 \\ > 8 & 10 > \end{bmatrix} >

但后续计算显示为 3列,故应为原 AA 为 2×3?此处以视频逻辑为准:新矩阵为 3 列,秩为 2

消元得:

U=[246022000000]R=[101011000000] U = \begin{bmatrix} 2 & 4 & 6 \\ 0 & 2 & 2 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{bmatrix} \Rightarrow R = \begin{bmatrix} 1 & 0 & 1 \\ 0 & 1 & 1 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{bmatrix}
  • r=2r = 2,列数 n=3n = 3 → 自由变量个数 = 32=13 - 2 = 1
  • 自由变量:x3x_3
  • x3=1x_3 = 1x2=1x_2 = -1, x1=1x_1 = -1
  • 特解x=[111]\mathbf{x} = \begin{bmatrix} -1 \\ -1 \\ 1 \end{bmatrix}
  • 零空间Null(A)={c[111]|cR}\text{Null}(A^\top) = \left\{ c \begin{bmatrix} -1 \\ -1 \\ 1 \end{bmatrix} \,\middle|\, c \in \mathbb{R} \right\}(一条直线)

例子验证1col11col2+1col3=0-1 \cdot \text{col}_1 -1 \cdot \text{col}_2 + 1 \cdot \text{col}_3 = \mathbf{0},因第3列 = 第1列 + 第2列。


8. 零空间矩阵(Null Space Matrix)

  • 定义:矩阵 NN,其列向量为所有特解。
  • 对第一个例子: N=[22100201]=[FI] N = \begin{bmatrix} -2 & 2 \\ 1 & 0 \\ 0 & -2 \\ 0 & 1 \end{bmatrix} = \begin{bmatrix} -F \\ I \end{bmatrix}
  • 满足:AN=0A N = \mathbf{0}RN=0R N = \mathbf{0}

💡 MATLAB 命令N = null(A) 返回零空间的一组标准正交基(但教学版可返回上述 NN)。


📊 可视化:零空间构造流程(Mermaid)

flowchart LR
    A[输入矩阵 A] --> B[高斯消元 → U]
    B --> C{识别主元列与自由列}
    C --> D[主变量: x_pivot\n自由变量: x_free]
    D --> E[对每个自由变量:\n设其为1,其余为0]
    E --> F[回代求主变量]
    F --> G[得到一个特解]
    G --> H{是否处理完所有自由变量?}
    H -- 否 --> E
    H -- 是 --> I[零空间 = 所有特解的线性组合]
flowchart LR
    A[输入矩阵 A] --> B[高斯消元 → U]
    B --> C{识别主元列与自由列}
    C --> D[主变量: x_pivot\n自由变量: x_free]
    D --> E[对每个自由变量:\n设其为1,其余为0]
    E --> F[回代求主变量]
    F --> G[得到一个特解]
    G --> H{是否处理完所有自由变量?}
    H -- 否 --> E
    H -- 是 --> I[零空间 = 所有特解的线性组合]
flowchart LR
    A[输入矩阵 A] --> B[高斯消元 → U]
    B --> C{识别主元列与自由列}
    C --> D[主变量: x_pivot\n自由变量: x_free]
    D --> E[对每个自由变量:\n设其为1,其余为0]
    E --> F[回代求主变量]
    F --> G[得到一个特解]
    G --> H{是否处理完所有自由变量?}
    H -- 否 --> E
    H -- 是 --> I[零空间 = 所有特解的线性组合]

解释:该流程图展示了从矩阵 AA 出发,通过消元、变量分类、赋值回代,最终构造出零空间的完整算法步骤。每一步都对应视频中强调的核心操作。


🧠 关键公式总结

  • 秩-零化度定理(Rank-Nullity Theorem)

    rank(A)+dim(Null(A))=n \text{rank}(A) + \dim(\text{Null}(A)) = n

    其中 nnAA 的列数。

  • 特解构造公式(在 RREF 下):

    x=[xpivotxfree]=[FI]c,cRnr \mathbf{x} = \begin{bmatrix} \mathbf{x}_{\text{pivot}} \\ \mathbf{x}_{\text{free}} \end{bmatrix} = \begin{bmatrix} -F \\ I \end{bmatrix} \mathbf{c}, \quad \mathbf{c} \in \mathbb{R}^{n-r}
  • 零空间表示

    Null(A)={Nc|cRnr},其中 N=[FI] \text{Null}(A) = \left\{ N \mathbf{c} \,\middle|\, \mathbf{c} \in \mathbb{R}^{n-r} \right\}, \quad \text{其中 } N = \begin{bmatrix} -F \\ I \end{bmatrix}

复习提示:掌握“消元 → 分主/自由变量 → 构造特解 → 线性组合得零空间”这一主线,即可应对所有 Ax=0A\mathbf{x} = \mathbf{0} 类问题。RREF 是最清晰的表达形式,特解可直接读出。

第8课:Ax = b 的可解性与解的结构 — 高质量学习笔记


核心摘要 (Key Takeaways)

  • 可解性条件:线性方程组 Ax=bA\mathbf{x} = \mathbf{b} 有解 当且仅当 b\mathbf{b} 属于 AA列空间;等价地,若某行组合使 AA 的行变为零行,则相同组合作用于 b\mathbf{b} 必须得到 0。
  • 解的结构:若解存在,则通解 = 一个特解 + 零空间中的任意向量,即 x=xp+xn\mathbf{x} = \mathbf{x}_p + \mathbf{x}_n
  • 自由变量与主元变量:通过高斯消元识别主元列(pivot columns)和自由列(free columns);设自由变量为 0 可得一个特解。
  • 秩决定解的个数:设 AAm×nm \times n 矩阵,秩为 rr
    • r=nr = n(满列秩):零空间只有零向量,至多一个解(0 或 1 个)。
    • r=mr = m(满行秩):对任意 b\mathbf{b} 都有解,无穷多解(因 n>mn > m 时存在自由变量)。
    • r=m=nr = m = n:矩阵可逆,唯一解
    • r<mr < mr<nr < n:可能无解,也可能无穷多解。

1. 可解性条件(Solvability Conditions)

1.1 列空间视角

  • 方程 Ax=bA\mathbf{x} = \mathbf{b} 有解bCol(A)\mathbf{b} \in \text{Col}(A)
    • b\mathbf{b}AA 的列向量的线性组合。

1.2 行空间视角(通过消元揭示)

  • 若存在行的线性组合使得 AA 的某些行变为 零行,则对 b\mathbf{b} 施加相同的组合必须得到 0
  • 例子:考虑矩阵
    A=[1222246836810] A = \begin{bmatrix} 1 & 2 & 2 & 2 \\ 2 & 4 & 6 & 8 \\ 3 & 6 & 8 & 10 \end{bmatrix} 第三行 = 第一行 + 第二行 ⇒ 行组合:R3R1R2=0R_3 - R_1 - R_2 = \mathbf{0}
    ⇒ 对 b=[b1b2b3]\mathbf{b} = \begin{bmatrix} b_1 \\ b_2 \\ b_3 \end{bmatrix} 必须满足: b3b1b2=0b1+b2=b3 b_3 - b_1 - b_2 = 0 \quad \text{即} \quad b_1 + b_2 = b_3
    • 案例:若 b=[156]\mathbf{b} = \begin{bmatrix} 1 \\ 5 \\ 6 \end{bmatrix},则 1+5=61 + 5 = 6,满足条件,有解
    • b=[1517]\mathbf{b} = \begin{bmatrix} 1 \\ 5 \\ 17 \end{bmatrix},则 1+5171 + 5 \ne 17无解

关键点:消元过程在增广矩阵 [Ab][A \mid \mathbf{b}] 上进行,若出现形如 0=非零0 = \text{非零} 的矛盾行,则无解。


2. 解的结构:通解 = 特解 + 零空间

2.1 算法步骤

  1. 检查可解性:对增广矩阵 [Ab][A \mid \mathbf{b}] 做行消元,确保无矛盾方程(如 0=c00 = c \ne 0)。
  2. 求一个特解 xp\mathbf{x}_p
    • 将所有自由变量设为 0
    • 用回代法求解主元变量
  3. 求零空间 Null(A)\text{Null}(A)
    • 找出所有特殊解(每个自由变量依次设为 1,其余为 0)。
    • 零空间 = 所有特殊解的线性组合。
  4. 通解x=xp+xn\mathbf{x} = \mathbf{x}_p + \mathbf{x}_n,其中 xnNull(A)\mathbf{x}_n \in \text{Null}(A)

2.2 示例详解(基于上述 A 和 \mathbf{b} = [1,5,6]^T)

步骤 1:消元后系统

消元后得:

x1+2x2+2x3+2x4=12x3+4x4=30=0 \begin{aligned} x_1 + 2x_2 + 2x_3 + 2x_4 &= 1 \\ 2x_3 + 4x_4 &= 3 \\ 0 &= 0 \end{aligned}
  • 主元列:第 1 列(x1x_1)、第 3 列(x3x_3
  • 自由变量x2,x4x_2, x_4

步骤 2:求特解 \mathbf{x}_p

x2=0,x4=0x_2 = 0, x_4 = 0,则:

  • 2x3=3x3=322x_3 = 3 \Rightarrow x_3 = \frac{3}{2}
  • x1+232=1x1=13=2x_1 + 2 \cdot \frac{3}{2} = 1 \Rightarrow x_1 = 1 - 3 = -2

⇒ 特解:

xp=[20320] \mathbf{x}_p = \begin{bmatrix} -2 \\ 0 \\ \frac{3}{2} \\ 0 \end{bmatrix}

步骤 3:求零空间(特殊解)

Ax=0A\mathbf{x} = \mathbf{0}

  • 特殊解 1:设 x2=1,x4=0x_2 = 1, x_4 = 0

    • 2x3=0x3=02x_3 = 0 \Rightarrow x_3 = 0
    • x1+2(1)=0x1=2x_1 + 2(1) = 0 \Rightarrow x_1 = -2
    • s1=[2100]\mathbf{s}_1 = \begin{bmatrix} -2 \\ 1 \\ 0 \\ 0 \end{bmatrix}
  • 特殊解 2:设 x2=0,x4=1x_2 = 0, x_4 = 1

    • 2x3+4(1)=0x3=22x_3 + 4(1) = 0 \Rightarrow x_3 = -2
    • x1+2(2)+2(1)=0x1=2x_1 + 2(-2) + 2(1) = 0 \Rightarrow x_1 = 2
    • s2=[2021]\mathbf{s}_2 = \begin{bmatrix} 2 \\ 0 \\ -2 \\ 1 \end{bmatrix}

✅ 验证:As2=0A\mathbf{s}_2 = \mathbf{0}
第一行:12+20+2(2)+21=24+2=01\cdot2 + 2\cdot0 + 2\cdot(-2) + 2\cdot1 = 2 -4 +2 = 0

步骤 4:通解

x=xp+c1s1+c2s2=[20320]+c1[2100]+c2[2021],c1,c2R \mathbf{x} = \mathbf{x}_p + c_1 \mathbf{s}_1 + c_2 \mathbf{s}_2 = \begin{bmatrix} -2 \\ 0 \\ \frac{3}{2} \\ 0 \end{bmatrix} + c_1 \begin{bmatrix} -2 \\ 1 \\ 0 \\ 0 \end{bmatrix} + c_2 \begin{bmatrix} 2 \\ 0 \\ -2 \\ 1 \end{bmatrix}, \quad c_1, c_2 \in \mathbb{R}

3. 秩 r 与解的存在性/唯一性

AAm×nm \times n 矩阵,秩为 rr(即主元个数)。

情况 条件 零空间 对任意 b\mathbf{b} 是否总有解? 解的个数
满秩方阵 r=m=nr = m = n {0}\{\mathbf{0}\} 唯一解
满列秩 r=n<mr = n < m {0}\{\mathbf{0}\} 否(仅当 bCol(A)\mathbf{b} \in \text{Col}(A) 0 或 1 个解
满行秩 r=m<nr = m < n 维数 =nm>0= n - m > 0 无穷多解
秩亏 r<mr < mr<nr < n 维数 =nr>0= n - r > 0 否(需满足相容性条件) 0 或 无穷多解

3.1 示例分析

例 1:满列秩(r = n = 2, m = 4)

A=[12653111] A = \begin{bmatrix} 1 & 2 \\ 6 & 5 \\ 3 & 1 \\ 1 & 1 \end{bmatrix}
  • 两列线性无关 ⇒ r=2=nr = 2 = n
  • 零空间 = {0}\{\mathbf{0}\}
  • :4 个方程,2 个未知数 ⇒ 通常无解
    • 有解当且仅当 b\mathbf{b} 是两列的线性组合
    • 例子b=[4376]=col1+col2\mathbf{b} = \begin{bmatrix} 4 \\ 3 \\ 7 \\ 6 \end{bmatrix} = \text{col}_1 + \text{col}_2 ⇒ 解为 x=[1,1]T\mathbf{x} = [1, 1]^T(唯一)

例 2:满行秩(r = m = 2, n = 4)

A=[12653111] A = \begin{bmatrix} 1 & 2 & 6 & 5 \\ 3 & 1 & 1 & 1 \end{bmatrix}
  • 行满秩 ⇒ 消元后无零行 ⇒ 对任意 bR2\mathbf{b} \in \mathbb{R}^2 都有解
  • 自由变量数 = nr=2n - r = 2无穷多解

例 3:满秩方阵(r = m = n = 2)

A=[1231] A = \begin{bmatrix} 1 & 2 \\ 3 & 1 \end{bmatrix}
  • 可逆 ⇒ Ax=bA\mathbf{x} = \mathbf{b} 对任意 b\mathbf{b}唯一解
  • 零空间 = {0}\{\mathbf{0}\}
  • 行最简形 = II

4. 几何解释:解集的形状

  • 零空间:是 Rn\mathbb{R}^n 中的子空间(过原点)。
  • Ax=bA\mathbf{x} = \mathbf{b} 的解集(当有解时):
    • 仿射子空间(affine subspace)
    • = 特解 xp\mathbf{x}_p + 零空间
    • 不过原点(除非 b=0\mathbf{b} = \mathbf{0}
    • 维数 = 零空间维数 = nrn - r

📌 例子:前述 44 维问题中,解集是一个二维平面,平移至通过点 xp\mathbf{x}_p,但不包含原点。


5. 总结:秩 r 决定一切

“The rank tells you everything about the number of solutions.”

  • 存在性:取决于 rrmm 的关系(是否满行秩)
  • 唯一性:取决于 rrnn 的关系(是否满列秩)
  • 解的结构:由特解 + 零空间给出,零空间维数 = nrn - r

复习提示:做题时务必先做消元,判断可解性,再按“设自由变量为0 → 求特解 → 求零空间 → 写通解”四步走。

目录