坟墓里寂静无比,埋葬你的是你所有没说出口的话
好的,这是转换为简体中文的课程列表:
第1课 方程组的几何解释
第2课 矩阵消元
第3课 矩阵乘法和逆
第4课 A的LU分解
第5课 转置、置换、向量空间
第6课 列空间和零空间
第7课 Ax=0:主变量、特解
第8课 Ax=b:可解性及解的结构
第9课 线性相关性、基、维数
第10课 四个基本子空间
第11课 矩阵空间、秩1矩阵和小世界图
第12课 图和网络
第13课 复习一
第14课 正交向量与子空间
第15课 投影到子空间
第16课 投影矩阵和最小二乘
第17课 正交矩阵和格拉姆-施密特
第18课 行列式性质
第19课 行列式公式和代数余子式
第20课 克拉默法则、逆矩阵、体积
第21课 特征值和特征向量
第22课 对角化和A的幂
第23课 微分方程和exp(At)
第24课 马尔可夫矩阵; 傅里叶级数
第25课 复习二
第26课 对称矩阵的正定性
第27课 复矩阵,快速傅里叶变换
第28课 正定矩阵和最小值
第29课 相似矩阵和若尔当标准形
第30课 奇异值分解
第31课 线性变换及其矩阵表示
第32课 基变换;图像压缩
第33课 单元检测3复习
第34课 左、右逆,伪逆
第35课 期末复习
第1课:第1集 方程组的几何解释 — 学习笔记
核心摘要 (Key Takeaways)
线性方程组 A x = b A\mathbf{x} = \mathbf{b} A x = b 有三种核心视角:行图像 (row picture)、列图像 (column picture)和矩阵形式 。
行图像 :每个方程对应一个几何对象(2D 中是直线,3D 中是平面),解是这些对象的交点。
列图像 :将方程组视为对矩阵列向量的线性组合 ,目标是找到系数 x \mathbf{x} x 使得组合结果等于 b \mathbf{b} b 。
矩阵乘法 A x A\mathbf{x} A x 本质上是列向量的线性组合 :A x = x 1 a 1 + x 2 a 2 + ⋯ + x n a n A\mathbf{x} = x_1 \mathbf{a}_1 + x_2 \mathbf{a}_2 + \cdots + x_n \mathbf{a}_n A x = x 1 a 1 + x 2 a 2 + ⋯ + x n a n 。
并非所有方程组对任意 b \mathbf{b} b 都有解;当矩阵的列向量线性相关 (如共面)时,其线性组合无法覆盖整个空间,此时矩阵为奇异矩阵 (不可逆)。
1. 线性方程组的三种视角
1.1 矩阵形式(代数视角)
线性方程组可统一写为:
A x = b
A\mathbf{x} = \mathbf{b}
A x = b 其中:
A A A 是 m × n m \times n m × n 的系数矩阵 (rectangular array of numbers),
x \mathbf{x} x 是 n n n 维未知向量 ,
b \mathbf{b} b 是 m m m 维右端向量 。
关键理解 :矩阵乘法 A x A\mathbf{x} A x 的本质是对 A A A 的列向量进行线性组合 。
1.2 行图像(Row Picture)
思想 :逐行看待方程,每行对应一个几何对象。
2D 情况 :每个方程是一条直线 ,解是直线的交点 。
3D 情况 :每个方程是一个平面 ,解是三个平面的公共交点 。
高维 :每个方程定义一个超平面 ,解是所有超平面的交集。
例子(2×2 系统):
考虑方程组:
{ 2 x − y = 0 − x + 2 y = 3
\begin{cases}
2x - y = 0 \\
-x + 2y = 3
\end{cases}
{ 2 x − y = 0 − x + 2 y = 3
第一方程 2 x − y = 0 2x - y = 0 2 x − y = 0 :
过原点 ( 0 , 0 ) (0,0) ( 0 , 0 ) ,
另一点:( 1 , 2 ) (1,2) ( 1 , 2 ) (因 2 ( 1 ) − 2 = 0 2(1) - 2 = 0 2 ( 1 ) − 2 = 0 ),
所有点构成一条直线。
第二方程 − x + 2 y = 3 -x + 2y = 3 − x + 2 y = 3 :
当 y = 0 y=0 y = 0 ,得 x = − 3 x = -3 x = − 3 → 点 ( − 3 , 0 ) (-3, 0) ( − 3 , 0 ) ,
当 x = − 1 x = -1 x = − 1 ,得 − ( − 1 ) + 2 y = 3 ⇒ y = 1 -(-1) + 2y = 3 \Rightarrow y = 1 − ( − 1 ) + 2 y = 3 ⇒ y = 1 → 点 ( − 1 , 1 ) (-1, 1) ( − 1 , 1 ) ,
连接两点得直线。
解 :两直线交点为 ( 1 , 2 ) (1, 2) ( 1 , 2 ) ,验证:
2 ( 1 ) − 2 = 0 2(1) - 2 = 0 2 ( 1 ) − 2 = 0 ✓
− 1 + 2 ( 2 ) = 3 -1 + 2(2) = 3 − 1 + 2 ( 2 ) = 3 ✓
例子(3×3 系统):
{ 2 x − y + 0 z = 0 − x + 2 y − z = − 1 0 x − 3 y + 4 z = 4
\begin{cases}
2x - y + 0z = 0 \\
-x + 2y - z = -1 \\
0x - 3y + 4z = 4
\end{cases}
⎩ ⎨ ⎧ 2 x − y + 0 z = 0 − x + 2 y − z = − 1 0 x − 3 y + 4 z = 4
每个方程对应一个平面 。
三个平面(一般位置)交于一点 。
行图像在 3D 已较难可视化,更高维几乎不可视。
局限性 :行图像随维度升高迅速变得难以理解。
1.3 列图像(Column Picture) ✨(重点!)
例子(2×2 系统,同上):
列1:a 1 = [ 2 − 1 ] \mathbf{a}_1 = \begin{bmatrix} 2 \\ -1 \end{bmatrix} a 1 = [ 2 − 1 ]
列2:a 2 = [ − 1 2 ] \mathbf{a}_2 = \begin{bmatrix} -1 \\ 2 \end{bmatrix} a 2 = [ − 1 2 ]
目标:x a 1 + y a 2 = [ 0 3 ] x \mathbf{a}_1 + y \mathbf{a}_2 = \begin{bmatrix} 0 \\ 3 \end{bmatrix} x a 1 + y a 2 = [ 0 3 ]
已知解为 x = 1 , y = 2 x=1, y=2 x = 1 , y = 2 ,验证:
1 ⋅ [ 2 − 1 ] + 2 ⋅ [ − 1 2 ] = [ 2 − 2 − 1 + 4 ] = [ 0 3 ]
1 \cdot \begin{bmatrix} 2 \\ -1 \end{bmatrix} + 2 \cdot \begin{bmatrix} -1 \\ 2 \end{bmatrix} = \begin{bmatrix} 2 - 2 \\ -1 + 4 \end{bmatrix} = \begin{bmatrix} 0 \\ 3 \end{bmatrix}
1 ⋅ [ 2 − 1 ] + 2 ⋅ [ − 1 2 ] = [ 2 − 2 − 1 + 4 ] = [ 0 3 ]
几何解释 :从原点出发,先走 1 倍列1,再从其终点走 2 倍列2,最终到达 b \mathbf{b} b 。
更深层问题:
所有可能的线性组合能覆盖整个平面吗?
若两列向量不共线 (线性无关),则其所有线性组合可覆盖整个 R 2 \mathbb{R}^2 R 2 。
若共线,则只能覆盖一条直线。
2. 矩阵乘法的两种理解方式
给定:
A = [ 2 5 1 3 ] , x = [ 1 2 ]
A = \begin{bmatrix} 2 & 5 \\ 1 & 3 \end{bmatrix}, \quad \mathbf{x} = \begin{bmatrix} 1 \\ 2 \end{bmatrix}
A = [ 2 1 5 3 ] , x = [ 1 2 ] 方式一:按列组合 (推荐!)
A x = 1 ⋅ [ 2 1 ] + 2 ⋅ [ 5 3 ] = [ 2 + 10 1 + 6 ] = [ 12 7 ]
A\mathbf{x} = 1 \cdot \begin{bmatrix} 2 \\ 1 \end{bmatrix} + 2 \cdot \begin{bmatrix} 5 \\ 3 \end{bmatrix} = \begin{bmatrix} 2 + 10 \\ 1 + 6 \end{bmatrix} = \begin{bmatrix} 12 \\ 7 \end{bmatrix}
A x = 1 ⋅ [ 2 1 ] + 2 ⋅ [ 5 3 ] = [ 2 + 10 1 + 6 ] = [ 12 7 ] 方式二:按行点积 (dot product)
第一行:[ 2 , 5 ] ⋅ [ 1 , 2 ] = 2 ⋅ 1 + 5 ⋅ 2 = 12 [2, 5] \cdot [1, 2] = 2 \cdot 1 + 5 \cdot 2 = 12 [ 2 , 5 ] ⋅ [ 1 , 2 ] = 2 ⋅ 1 + 5 ⋅ 2 = 12
第二行:[ 1 , 3 ] ⋅ [ 1 , 2 ] = 1 ⋅ 1 + 3 ⋅ 2 = 7 [1, 3] \cdot [1, 2] = 1 \cdot 1 + 3 \cdot 2 = 7 [ 1 , 3 ] ⋅ [ 1 , 2 ] = 1 ⋅ 1 + 3 ⋅ 2 = 7
核心观点 :A x A\mathbf{x} A x 是 A A A 的列向量的线性组合 ,系数来自 x \mathbf{x} x 。
3. 可解性与矩阵的“好坏”
核心问题:
对任意 b \mathbf{b} b ,方程 A x = b A\mathbf{x} = \mathbf{b} A x = b 是否总有解?
等价于:
A A A 的列向量的所有线性组合是否能填满整个目标空间?
例子(3×3 系统):
设
A = [ 2 − 1 0 − 1 2 − 1 0 − 3 4 ]
A = \begin{bmatrix}
2 & -1 & 0 \\
-1 & 2 & -1 \\
0 & -3 & 4
\end{bmatrix}
A = 2 − 1 0 − 1 2 − 3 0 − 1 4
若 b = [ 0 − 1 4 ] \mathbf{b} = \begin{bmatrix} 0 \\ -1 \\ 4 \end{bmatrix} b = 0 − 1 4 ,恰好等于第三列 → 解为 ( 0 , 0 , 1 ) (0, 0, 1) ( 0 , 0 , 1 ) 。
若 b = 列1 + 列2 = [ 1 1 − 3 ] \mathbf{b} = \text{列1} + \text{列2} = \begin{bmatrix} 1 \\ 1 \\ -3 \end{bmatrix} b = 列 1 + 列 2 = 1 1 − 3 → 解为 ( 1 , 1 , 0 ) (1, 1, 0) ( 1 , 1 , 0 ) 。
结论 :若三列向量线性无关 (不共面),则其组合可覆盖整个 R 3 \mathbb{R}^3 R 3 ,对任意 b \mathbf{b} b 有解。
何时失败?——奇异矩阵 (Singular Matrix)
情况 :若三列共面(如 a 3 = a 1 + a 2 \mathbf{a}_3 = \mathbf{a}_1 + \mathbf{a}_2 a 3 = a 1 + a 2 ),
后果 :所有线性组合仍落在该平面内,
结果 :只有当 b \mathbf{b} b 也在该平面内时,方程才有解;否则无解。
此时 A A A 为奇异矩阵 (不可逆,non-invertible)。
推广到 n 维:
若 n n n 个 n n n 维列向量线性无关 → 组合填满 R n \mathbb{R}^n R n → 非奇异矩阵 (good matrix)。
若列向量线性相关 → 组合仅覆盖低维子空间(如 8D 平面嵌入 9D 空间)→ 奇异矩阵 。
实践提示 :随机生成的矩阵(如 MATLAB rand(9,9))几乎总是非奇异的。
4. 可视化图表(Mermaid)
虽然字幕未明确描述流程或交互,但为辅助理解列图像的向量加法过程 ,可构建如下流程图:
flowchart LR
A[Start at origin] --> B[Add x * column1]
B --> C[From tip of x*col1, add y * column2]
C --> D[Arrive at b = x*col1 + y*col2]
flowchart LR
A[Start at origin] --> B[Add x * column1]
B --> C[From tip of x*col1, add y * column2]
C --> D[Arrive at b = x*col1 + y*col2]
flowchart LR
A[Start at origin] --> B[Add x * column1]
B --> C[From tip of x*col1, add y * column2]
C --> D[Arrive at b = x*col1 + y*col2]
flowchart LR
A[Start at origin] --> B[Add x * column1]
B --> C[From tip of x*col1, add y * column2]
C --> D[Arrive at b = x*col1 + y*col2]
解释 :该流程图描述了列图像中如何通过首尾相接 的方式,将列向量按系数缩放后相加,最终到达目标向量 b \mathbf{b} b 。这体现了线性组合的几何构造过程。
5. 总结与前瞻
行图像 直观但高维失效;列图像 揭示了线性代数的核心——向量空间与线性组合 。
矩阵乘法 = 列组合 是贯穿课程的核心思想。
下一讲将介绍消元法 (elimination)——系统求解 A x = b A\mathbf{x} = \mathbf{b} A x = b 的算法,并能判断解是否存在。
“线性组合”是本课程最基础、最重要的操作。务必深刻理解其代数与几何双重含义。
第2课:矩阵消元 — 高质量学习笔记
核心摘要 (Key Takeaways)
高斯消元法 是求解线性方程组 A x = b A\mathbf{x} = \mathbf{b} A x = b 的标准算法,通过行操作将系数矩阵 A A A 转化为上三角矩阵 U U U 。
消元过程依赖于主元(pivot) ;若主元为零,可通过行交换(permutation)解决(临时失败),若下方无非零元素则为 完全失败 (矩阵不可逆)。
**回代(back substitution)**用于从上三角系统 U x = c U\mathbf{x} = \mathbf{c} U x = c 中自下而上求解未知数。
每一步消元操作都可表示为**初等矩阵(elementary matrix)**左乘原矩阵;整个消元过程等价于一系列初等矩阵的乘积作用于 A A A 。
矩阵乘法不满足交换律但满足结合律 :( E F ) A = E ( F A ) (EF)A = E(FA) ( EF ) A = E ( F A ) ,这使得我们可以将多步操作合并为一个整体变换矩阵。
1. 高斯消元法(Gaussian Elimination)概述
1.1 目标与背景
目标:求解线性方程组 A x = b A\mathbf{x} = \mathbf{b} A x = b ,其中 A A A 是 n × n n \times n n × n 系数矩阵,b \mathbf{b} b 是右侧向量。
方法:高斯消元法 (非行列式法),是所有数值软件(如 MATLAB)求解线性系统的标准方法。
成功条件:矩阵 A A A 是“好矩阵”——即在消元过程中能获得 n n n 个非零主元。
关键思想 :通过行操作逐步消除变量,将系统转化为上三角形式 ,便于回代求解。
1.2 示例系统
考虑以下三元线性方程组:
{ x + 2 y + z = 2 3 x + 8 y + z = 12 0 x + 4 y + z = 2
\begin{cases}
x + 2y + z = 2 \\
3x + 8y + z = 12 \\
0x + 4y + z = 2
\end{cases}
⎩ ⎨ ⎧ x + 2 y + z = 2 3 x + 8 y + z = 12 0 x + 4 y + z = 2 对应矩阵形式为:
A = [ 1 2 1 3 8 1 0 4 1 ] , b = [ 2 12 2 ]
A =
\begin{bmatrix}
1 & 2 & 1 \\
3 & 8 & 1 \\
0 & 4 & 1
\end{bmatrix}, \quad
\mathbf{b} =
\begin{bmatrix}
2 \\ 12 \\ 2
\end{bmatrix}
A = 1 3 0 2 8 4 1 1 1 , b = 2 12 2
2. 消元步骤详解
2.1 第一步:消除第2行的 x 项(位置 (2,1))
主元(pivot) :a 11 = 1 a_{11} = 1 a 11 = 1 (第一个主元,必须非零)。
乘数(multiplier) :l 21 = a 21 a 11 = 3 1 = 3 l_{21} = \frac{a_{21}}{a_{11}} = \frac{3}{1} = 3 l 21 = a 11 a 21 = 1 3 = 3 。
操作 :第2行 ← 第2行 − 3 × 第1行。
结果 :
[ 1 2 1 0 2 − 2 0 4 1 ]
\begin{bmatrix}
1 & 2 & 1 \\
0 & 2 & -2 \\
0 & 4 & 1
\end{bmatrix}
1 0 0 2 2 4 1 − 2 1
例子 :原第2行为 [ 3 , 8 , 1 ] [3, 8, 1] [ 3 , 8 , 1 ] ,减去 3 × [ 1 , 2 , 1 ] = [ 3 , 6 , 3 ] 3 \times [1, 2, 1] = [3, 6, 3] 3 × [ 1 , 2 , 1 ] = [ 3 , 6 , 3 ] ,得 [ 0 , 2 , − 2 ] [0, 2, -2] [ 0 , 2 , − 2 ] 。
右侧向量同步更新:
b 2 = 12 − 3 × 2 = 6 b_2 = 12 - 3 \times 2 = 6 b 2 = 12 − 3 × 2 = 6
新 b = [ 2 , 6 , 2 ] T \mathbf{b} = [2, 6, 2]^T b = [ 2 , 6 , 2 ] T
2.2 第二步:消除第3行的 x 项(位置 (3,1))
当前 a 31 = 0 a_{31} = 0 a 31 = 0 ,无需操作。
乘数 :l 31 = 0 l_{31} = 0 l 31 = 0 。
说明 :即使无需操作,算法仍会检查该位置;若为非零,则需消元。
2.3 第三步:消除第3行的 y 项(位置 (3,2))
新主元 :a 22 = 2 a_{22} = 2 a 22 = 2 (第二个主元)。
乘数 :l 32 = a 32 a 22 = 4 2 = 2 l_{32} = \frac{a_{32}}{a_{22}} = \frac{4}{2} = 2 l 32 = a 22 a 32 = 2 4 = 2 。
操作 :第3行 ← 第3行 − 2 × 第2行。
结果(上三角矩阵 U U U ) :
U = [ 1 2 1 0 2 − 2 0 0 5 ]
U =
\begin{bmatrix}
1 & 2 & 1 \\
0 & 2 & -2 \\
0 & 0 & 5
\end{bmatrix}
U = 1 0 0 2 2 0 1 − 2 5
例子 :第3行原为 [ 0 , 4 , 1 ] [0, 4, 1] [ 0 , 4 , 1 ] ,减去 2 × [ 0 , 2 , − 2 ] = [ 0 , 4 , − 4 ] 2 \times [0, 2, -2] = [0, 4, -4] 2 × [ 0 , 2 , − 2 ] = [ 0 , 4 , − 4 ] ,得 [ 0 , 0 , 5 ] [0, 0, 5] [ 0 , 0 , 5 ] 。
右侧向量更新:
b 3 = 2 − 2 × 6 = − 10 b_3 = 2 - 2 \times 6 = -10 b 3 = 2 − 2 × 6 = − 10
最终 c = [ 2 , 6 , − 10 ] T \mathbf{c} = [2, 6, -10]^T c = [ 2 , 6 , − 10 ] T
2.4 主元总结
三个主元分别为:1, 2, 5 (全部非零 ⇒ 矩阵可逆)。
行列式 :det ( A ) = 1 × 2 × 5 = 10 \det(A) = 1 \times 2 \times 5 = 10 det ( A ) = 1 × 2 × 5 = 10 (主元乘积)。
3. 消元失败的情形
3.1 临时失败(可通过行交换解决)
情形1 :首元素 a 11 = 0 a_{11} = 0 a 11 = 0 。
情形2 :第二主元位置为零(如将原 a 22 = 8 a_{22}=8 a 22 = 8 改为6,则消元后 a 22 ′ = 0 a_{22}' = 0 a 22 ′ = 0 )。
例子 :若 A 22 = 6 A_{22} = 6 A 22 = 6 ,则第2行变为 [ 0 , 0 , − 2 ] [0, 0, -2] [ 0 , 0 , − 2 ] ,主元为0。
对策 :若第3行对应位置非零(如4),可交换第2、3行。
关键原则 :只要主元位置下方存在非零元素,即可通过行交换 (permutation)挽救。
3.2 完全失败(不可逆)
情形 :某主元位置为零,且其下方所有元素也为零。
例子 :若原矩阵最后一行改为 [ 0 , − 4 , − 4 ] [0, -4, -4] [ 0 , − 4 , − 4 ] ,则消元后第3行变为 [ 0 , 0 , 0 ] [0, 0, 0] [ 0 , 0 , 0 ] ,第三个主元为0。
此时矩阵奇异(singular) ,无唯一解,不可逆。
结论 :消元成功 ⇔ 获得 n n n 个非零主元 ⇔ 矩阵可逆。
4. 回代(Back Substitution)
从上三角系统 U x = c U\mathbf{x} = \mathbf{c} U x = c 求解:
{ x + 2 y + z = 2 2 y − 2 z = 6 5 z = − 10
\begin{cases}
x + 2y + z = 2 \\
\quad\quad 2y - 2z = 6 \\
\quad\quad\quad\quad 5z = -10
\end{cases}
⎩ ⎨ ⎧ x + 2 y + z = 2 2 y − 2 z = 6 5 z = − 10 步骤 :
由第3式:z = − 10 / 5 = − 2 z = -10 / 5 = -2 z = − 10/5 = − 2
代入第2式:2 y − 2 ( − 2 ) = 6 ⇒ 2 y + 4 = 6 ⇒ y = 1 2y - 2(-2) = 6 \Rightarrow 2y + 4 = 6 \Rightarrow y = 1 2 y − 2 ( − 2 ) = 6 ⇒ 2 y + 4 = 6 ⇒ y = 1
代入第1式:x + 2 ( 1 ) + ( − 2 ) = 2 ⇒ x = 2 x + 2(1) + (-2) = 2 \Rightarrow x = 2 x + 2 ( 1 ) + ( − 2 ) = 2 ⇒ x = 2
解 :x = [ 2 , 1 , − 2 ] T \mathbf{x} = [2, 1, -2]^T x = [ 2 , 1 , − 2 ] T
5. 消元的矩阵表示
5.1 初等矩阵(Elementary Matrices)
每一步行操作可表示为一个初等矩阵 左乘当前矩阵。
第一步:消除 (2,1)
操作:Row2 ← Row2 − 3×Row1
初等矩阵 E 21 E_{21} E 21 :
E 21 = [ 1 0 0 − 3 1 0 0 0 1 ]
E_{21} =
\begin{bmatrix}
1 & 0 & 0 \\
-3 & 1 & 0 \\
0 & 0 & 1
\end{bmatrix}
E 21 = 1 − 3 0 0 1 0 0 0 1
验证:E 21 A E_{21} A E 21 A 得到第一步结果。
第二步:消除 (3,2)
操作:Row3 ← Row3 − 2×Row2
初等矩阵 E 32 E_{32} E 32 :
E 32 = [ 1 0 0 0 1 0 0 − 2 1 ]
E_{32} =
\begin{bmatrix}
1 & 0 & 0 \\
0 & 1 & 0 \\
0 & -2 & 1
\end{bmatrix}
E 32 = 1 0 0 0 1 − 2 0 0 1
5.2 整体消元矩阵
整个消元过程:
E 32 ( E 21 A ) = U
E_{32} (E_{21} A) = U
E 32 ( E 21 A ) = U 由结合律 (associative law):
( E 32 E 21 ) A = U
(E_{32} E_{21}) A = U
( E 32 E 21 ) A = U 定义整体消元矩阵:
E = E 32 E 21
E = E_{32} E_{21}
E = E 32 E 21
重要性质 :
矩阵乘法不满足交换律 :A B ≠ B A AB \ne BA A B = B A
但满足结合律 :( A B ) C = A ( B C ) (AB)C = A(BC) ( A B ) C = A ( BC ) —— 这是线性代数证明的核心工具。
5.3 行交换与置换矩阵(Permutation Matrix)
行交换 :由置换矩阵 P P P 实现(左乘)。
例如,交换2×2矩阵的两行:
P = [ 0 1 1 0 ] , P [ a b c d ] = [ c d a b ]
P =
\begin{bmatrix}
0 & 1 \\
1 & 0
\end{bmatrix}, \quad
P \begin{bmatrix} a & b \\ c & d \end{bmatrix} = \begin{bmatrix} c & d \\ a & b \end{bmatrix}
P = [ 0 1 1 0 ] , P [ a c b d ] = [ c a d b ]
构造方法:对单位矩阵做相同行交换。
列交换 :需右乘 置换矩阵(因左乘只影响行)。
规则总结 :
6. 逆矩阵(Inverse)与消元的可逆性
6.1 初等矩阵的逆
E 21 E_{21} E 21 表示“Row2 ← Row2 − 3×Row1”
其逆操作为:“Row2 ← Row2 + 3×Row1”
逆矩阵:
E 21 − 1 = [ 1 0 0 3 1 0 0 0 1 ]
E_{21}^{-1} =
\begin{bmatrix}
1 & 0 & 0 \\
3 & 1 & 0 \\
0 & 0 & 1
\end{bmatrix}
E 21 − 1 = 1 3 0 0 1 0 0 0 1
验证:E 21 − 1 E 21 = I E_{21}^{-1} E_{21} = I E 21 − 1 E 21 = I
一般规则 :初等矩阵的逆只需将乘数符号取反。
6.2 消元的可逆性
所有初等矩阵均可逆 ⇒ 若消元成功(无零主元),则 A A A 可逆。
且有:A = E 21 − 1 E 32 − 1 U A = E_{21}^{-1} E_{32}^{-1} U A = E 21 − 1 E 32 − 1 U
7. 可视化:消元流程图
flowchart LR
A[原始矩阵 A] -->|E₂₁| B[消除 a₂₁]
B -->|E₃₁=I| C[无需消除 a₃₁]
C -->|E₃₂| D[消除 a₃₂]
D --> E[上三角矩阵 U]
E --> F[回代求解 x]
flowchart LR
A[原始矩阵 A] -->|E₂₁| B[消除 a₂₁]
B -->|E₃₁=I| C[无需消除 a₃₁]
C -->|E₃₂| D[消除 a₃₂]
D --> E[上三角矩阵 U]
E --> F[回代求解 x]
flowchart LR
A[原始矩阵 A] -->|E₂₁| B[消除 a₂₁]
B -->|E₃₁=I| C[无需消除 a₃₁]
C -->|E₃₂| D[消除 a₃₂]
D --> E[上三角矩阵 U]
E --> F[回代求解 x]
flowchart LR
A[原始矩阵 A] -->|E₂₁| B[消除 a₂₁]
B -->|E₃₁=I| C[无需消除 a₃₁]
C -->|E₃₂| D[消除 a₃₂]
D --> E[上三角矩阵 U]
E --> F[回代求解 x]
解释 :该流程图展示了高斯消元的前向消元 (forward elimination)阶段,每一步由一个初等矩阵驱动,最终得到上三角矩阵 U U U ,再通过回代求解。
附:关键术语表
主元(Pivot) :消元过程中用于消去下方元素的对角线元素,必须非零。
上三角矩阵(Upper Triangular Matrix) :主对角线下方元素全为零的矩阵,记为 U U U 。
初等矩阵(Elementary Matrix) :单位矩阵经一次初等行变换得到的矩阵。
置换矩阵(Permutation Matrix) :用于交换行或列的正交矩阵。
回代(Back Substitution) :从上三角系统自下而上求解未知数的过程。
奇异矩阵(Singular Matrix) :不可逆矩阵,消元时出现零主元且无法通过行交换解决。
本笔记完整覆盖视频所有概念、例子、失败情形、矩阵表示及逆操作,结构清晰,便于复习与深度理解。
第3课:矩阵乘法与逆矩阵 — 高质量学习笔记
核心摘要 (Key Takeaways)
矩阵乘法有四种等价视角 :(1) 元素级点积(行×列)、(2) 列组合(A作用于B的每一列)、(3) 行组合(B的行被A线性组合)、(4) 列×行外积求和。
矩阵乘积 A B = C AB = C A B = C 要求 A 的列数 = B 的行数 ;若 A A A 是 m × n m \times n m × n ,B B B 是 n × p n \times p n × p ,则 C C C 是 m × p m \times p m × p 。
一个方阵不可逆(奇异) 的充要条件是:存在非零向量 x \mathbf{x} x 使得 A x = 0 A\mathbf{x} = \mathbf{0} A x = 0 ,即其列向量线性相关。
Gauss-Jordan 消元法 是求逆矩阵的标准算法:对增广矩阵 [ A ∣ I ] [A \mid I] [ A ∣ I ] 进行行变换,将其左半部分化为单位矩阵 I I I ,右半部分即为 A − 1 A^{-1} A − 1 。
若 A A A 可逆,则 A − 1 A = A A − 1 = I A^{-1}A = AA^{-1} = I A − 1 A = A A − 1 = I ;对于方阵,左逆等于右逆。
一、矩阵乘法的四种等价方式
1. 元素级定义(行 × 列)
给定矩阵 A A A (m × n m \times n m × n )与 B B B (n × p n \times p n × p ),其乘积 C = A B C = AB C = A B 是一个 m × p m \times p m × p 矩阵,其中第 ( i , j ) (i,j) ( i , j ) 项为:
C i j = ∑ k = 1 n A i k B k j
C_{ij} = \sum_{k=1}^{n} A_{ik} B_{kj}
C ij = k = 1 ∑ n A ik B kj
例子 :计算 C 34 C_{34} C 34
取 A A A 的第 3 行:( A 31 , A 32 , … , A 3 n ) (A_{31}, A_{32}, \dots, A_{3n}) ( A 31 , A 32 , … , A 3 n )
取 B B B 的第 4 列:( B 14 , B 24 , … , B n 4 ) ⊤ (B_{14}, B_{24}, \dots, B_{n4})^\top ( B 14 , B 24 , … , B n 4 ) ⊤
点积:C 34 = A 31 B 14 + A 32 B 24 + ⋯ + A 3 n B n 4 C_{34} = A_{31}B_{14} + A_{32}B_{24} + \cdots + A_{3n}B_{n4} C 34 = A 31 B 14 + A 32 B 24 + ⋯ + A 3 n B n 4
维度匹配规则 :
A A A : m × n m \times n m × n
B B B : n × p n \times p n × p
C = A B C = AB C = A B : m × p m \times p m × p
2. 列视角:C 的列是 A 的列的线性组合
将 B B B 按列分块:B = [ b 1 b 2 ⋯ b p ] B = [\mathbf{b}_1\ \mathbf{b}_2\ \cdots\ \mathbf{b}_p] B = [ b 1 b 2 ⋯ b p ] ,则:
A B = [ A b 1 A b 2 ⋯ A b p ]
AB = [A\mathbf{b}_1\ A\mathbf{b}_2\ \cdots\ A\mathbf{b}_p]
A B = [ A b 1 A b 2 ⋯ A b p ]
关键理解 :
每一列 A b j A\mathbf{b}_j A b j 是 A A A 的列向量的线性组合,组合系数来自 b j \mathbf{b}_j b j 。
因此,C C C 的所有列都位于 A A A 的列空间中 。
例子 :
若 A = [ 2 3 4 ] A = \begin{bmatrix} 2 \\ 3 \\ 4 \end{bmatrix} A = 2 3 4 (视为 3 × 1 3 \times 1 3 × 1 矩阵),B = [ 1 6 ] B = \begin{bmatrix} 1 & 6 \end{bmatrix} B = [ 1 6 ] (1 × 2 1 \times 2 1 × 2 ),则
> A B = [ 2 3 4 ] [ 1 6 ] = [ 2 12 3 18 4 24 ] >
> AB = \begin{bmatrix} 2 \\ 3 \\ 4 \end{bmatrix} \begin{bmatrix} 1 & 6 \end{bmatrix} = \begin{bmatrix} 2 & 12 \\ 3 & 18 \\ 4 & 24 \end{bmatrix}
> > A B = 2 3 4 [ 1 6 ] = 2 3 4 12 18 24 >
每一列都是 [ 2 3 4 ] \begin{bmatrix} 2 \\ 3 \\ 4 \end{bmatrix} 2 3 4 的倍数(列空间是一维直线)。
3. 行视角:C 的行是 B 的行的线性组合
将 A A A 按行分块,C C C 的每一行是 B B B 的行的线性组合,组合系数来自 A A A 的对应行。
关键理解 :
例子 (同上):
A B = [ 2 12 3 18 4 24 ] AB = \begin{bmatrix} 2 & 12 \\ 3 & 18 \\ 4 & 24 \end{bmatrix} A B = 2 3 4 12 18 24
每一行都是 [ 1 6 ] [1\ 6] [ 1 6 ] 的倍数(行空间是一维直线)。
4. 列 × 行外积求和(第四种方式)
若 A A A 有列 a 1 , a 2 , … , a n \mathbf{a}_1, \mathbf{a}_2, \dots, \mathbf{a}_n a 1 , a 2 , … , a n ,B B B 有行 r 1 , r 2 , … , r n \mathbf{r}_1, \mathbf{r}_2, \dots, \mathbf{r}_n r 1 , r 2 , … , r n ,则:
A B = ∑ k = 1 n a k r k
AB = \sum_{k=1}^{n} \mathbf{a}_k \mathbf{r}_k
A B = k = 1 ∑ n a k r k
例子 :
设
> A = [ 2 7 3 8 4 9 ] , > B = [ 1 6 0 0 ] >
> A = \begin{bmatrix} 2 & 7 \\ 3 & 8 \\ 4 & 9 \end{bmatrix}, \quad
> B = \begin{bmatrix} 1 & 6 \\ 0 & 0 \end{bmatrix}
> > A = 2 3 4 7 8 9 , > B = [ 1 0 6 0 ] >
则
> A B = [ 2 3 4 ] [ 1 6 ] + [ 7 8 9 ] [ 0 0 ] = [ 2 12 3 18 4 24 ] + 0 >
> AB = \begin{bmatrix} 2 \\ 3 \\ 4 \end{bmatrix} \begin{bmatrix} 1 & 6 \end{bmatrix} + \begin{bmatrix} 7 \\ 8 \\ 9 \end{bmatrix} \begin{bmatrix} 0 & 0 \end{bmatrix} = \begin{bmatrix} 2 & 12 \\ 3 & 18 \\ 4 & 24 \end{bmatrix} + \mathbf{0}
> > A B = 2 3 4 [ 1 6 ] + 7 8 9 [ 0 0 ] = 2 3 4 12 18 24 + 0 >
几何意义 :
此矩阵的行空间 是过向量 [ 1 6 ] [1\ 6] [ 1 6 ] 的直线。
列空间 是过向量 [ 2 3 4 ] ⊤ [2\ 3\ 4]^\top [ 2 3 4 ] ⊤ 的直线。
这是一个秩为 1 的矩阵 (极简结构)。
二、分块矩阵乘法(补充方式)
若将 A A A 和 B B B 按兼容方式分块(如 A = [ A 11 A 12 A 21 A 22 ] A = \begin{bmatrix} A_{11} & A_{12} \\ A_{21} & A_{22} \end{bmatrix} A = [ A 11 A 21 A 12 A 22 ] ,B = [ B 11 B 12 B 21 B 22 ] B = \begin{bmatrix} B_{11} & B_{12} \\ B_{21} & B_{22} \end{bmatrix} B = [ B 11 B 21 B 12 B 22 ] ),则乘积可按块计算:
A B = [ A 11 B 11 + A 12 B 21 A 11 B 12 + A 12 B 22 A 21 B 11 + A 22 B 21 A 21 B 12 + A 22 B 22 ]
AB = \begin{bmatrix}
A_{11}B_{11} + A_{12}B_{21} & A_{11}B_{12} + A_{12}B_{22} \\
A_{21}B_{11} + A_{22}B_{21} & A_{21}B_{12} + A_{22}B_{22}
\end{bmatrix}
A B = [ A 11 B 11 + A 12 B 21 A 21 B 11 + A 22 B 21 A 11 B 12 + A 12 B 22 A 21 B 12 + A 22 B 22 ]
要求 :块之间的维度必须匹配(如 A 12 A_{12} A 12 的列数 = B 21 B_{21} B 21 的行数)。
三、矩阵的逆(Inverse)
1. 定义
对方阵 A A A (n × n n \times n n × n ),若存在矩阵 A − 1 A^{-1} A − 1 使得:
A − 1 A = A A − 1 = I n
A^{-1}A = AA^{-1} = I_n
A − 1 A = A A − 1 = I n 则称 A A A 可逆(invertible) 或 非奇异(non-singular) 。
重要性质 :对方阵 ,若存在左逆(X A = I XA = I X A = I ),则必存在右逆,且两者相等。
2. 不可逆(奇异)矩阵的判定
以下条件等价(任一成立 ⇒ A A A 不可逆):
存在非零向量 x ≠ 0 \mathbf{x} \neq \mathbf{0} x = 0 ,使得 A x = 0 A\mathbf{x} = \mathbf{0} A x = 0 。
A A A 的列向量线性相关 (即某些列是其他列的线性组合)。
A A A 的列空间不能张成 R n \mathbb{R}^n R n (例如所有列共线)。
例子 :
> A = [ 1 3 2 6 ] >
> A = \begin{bmatrix} 1 & 3 \\ 2 & 6 \end{bmatrix}
> > A = [ 1 2 3 6 ] >
列2 = 3 × 列1 ⇒ 列线性相关。
取 x = [ 3 − 1 ] ≠ 0 \mathbf{x} = \begin{bmatrix} 3 \\ -1 \end{bmatrix} \neq \mathbf{0} x = [ 3 − 1 ] = 0 ,则
> A x = 3 [ 1 2 ] − 1 [ 3 6 ] = [ 0 0 ] >
> A\mathbf{x} = 3 \begin{bmatrix} 1 \\ 2 \end{bmatrix} - 1 \begin{bmatrix} 3 \\ 6 \end{bmatrix} = \begin{bmatrix} 0 \\ 0 \end{bmatrix}
> > A x = 3 [ 1 2 ] − 1 [ 3 6 ] = [ 0 0 ] >
无法得到单位矩阵的列(如 [ 1 0 ] ⊤ [1\ 0]^\top [ 1 0 ] ⊤ 不在列空间中)⇒ 不可逆 。
反证法逻辑 :
假设 A − 1 A^{-1} A − 1 存在,且 A x = 0 A\mathbf{x} = \mathbf{0} A x = 0 ,则
> A − 1 ( A x ) = A − 1 0 ⇒ x = 0 >
> A^{-1}(A\mathbf{x}) = A^{-1}\mathbf{0} \Rightarrow \mathbf{x} = \mathbf{0}
> > A − 1 ( A x ) = A − 1 0 ⇒ x = 0 >
与 x ≠ 0 \mathbf{x} \neq \mathbf{0} x = 0 矛盾 ⇒ A − 1 A^{-1} A − 1 不存在。
3. 求逆方法:Gauss-Jordan 消元法
步骤:
构造增广矩阵 [ A ∣ I ] [A \mid I] [ A ∣ I ] 。
对整个矩阵进行行变换 ,将左侧 A A A 化为单位矩阵 I I I 。
此时右侧即为 A − 1 A^{-1} A − 1 。
例子 :求
> A = [ 1 3 2 7 ] >
> A = \begin{bmatrix} 1 & 3 \\ 2 & 7 \end{bmatrix}
> > A = [ 1 2 3 7 ] >
的逆。
步骤演示 :
初始增广矩阵:
[ 1 3 1 0 2 7 0 1 ]
\left[\begin{array}{cc|cc}
1 & 3 & 1 & 0 \\
2 & 7 & 0 & 1
\end{array}\right]
[ 1 2 3 7 1 0 0 1 ]
⇒
A − 1 = [ 7 − 3 − 2 1 ]
A^{-1} = \begin{bmatrix} 7 & -3 \\ -2 & 1 \end{bmatrix}
A − 1 = [ 7 − 2 − 3 1 ] 验证 :
A A − 1 = [ 1 3 2 7 ] [ 7 − 3 − 2 1 ] = [ 1 0 0 1 ]
AA^{-1} = \begin{bmatrix} 1 & 3 \\ 2 & 7 \end{bmatrix} \begin{bmatrix} 7 & -3 \\ -2 & 1 \end{bmatrix} = \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix}
A A − 1 = [ 1 2 3 7 ] [ 7 − 2 − 3 1 ] = [ 1 0 0 1 ] 理论解释(为何有效)?
设一系列初等行变换矩阵为 E 1 , E 2 , … , E k E_1, E_2, \dots, E_k E 1 , E 2 , … , E k ,其乘积为 E = E k ⋯ E 1 E = E_k \cdots E_1 E = E k ⋯ E 1 。
对 [ A ∣ I ] [A \mid I] [ A ∣ I ] 应用这些变换,等价于左乘 E E E :
E [ A ∣ I ] = [ E A ∣ E I ] = [ I ∣ E ]
E[A \mid I] = [EA \mid EI] = [I \mid E]
E [ A ∣ I ] = [ E A ∣ E I ] = [ I ∣ E ] 由于 E A = I EA = I E A = I ,故 E = A − 1 E = A^{-1} E = A − 1 。因此右侧结果即为 A − 1 A^{-1} A − 1 。
附:关键术语回顾
可逆矩阵(Invertible Matrix) :存在逆矩阵的方阵。
奇异矩阵(Singular Matrix) :不可逆的方阵。
列空间(Column Space) :矩阵所有列向量张成的子空间。
行空间(Row Space) :矩阵所有行向量张成的子空间。
线性相关(Linearly Dependent) :存在不全为零的系数使向量组合为零。
Gauss-Jordan 消元法 :同时求解多个线性系统以计算逆矩阵的算法。
第4课:A 的 LU 分解 — 高质量学习笔记
核心摘要 (Key Takeaways)
矩阵乘积的逆 遵循反序法则 :( A B ) − 1 = B − 1 A − 1 (AB)^{-1} = B^{-1}A^{-1} ( A B ) − 1 = B − 1 A − 1 。
LU 分解 将矩阵 A A A 分解为一个单位下三角矩阵 L L L 与一个上三角矩阵 U U U 的乘积:A = L U A = LU A = LU (假设无行交换)。
消元过程 可被表示为一系列初等消元矩阵 E i j E_{ij} E ij 的乘积作用于 A A A ,即 E A = U EA = U E A = U ;而 L = E − 1 L = E^{-1} L = E − 1 ,且 L L L 的非对角元素直接等于消元时使用的乘子 。
计算复杂度 :高斯消元法对 n × n n \times n n × n 矩阵的运算量约为 1 3 n 3 \frac{1}{3}n^3 3 1 n 3 次浮点运算;对每个右侧向量 b b b 的回代成本为 O ( n 2 ) O(n^2) O ( n 2 ) 。
置换矩阵(Permutation Matrices) 用于处理主元为零的情况;它们是单位矩阵的行重排,其逆等于其转置 :P − 1 = P T P^{-1} = P^T P − 1 = P T 。
1. 矩阵乘积的逆与转置
1.1 乘积的逆:反序法则
若 A A A 和 B B B 均为可逆方阵,则乘积 A B AB A B 也可逆,且:
( A B ) − 1 = B − 1 A − 1
(AB)^{-1} = B^{-1}A^{-1}
( A B ) − 1 = B − 1 A − 1
验证 :
( A B ) ( B − 1 A − 1 ) = A ( B B − 1 ) A − 1 = A I A − 1 = A A − 1 = I
(AB)(B^{-1}A^{-1}) = A(BB^{-1})A^{-1} = AIA^{-1} = AA^{-1} = I
( A B ) ( B − 1 A − 1 ) = A ( B B − 1 ) A − 1 = A I A − 1 = A A − 1 = I
直观类比 :脱鞋袜的顺序是“先鞋后袜”,穿回时必须“先袜后鞋”。
例子 :若先穿袜再穿鞋,逆过程必须先穿袜、再穿鞋——对应矩阵乘法顺序反转。
1.2 转置的逆
从 A A − 1 = I AA^{-1} = I A A − 1 = I 出发,两边转置:
( A A − 1 ) T = I T = I
(AA^{-1})^T = I^T = I
( A A − 1 ) T = I T = I
利用 ( X Y ) T = Y T X T (XY)^T = Y^T X^T ( X Y ) T = Y T X T ,得:
( A − 1 ) T A T = I
(A^{-1})^T A^T = I
( A − 1 ) T A T = I
因此:
( A T ) − 1 = ( A − 1 ) T
(A^T)^{-1} = (A^{-1})^T
( A T ) − 1 = ( A − 1 ) T
结论 :对可逆矩阵 A A A ,转置与求逆可交换顺序 。
2. LU 分解:高斯消元的矩阵视角
2.1 基本思想
高斯消元将矩阵 A A A 化为上三角矩阵 U U U 。
若无需行交换 (即所有主元非零),则存在单位下三角矩阵 L L L (对角线为1),使得:
A = L U
A = LU
A = LU
其中:
U U U :消元后的上三角矩阵;
L L L :记录消元过程中所用乘子(multipliers) 的下三角矩阵。
2.2 2×2 案例详解
例子 :设
> A = [ 2 1 8 7 ] >
> A = \begin{bmatrix} 2 & 1 \\ 8 & 7 \end{bmatrix}
> > A = [ 2 8 1 7 ] >
第一步:用第1行消去第2行第1列。乘子为 8 / 2 = 4 8/2 = 4 8/2 = 4 。
初等消元矩阵:
E 21 = [ 1 0 − 4 1 ]
E_{21} = \begin{bmatrix} 1 & 0 \\ -4 & 1 \end{bmatrix}
E 21 = [ 1 − 4 0 1 ]
应用后得:
U = E 21 A = [ 2 1 0 3 ]
U = E_{21}A = \begin{bmatrix} 2 & 1 \\ 0 & 3 \end{bmatrix}
U = E 21 A = [ 2 0 1 3 ]
因此:
A = E 21 − 1 U = L U
A = E_{21}^{-1} U = L U
A = E 21 − 1 U = LU
其中:
L = E 21 − 1 = [ 1 0 4 1 ]
L = E_{21}^{-1} = \begin{bmatrix} 1 & 0 \\ 4 & 1 \end{bmatrix}
L = E 21 − 1 = [ 1 4 0 1 ]
验证:L U = [ 1 0 4 1 ] [ 2 1 0 3 ] = [ 2 1 8 7 ] = A LU = \begin{bmatrix} 1 & 0 \\ 4 & 1 \end{bmatrix} \begin{bmatrix} 2 & 1 \\ 0 & 3 \end{bmatrix} = \begin{bmatrix} 2 & 1 \\ 8 & 7 \end{bmatrix} = A LU = [ 1 4 0 1 ] [ 2 0 1 3 ] = [ 2 8 1 7 ] = A
关键观察 :L L L 的 (2,1) 元素正是消元乘子 4。
2.3 为何使用 L = E^{-1} 而非 E?
消元过程:E A = U E A = U E A = U ,其中 E = E 32 E 31 E 21 E = E_{32}E_{31}E_{21} E = E 32 E 31 E 21 (对 3×3)。
但我们希望写成 A = L U A = L U A = LU ,因此:
A = E − 1 U = ( E 21 − 1 E 31 − 1 E 32 − 1 ) U
A = E^{-1} U = (E_{21}^{-1} E_{31}^{-1} E_{32}^{-1}) U
A = E − 1 U = ( E 21 − 1 E 31 − 1 E 32 − 1 ) U
注意:逆的顺序反转 。
关键优势 :L = E 21 − 1 E 31 − 1 E 32 − 1 L = E_{21}^{-1} E_{31}^{-1} E_{32}^{-1} L = E 21 − 1 E 31 − 1 E 32 − 1 是下三角矩阵 ,且其非对角元素直接等于原始乘子 ,无交叉项。
例子对比(3×3) :
设 E 21 E_{21} E 21 含 − 2 -2 − 2 ,E 32 E_{32} E 32 含 − 5 -5 − 5 。
若直接计算 E = E 32 E 21 E = E_{32}E_{21} E = E 32 E 21 ,则 E E E 的 (3,1) 位置会出现 ( − 5 ) ( − 2 ) = 10 (-5)(-2) = 10 ( − 5 ) ( − 2 ) = 10 ,这是“级联效应”。
但 L = E 21 − 1 E 32 − 1 = [ 1 0 0 2 1 0 0 5 1 ] L = E_{21}^{-1}E_{32}^{-1} = \begin{bmatrix} 1 & 0 & 0 \\ 2 & 1 & 0 \\ 0 & 5 & 1 \end{bmatrix} L = E 21 − 1 E 32 − 1 = 1 2 0 0 1 5 0 0 1 ,乘子 2 和 5 各自独立出现在正确位置,无交叉污染 。
2.4 LDU 分解(可选形式)
有时将主元分离出来:
A = L D U
A = L D U
A = L D U
其中:
L L L :单位下三角(对角为1);
D D D :对角矩阵(含主元);
U U U :单位上三角(对角为1)。
例子 (接上 2×2):
A = [ 1 0 4 1 ] ⏟ L [ 2 0 0 3 ] ⏟ D [ 1 1 / 2 0 1 ] ⏟ U
A = \underbrace{\begin{bmatrix} 1 & 0 \\ 4 & 1 \end{bmatrix}}_{L} \underbrace{\begin{bmatrix} 2 & 0 \\ 0 & 3 \end{bmatrix}}_{D} \underbrace{\begin{bmatrix} 1 & 1/2 \\ 0 & 1 \end{bmatrix}}_{U}
A = L [ 1 4 0 1 ] D [ 2 0 0 3 ] U [ 1 0 1/2 1 ]
3. 计算复杂度分析
3.1 消元阶段(处理矩阵 A)
对 n × n n \times n n × n 矩阵,第 k k k 步消元需处理 ( n − k ) × ( n − k + 1 ) (n - k) \times (n - k + 1) ( n − k ) × ( n − k + 1 ) 子矩阵。
每步操作数 ≈ ( n − k ) 2 (n - k)^2 ( n − k ) 2 (因需更新下方所有行)。
总操作数:
∑ k = 1 n − 1 ( n − k ) 2 = ∑ j = 1 n − 1 j 2 = ( n − 1 ) n ( 2 n − 1 ) 6 ≈ 1 3 n 3 (当 n 很大时)
\sum_{k=1}^{n-1} (n - k)^2 = \sum_{j=1}^{n-1} j^2 = \frac{(n-1)n(2n-1)}{6} \approx \frac{1}{3}n^3 \quad \text{(当 } n \text{ 很大时)}
∑ k = 1 n − 1 ( n − k ) 2 = ∑ j = 1 n − 1 j 2 = 6 ( n − 1 ) n ( 2 n − 1 ) ≈ 3 1 n 3 (当 n 很大时)
结论 :高斯消元的主导项为 1 3 n 3 \frac{1}{3}n^3 3 1 n 3 ,即 O ( n 3 ) O(n^3) O ( n 3 ) 。
类比微积分 :∑ j = 1 n j 2 ≈ ∫ 0 n x 2 d x = 1 3 n 3 \sum_{j=1}^n j^2 \approx \int_0^n x^2 dx = \frac{1}{3}n^3 ∑ j = 1 n j 2 ≈ ∫ 0 n x 2 d x = 3 1 n 3 。
3.2 处理右侧向量 b
消元阶段对 b b b 的操作:每步更新一个元素,共约 n 2 / 2 n^2/2 n 2 /2 次操作。
回代阶段:约 n 2 / 2 n^2/2 n 2 /2 次操作。
总计 :对每个 b b b ,成本为 O ( n 2 ) O(n^2) O ( n 2 ) 。
优势 :若有多组 b b b ,只需一次 O ( n 3 ) O(n^3) O ( n 3 ) 的 L U LU LU 分解,之后每组 b b b 仅需 O ( n 2 ) O(n^2) O ( n 2 ) 。
4. 行交换与置换矩阵(Permutation Matrices)
4.1 何时需要行交换?
4.2 置换矩阵定义
置换矩阵 P P P :单位矩阵的行重排。
性质 :
每行每列恰有一个 1,其余为 0;
P − 1 = P T P^{-1} = P^T P − 1 = P T ;
所有 n × n n \times n n × n 置换矩阵共 n ! n! n ! 个。
例子(3×3 置换矩阵,共 6 个) :
I = [ 1 0 0 0 1 0 0 0 1 ] I = \begin{bmatrix}1&0&0\\0&1&0\\0&0&1\end{bmatrix} I = 1 0 0 0 1 0 0 0 1
P 12 = [ 0 1 0 1 0 0 0 0 1 ] P_{12} = \begin{bmatrix}0&1&0\\1&0&0\\0&0&1\end{bmatrix} P 12 = 0 1 0 1 0 0 0 0 1
P 13 = [ 0 0 1 0 1 0 1 0 0 ] P_{13} = \begin{bmatrix}0&0&1\\0&1&0\\1&0&0\end{bmatrix} P 13 = 0 0 1 0 1 0 1 0 0
P 23 = [ 1 0 0 0 0 1 0 1 0 ] P_{23} = \begin{bmatrix}1&0&0\\0&0&1\\0&1&0\end{bmatrix} P 23 = 1 0 0 0 0 1 0 1 0
循环:[ 0 1 0 0 0 1 1 0 0 ] \begin{bmatrix}0&1&0\\0&0&1\\1&0&0\end{bmatrix} 0 0 1 1 0 0 0 1 0
逆循环:[ 0 0 1 1 0 0 0 1 0 ] \begin{bmatrix}0&0&1\\1&0&0\\0&1&0\end{bmatrix} 0 1 0 0 0 1 1 0 0
关键性质 :置换矩阵构成一个群 ——乘积和逆仍在集合中。
4.3 带行交换的分解
当需要行交换时,消元过程变为:
P A = L U
PA = LU
P A = LU
其中 P P P 是若干行交换的复合置换矩阵。
5. 可视化:LU 分解流程(Mermaid)
flowchart LR
A[原始矩阵 A] -->|应用 E_21, E_31, E_32| U[上三角矩阵 U]
E[E = E_32 E_31 E_21] -->|E A = U| U
E -->|取逆,反序| L[L = E_21⁻¹ E_31⁻¹ E_32⁻¹]
L -->|A = L U| A
flowchart LR
A[原始矩阵 A] -->|应用 E_21, E_31, E_32| U[上三角矩阵 U]
E[E = E_32 E_31 E_21] -->|E A = U| U
E -->|取逆,反序| L[L = E_21⁻¹ E_31⁻¹ E_32⁻¹]
L -->|A = L U| A
flowchart LR
A[原始矩阵 A] -->|应用 E_21, E_31, E_32| U[上三角矩阵 U]
E[E = E_32 E_31 E_21] -->|E A = U| U
E -->|取逆,反序| L[L = E_21⁻¹ E_31⁻¹ E_32⁻¹]
L -->|A = L U| A
flowchart LR
A[原始矩阵 A] -->|应用 E_21, E_31, E_32| U[上三角矩阵 U]
E[E = E_32 E_31 E_21] -->|E A = U| U
E -->|取逆,反序| L[L = E_21⁻¹ E_31⁻¹ E_32⁻¹]
L -->|A = L U| A
解释 :
该流程图展示了高斯消元的矩阵形式。初等消元矩阵 E i j E_{ij} E ij 从左乘 A A A 得到 U U U ;而 L L L 是这些 E E E 的逆按相反顺序 相乘的结果,从而满足 A = L U A = LU A = LU 。关键在于,L L L 的结构简洁,直接存储了消元乘子。
总结
LU 分解 是高斯消元的紧凑矩阵表达,揭示了消元过程的代数结构。
反序法则 在矩阵逆和转置中反复出现,是线性代数的基本对称性。
计算成本 以 n 3 n^3 n 3 为主导,但一旦分解完成,解多右端系统极为高效。
置换矩阵 处理数值稳定性问题,其群结构和正交性(P T = P − 1 P^T = P^{-1} P T = P − 1 )是重要性质。
实践建议 :在编程实现时,可直接将消元乘子填入 L L L 的对应位置,无需显式构造或求逆 E E E 矩阵——这是 LU 分解高效实现的核心思想。
第5课:转置、置换与向量空间 — 高质量学习笔记
核心摘要 (Key Takeaways)
置换矩阵 P P P 用于执行行交换,在高斯消元中处理主元为零的情况,使得一般矩阵分解变为 P A = L U PA = LU P A = LU 。
转置操作 将矩阵 A A A 的行列互换,记作 A T A^T A T ;若 A T = A A^T = A A T = A ,则 A A A 是对称矩阵 。
对称矩阵的重要构造 :对任意矩阵 R R R ,乘积 R T R R^T R R T R 总是对称的。
向量空间 是对向量加法和标量乘法封闭 的集合,必须包含零向量。
子空间 是向量空间的子集,本身也满足向量空间的全部性质;例如 R 2 \mathbb{R}^2 R 2 的子空间只有:零向量、过原点的直线、整个 R 2 \mathbb{R}^2 R 2 。
列空间 (Column Space)是由矩阵各列的所有线性组合 构成的子空间,是理解 A x = b Ax = b A x = b 解的存在性的关键。
1. 置换矩阵(Permutation Matrices)
1.1 定义与作用
置换矩阵 P P P 是通过对单位矩阵的行进行重排 得到的矩阵。
用于执行行交换 (row exchanges),在高斯消元中当主元(pivot)为零时,通过行交换将非零元素移到主元位置。
例子 :
单位矩阵 I I I 是“不做任何操作”的置换矩阵。
交换第1行和第2行的 3 × 3 3 \times 3 3 × 3 置换矩阵为:
P = [ 0 1 0 1 0 0 0 0 1 ]
P = \begin{bmatrix}
0 & 1 & 0 \\
1 & 0 & 0 \\
0 & 0 & 1
\end{bmatrix}
P = 0 1 0 1 0 0 0 0 1
1.2 数量与性质
n × n n \times n n × n 置换矩阵共有 n ! n! n ! 个(即 n n n 行的所有可能重排数)。
例如:4 × 4 4 \times 4 4 × 4 有 4 ! = 24 4! = 24 4 ! = 24 个;5 × 5 5 \times 5 5 × 5 有 5 ! = 120 5! = 120 5 ! = 120 个。
关键性质 :置换矩阵是正交矩阵 ,满足:
P T P = I ⇒ P − 1 = P T
P^T P = I \quad \Rightarrow \quad P^{-1} = P^T
P T P = I ⇒ P − 1 = P T
例子 :将 P P P 与其转置相乘,各行/列的“1”会精准对齐,得到单位矩阵。
1.3 在 LU 分解中的应用
标准 LU 分解假设无需行交换 ,即 A = L U A = LU A = LU 。
当需要行交换时,分解变为:
P A = L U
PA = LU
P A = LU
其中 P P P 是将 A A A 的行调整为“良好顺序”(使消元过程中主元非零)的置换矩阵。
数值计算现实 :如 MATLAB 不仅检查主元是否为零,还检查其是否足够大 (避免数值不稳定),因此即使代数上不需要,也可能执行行交换。
2. 转置(Transpose)与对称矩阵(Symmetric Matrices)
2.1 转置的定义
对任意矩阵 A A A ,其转置 A T A^T A T 满足:
( A T ) i j = A j i
(A^T)_{ij} = A_{ji}
( A T ) ij = A ji
例子 :
A = [ 1 2 4 3 3 1 ] ⇒ A T = [ 1 3 2 3 4 1 ]
A = \begin{bmatrix}
1 & 2 & 4 \\
3 & 3 & 1
\end{bmatrix}
\quad \Rightarrow \quad
A^T = \begin{bmatrix}
1 & 3 \\
2 & 3 \\
4 & 1
\end{bmatrix}
A = [ 1 3 2 3 4 1 ] ⇒ A T = 1 2 4 3 3 1
原为 3 × 2 3 \times 2 3 × 2 ,转置后为 2 × 3 2 \times 3 2 × 3 。
2.2 转置的运算规则
乘积的转置 :顺序反转
( A B ) T = B T A T
(AB)^T = B^T A^T
( A B ) T = B T A T
推导示例 :( R T R ) T = R T ( R T ) T = R T R (R^T R)^T = R^T (R^T)^T = R^T R ( R T R ) T = R T ( R T ) T = R T R ,说明 R T R R^T R R T R 对称。
2.3 对称矩阵
定义 :满足 A T = A A^T = A A T = A 的矩阵。
例子 :
A = [ 1 7 9 7 2 5 9 5 3 ] (关于主对角线对称)
A = \begin{bmatrix}
1 & 7 & 9 \\
7 & 2 & 5 \\
9 & 5 & 3
\end{bmatrix}
\quad \text{(关于主对角线对称)}
A = 1 7 9 7 2 5 9 5 3 (关于主对角线对称)
重要构造 :对任意矩阵 R R R (不必为方阵),R T R R^T R R T R 总是对称矩阵 。
数值验证例子 :
R = [ 1 2 4 ] , R T = [ 1 2 4 ] ⇒ R T R = [ 1 2 4 2 4 8 4 8 16 ]
R = \begin{bmatrix}
1 \\ 2 \\ 4
\end{bmatrix},\quad
R^T = \begin{bmatrix} 1 & 2 & 4 \end{bmatrix}
\quad \Rightarrow \quad
R^T R = \begin{bmatrix}
1 & 2 & 4 \\
2 & 4 & 8 \\
4 & 8 & 16
\end{bmatrix}
R = 1 2 4 , R T = [ 1 2 4 ] ⇒ R T R = 1 2 4 2 4 8 4 8 16
注意:( 1 ) ( 2 ) = 2 (1)(2) = 2 ( 1 ) ( 2 ) = 2 与 ( 2 ) ( 1 ) = 2 (2)(1) = 2 ( 2 ) ( 1 ) = 2 对称;( 1 ) ( 4 ) = 4 (1)(4) = 4 ( 1 ) ( 4 ) = 4 与 ( 4 ) ( 1 ) = 4 (4)(1) = 4 ( 4 ) ( 1 ) = 4 对称,等等。
代数证明 :
( R T R ) T = R T ( R T ) T = R T R
(R^T R)^T = R^T (R^T)^T = R^T R
( R T R ) T = R T ( R T ) T = R T R
因此 R T R R^T R R T R 对称。
3. 向量空间(Vector Spaces)
3.1 定义与基本要求
向量空间 是一个集合,其中的元素(向量)满足:
对加法封闭 :若 u , v ∈ V u, v \in V u , v ∈ V ,则 u + v ∈ V u + v \in V u + v ∈ V 。
对标量乘法封闭 :若 v ∈ V v \in V v ∈ V ,c ∈ R c \in \mathbb{R} c ∈ R ,则 c v ∈ V c v \in V c v ∈ V 。
必须包含零向量 (因为 0 ⋅ v = 0 0 \cdot v = 0 0 ⋅ v = 0 )。
这两个操作必须满足八条公理 (如结合律、分配律等),但在 R n \mathbb{R}^n R n 中自然成立。
3.2 标准例子:\mathbb{R}^n
R n \mathbb{R}^n R n :所有含 n n n 个实数分量的列向量 构成的空间。
例子 :
R 2 \mathbb{R}^2 R 2 :所有形如 [ x y ] \begin{bmatrix} x \\ y \end{bmatrix} [ x y ] 的向量,对应平面 。
R 3 \mathbb{R}^3 R 3 :所有三维向量,如 [ 3 2 0 ] ∈ R 3 \begin{bmatrix} 3 \\ 2 \\ 0 \end{bmatrix} \in \mathbb{R}^3 3 2 0 ∈ R 3 (注意:即使某分量为0,仍属 R 3 \mathbb{R}^3 R 3 )。
3.3 非向量空间的反例
第一象限(含边界) :所有满足 x ≥ 0 , y ≥ 0 x \geq 0, y \geq 0 x ≥ 0 , y ≥ 0 的向量。
问题 :对标量乘法不封闭 。
例子 :[ 3 2 ] ∈ \begin{bmatrix} 3 \\ 2 \end{bmatrix} \in [ 3 2 ] ∈ 第一象限,但 − 5 ⋅ [ 3 2 ] = [ − 15 − 10 ] ∉ -5 \cdot \begin{bmatrix} 3 \\ 2 \end{bmatrix} = \begin{bmatrix} -15 \\ -10 \end{bmatrix} \notin − 5 ⋅ [ 3 2 ] = [ − 15 − 10 ] ∈ / 第一象限。
关键词:不封闭 (not closed)。
4. 子空间(Subspaces)
4.1 定义
子空间 是向量空间 V V V 的子集 S S S ,且 S S S 本身也是一个向量空间(即对加法和标量乘法封闭,并包含零向量)。
4.2 \mathbb{R}^2 的所有子空间
零空间 :仅含零向量 { [ 0 0 ] } \left\{ \begin{bmatrix} 0 \\ 0 \end{bmatrix} \right\} { [ 0 0 ] } 。
过原点的直线 :所有形如 c ⋅ [ a b ] c \cdot \begin{bmatrix} a \\ b \end{bmatrix} c ⋅ [ a b ] (c ∈ R c \in \mathbb{R} c ∈ R )的向量。
关键 :必须过原点!否则乘以0会离开该集合。
反例 :不过原点的直线(如 y = x + 1 y = x + 1 y = x + 1 )不是子空间。
整个 R 2 \mathbb{R}^2 R 2 。
注意 :过原点的直线虽“像” R 1 \mathbb{R}^1 R 1 ,但其向量有两个分量 ,故不等于 R 1 \mathbb{R}^1 R 1 。
4.3 \mathbb{R}^3 的子空间
零向量
过原点的直线
过原点的平面
整个 R 3 \mathbb{R}^3 R 3
5. 由矩阵生成的子空间:列空间(Column Space)
5.1 定义
给定矩阵 A A A ,其列空间 C ( A ) C(A) C ( A ) 是 A A A 的各列向量的所有线性组合 构成的集合:
C ( A ) = { c 1 a 1 + c 2 a 2 + ⋯ + c k a k ∣ c i ∈ R }
C(A) = \left\{ c_1 \mathbf{a}_1 + c_2 \mathbf{a}_2 + \cdots + c_k \mathbf{a}_k \mid c_i \in \mathbb{R} \right\}
C ( A ) = { c 1 a 1 + c 2 a 2 + ⋯ + c k a k ∣ c i ∈ R }
其中 a i \mathbf{a}_i a i 是 A A A 的第 i i i 列。
列空间一定是子空间 (因对线性组合封闭)。
5.2 几何解释(以 3 \times 2 矩阵为例)
设
A = [ 1 3 2 3 4 1 ]
A = \begin{bmatrix}
1 & 3 \\
2 & 3 \\
4 & 1
\end{bmatrix}
A = 1 2 4 3 3 1
列1:[ 1 2 4 ] \begin{bmatrix} 1 \\ 2 \\ 4 \end{bmatrix} 1 2 4 ,列2:[ 3 3 1 ] \begin{bmatrix} 3 \\ 3 \\ 1 \end{bmatrix} 3 3 1
若两列线性无关 (不在同一直线上),则 C ( A ) C(A) C ( A ) 是 R 3 \mathbb{R}^3 R 3 中一个过原点的平面 。
若两列共线 ,则 C ( A ) C(A) C ( A ) 是一条过原点的直线 。
若所有列为零,则 C ( A ) = { 0 } C(A) = \{ \mathbf{0} \} C ( A ) = { 0 } 。
5.3 一般情况
对 m × n m \times n m × n 矩阵,列空间是 R m \mathbb{R}^m R m 的子空间。
关键点 :列空间的维度取决于列向量的线性无关性 ,而非列数。
6. 可视化图表(Mermaid)
虽然字幕未明确描述流程或交互,但可基于子空间层级结构 构建概念图:
flowchart TD
A[向量空间 V] --> B[子空间 S ⊆ V]
B --> C1[零子空间 {0}]
B --> C2[真子空间: 直线/平面等]
B --> C3[V 本身]
C2 --> D1[必须包含 0 向量]
C2 --> D2[对加法和标量乘法封闭]
flowchart TD
A[向量空间 V] --> B[子空间 S ⊆ V]
B --> C1[零子空间 {0}]
B --> C2[真子空间: 直线/平面等]
B --> C3[V 本身]
C2 --> D1[必须包含 0 向量]
C2 --> D2[对加法和标量乘法封闭]
flowchart TD
A[向量空间 V] --> B[子空间 S ⊆ V]
B --> C1[零子空间 {0}]
B --> C2[真子空间: 直线/平面等]
B --> C3[V 本身]
C2 --> D1[必须包含 0 向量]
C2 --> D2[对加法和标量乘法封闭]
flowchart TD
A[向量空间 V] --> B[子空间 S ⊆ V]
B --> C1[零子空间 {0}]
B --> C2[真子空间: 直线/平面等]
B --> C3[V 本身]
C2 --> D1[必须包含 0 向量]
C2 --> D2[对加法和标量乘法封闭]
解释 :该流程图展示了向量空间与其子空间的包含关系。任何子空间必须满足两个核心条件:包含零向量,且对向量加法和标量乘法封闭。子空间可以是平凡的(仅零向量或全空间),也可以是中间维度的结构(如直线、平面)。
总结
本课从置换与转置 的矩阵操作,过渡到向量空间 这一线性代数的核心抽象概念。关键在于理解:
结构稳定性 :子空间必须在运算下“自洽”。
构造性思维 :如何从具体对象(如矩阵的列)生成抽象空间(列空间)。
几何直觉 :在 R 2 \mathbb{R}^2 R 2 、R 3 \mathbb{R}^3 R 3 中可视化子空间,为高维推广打下基础。
这些概念是后续理解 A x = b Ax = b A x = b 解的存在性、秩、零空间等主题的基石。
第6课:列空间与零空间 — 高质量学习笔记
核心摘要 (Key Takeaways)
向量空间 必须对加法 和标量乘法 封闭,等价于对所有线性组合 封闭。
子空间 是向量空间的子集,且自身也构成向量空间;必须包含零向量 。
列空间 C ( A ) C(A) C ( A ) 是矩阵 A A A 所有列向量的线性组合 构成的子空间;A x = b Ax = b A x = b 有解当且仅当 b ∈ C ( A ) b \in C(A) b ∈ C ( A ) 。
零空间 N ( A ) N(A) N ( A ) 是所有满足 A x = 0 Ax = 0 A x = 0 的向量 x x x 构成的子空间;它位于 R n \mathbb{R}^n R n (n n n 为未知数个数)。
两个子空间的并集一般不是子空间 ,但它们的交集一定是子空间 。
1. 向量空间与子空间
1.1 向量空间的定义
一个向量空间 是一组向量的集合,满足以下两个封闭性条件:
加法封闭 :任意两个向量相加仍在该集合中。
标量乘法封闭 :任意向量乘以任意标量(实数)仍在该集合中。
✅ 等价表述:所有线性组合 c 1 v + c 2 w c_1 \mathbf{v} + c_2 \mathbf{w} c 1 v + c 2 w 都在该空间中。
1.2 子空间(Subspace)
子空间是原向量空间的一个子集 ,且自身也构成向量空间 。
关键性质 :任何子空间必须包含零向量 0 \mathbf{0} 0 。
例子(在 \mathbb{R}^3 中)
整个空间 R 3 \mathbb{R}^3 R 3 是一个向量空间。
过原点的平面 :例如 P = { ( x , y , z ) ∣ a x + b y + c z = 0 } P = \{ (x,y,z) \mid ax + by + cz = 0 \} P = {( x , y , z ) ∣ a x + b y + cz = 0 } ,是一个子空间。
验证 :平面上任意两向量相加仍在平面;标量倍仍在平面。
过原点的直线 :例如 L = { t ⋅ v ∣ t ∈ R } L = \{ t \cdot \mathbf{v} \mid t \in \mathbb{R} \} L = { t ⋅ v ∣ t ∈ R } ,是一个子空间。
❌ 反例 :不过原点的平面或直线不是 子空间(不包含 0 \mathbf{0} 0 )。
2. 子空间的运算:并集 vs 交集
2.1 并集(Union)通常不是子空间
设 P P P 为过原点的平面,L L L 为过原点但不在该平面内 的直线。
考察 P ∪ L P \cup L P ∪ L :包含所有在 P P P 或 L L L 中的向量。
反例 :取 v ∈ P \mathbf{v} \in P v ∈ P ,w ∈ L \mathbf{w} \in L w ∈ L ,则 v + w \mathbf{v} + \mathbf{w} v + w 通常既不在 P P P 也不在 L L L ,故不在 P ∪ L P \cup L P ∪ L 中。
结论 :P ∪ L P \cup L P ∪ L 不是子空间 。
2.2 交集(Intersection)一定是子空间
定义:S ∩ T = { v ∣ v ∈ S 且 v ∈ T } S \cap T = \{ \mathbf{v} \mid \mathbf{v} \in S \text{ 且 } \mathbf{v} \in T \} S ∩ T = { v ∣ v ∈ S 且 v ∈ T } 。
证明 :
若 v , w ∈ S ∩ T \mathbf{v}, \mathbf{w} \in S \cap T v , w ∈ S ∩ T ,则 v , w ∈ S \mathbf{v}, \mathbf{w} \in S v , w ∈ S 且 ∈ T \in T ∈ T 。
因 S , T S, T S , T 均为子空间,故 v + w ∈ S \mathbf{v} + \mathbf{w} \in S v + w ∈ S 且 ∈ T \in T ∈ T ⇒ v + w ∈ S ∩ T \mathbf{v} + \mathbf{w} \in S \cap T v + w ∈ S ∩ T 。
同理,c v ∈ S ∩ T c\mathbf{v} \in S \cap T c v ∈ S ∩ T 。
例子 :上述 P ∩ L = { 0 } P \cap L = \{ \mathbf{0} \} P ∩ L = { 0 } (因直线不在平面内),而 { 0 } \{ \mathbf{0} \} { 0 } 是子空间。
3. 列空间(Column Space)
3.1 定义
对 m × n m \times n m × n 矩阵 A A A ,其列空间 C ( A ) C(A) C ( A ) 是 A A A 的所有列向量的线性组合 构成的集合:
C ( A ) = { A x = x 1 a 1 + x 2 a 2 + ⋯ + x n a n ∣ x ∈ R n }
C(A) = \left\{ A\mathbf{x} = x_1 \mathbf{a}_1 + x_2 \mathbf{a}_2 + \cdots + x_n \mathbf{a}_n \mid \mathbf{x} \in \mathbb{R}^n \right\}
C ( A ) = { A x = x 1 a 1 + x 2 a 2 + ⋯ + x n a n ∣ x ∈ R n }
C ( A ) C(A) C ( A ) 是 R m \mathbb{R}^m R m 的子空间(因列向量有 m m m 个分量)。
3.2 示例分析
考虑矩阵:
A = [ 1 1 2 2 1 3 3 1 4 4 1 5 ]
A = \begin{bmatrix}
1 & 1 & 2 \\
2 & 1 & 3 \\
3 & 1 & 4 \\
4 & 1 & 5
\end{bmatrix}
A = 1 2 3 4 1 1 1 1 2 3 4 5
列向量为 a 1 = [ 1 2 3 4 ] , a 2 = [ 1 1 1 1 ] , a 3 = [ 2 3 4 5 ] \mathbf{a}_1 = \begin{bmatrix}1\\2\\3\\4\end{bmatrix}, \mathbf{a}_2 = \begin{bmatrix}1\\1\\1\\1\end{bmatrix}, \mathbf{a}_3 = \begin{bmatrix}2\\3\\4\\5\end{bmatrix} a 1 = 1 2 3 4 , a 2 = 1 1 1 1 , a 3 = 2 3 4 5
观察发现:a 3 = a 1 + a 2 \mathbf{a}_3 = \mathbf{a}_1 + \mathbf{a}_2 a 3 = a 1 + a 2
因此,第三列是冗余的 ,不增加新的方向。
结论 :C ( A ) C(A) C ( A ) 由 a 1 , a 2 \mathbf{a}_1, \mathbf{a}_2 a 1 , a 2 张成,是 R 4 \mathbb{R}^4 R 4 中的二维子空间 。
3.3 与线性方程组的联系
方程 A x = b A\mathbf{x} = \mathbf{b} A x = b 有解 ⇔ b ∈ C ( A ) \mathbf{b} \in C(A) b ∈ C ( A )
例子 :
b = [ 1 2 3 4 ] = a 1 \mathbf{b} = \begin{bmatrix}1\\2\\3\\4\end{bmatrix} = \mathbf{a}_1 b = 1 2 3 4 = a 1 ⇒ 解为 x = [ 1 0 0 ] \mathbf{x} = \begin{bmatrix}1\\0\\0\end{bmatrix} x = 1 0 0
b = [ 1 1 1 1 ] = a 2 \mathbf{b} = \begin{bmatrix}1\\1\\1\\1\end{bmatrix} = \mathbf{a}_2 b = 1 1 1 1 = a 2 ⇒ 解为 x = [ 0 1 0 ] \mathbf{x} = \begin{bmatrix}0\\1\\0\end{bmatrix} x = 0 1 0
b = [ 0 0 0 0 ] \mathbf{b} = \begin{bmatrix}0\\0\\0\\0\end{bmatrix} b = 0 0 0 0 ⇒ 总有解 x = 0 \mathbf{x} = \mathbf{0} x = 0
❌ 注意 :由于 A A A 只有 3 列,其列空间无法充满 R 4 \mathbb{R}^4 R 4 (最多三维,实际二维)。
4. 零空间(Null Space)
4.1 定义
零空间 N ( A ) N(A) N ( A ) 是所有满足 A x = 0 A\mathbf{x} = \mathbf{0} A x = 0 的解 x \mathbf{x} x 构成的集合:
N ( A ) = { x ∈ R n ∣ A x = 0 }
N(A) = \left\{ \mathbf{x} \in \mathbb{R}^n \mid A\mathbf{x} = \mathbf{0} \right\}
N ( A ) = { x ∈ R n ∣ A x = 0 }
N ( A ) N(A) N ( A ) 是 R n \mathbb{R}^n R n 的子空间。
4.2 示例分析(同上矩阵 A)
求解 A x = 0 A\mathbf{x} = \mathbf{0} A x = 0 :
显然 x = 0 \mathbf{x} = \mathbf{0} x = 0 是解。
观察列关系:a 1 + a 2 − a 3 = 0 \mathbf{a}_1 + \mathbf{a}_2 - \mathbf{a}_3 = \mathbf{0} a 1 + a 2 − a 3 = 0
⇒ x = [ 1 1 − 1 ] \mathbf{x} = \begin{bmatrix}1\\1\\-1\end{bmatrix} x = 1 1 − 1 是非零解。
所有解为:x = c [ 1 1 − 1 ] , c ∈ R \mathbf{x} = c \begin{bmatrix}1\\1\\-1\end{bmatrix},\ c \in \mathbb{R} x = c 1 1 − 1 , c ∈ R
✅ 结论 :N ( A ) N(A) N ( A ) 是 R 3 \mathbb{R}^3 R 3 中过原点的一条直线 (一维子空间)。
4.3 零空间是子空间的证明
加法封闭 :若 A v = 0 A\mathbf{v} = \mathbf{0} A v = 0 且 A w = 0 A\mathbf{w} = \mathbf{0} A w = 0 ,则
A ( v + w ) = A v + A w = 0 + 0 = 0
A(\mathbf{v} + \mathbf{w}) = A\mathbf{v} + A\mathbf{w} = \mathbf{0} + \mathbf{0} = \mathbf{0}
A ( v + w ) = A v + A w = 0 + 0 = 0
标量乘法封闭 :若 A v = 0 A\mathbf{v} = \mathbf{0} A v = 0 ,则
A ( c v ) = c ( A v ) = c 0 = 0
A(c\mathbf{v}) = c(A\mathbf{v}) = c\mathbf{0} = \mathbf{0}
A ( c v ) = c ( A v ) = c 0 = 0
利用了矩阵乘法的线性性 (分配律与齐次性)。
5. 非齐次方程的解集不是子空间
考虑 A x = b A\mathbf{x} = \mathbf{b} A x = b ,其中 b ≠ 0 \mathbf{b} \neq \mathbf{0} b = 0 (如 b = [ 1 2 3 4 ] \mathbf{b} = \begin{bmatrix}1\\2\\3\\4\end{bmatrix} b = 1 2 3 4 )。
已知一个特解:x p = [ 1 0 0 ] \mathbf{x}_p = \begin{bmatrix}1\\0\\0\end{bmatrix} x p = 1 0 0
另一个解:x = [ 0 − 1 1 ] \mathbf{x} = \begin{bmatrix}0\\-1\\1\end{bmatrix} x = 0 − 1 1 (因 − a 2 + a 3 = a 1 = b -\mathbf{a}_2 + \mathbf{a}_3 = \mathbf{a}_1 = \mathbf{b} − a 2 + a 3 = a 1 = b )
但解集不是子空间 ,因为:
零向量不是解 (A 0 = 0 ≠ b A\mathbf{0} = \mathbf{0} \neq \mathbf{b} A 0 = 0 = b )
解集是仿射空间 (affine space):形如 x p + N ( A ) \mathbf{x}_p + N(A) x p + N ( A ) ,即平移后的零空间 ,不过原点 。
📌 关键区别 :
齐次方程 A x = 0 A\mathbf{x} = \mathbf{0} A x = 0 的解集 = 子空间 (零空间)
非齐次方程 A x = b A\mathbf{x} = \mathbf{b} A x = b 的解集 = 仿射子空间 (不是向量空间)
6. 描述子空间的两种方式
方式
描述方法
例子
生成式(Span)
给出一组生成向量,取其所有线性组合
列空间 C ( A ) = span { a 1 , a 2 , … } C(A) = \text{span}\{\mathbf{a}_1, \mathbf{a}_2, \dots\} C ( A ) = span { a 1 , a 2 , … }
约束式(Equations)
给出线性方程组,解集即为子空间
零空间 N ( A ) = { x ∣ A x = 0 } N(A) = \{ \mathbf{x} \mid A\mathbf{x} = \mathbf{0} \} N ( A ) = { x ∣ A x = 0 }
✅ 两种方式等价,是构造子空间的核心方法 。
7. 可视化总结(Mermaid 流程图)
flowchart LR
A[矩阵 A] --> B[列空间 C A ]
A --> C[零空间 N A ]
B --> D[子空间 of R^m]
C --> E[子空间 of R^n]
D --> F[Ax = b 有解 ⇔ b ∈ C A ]
E --> G[Ax = 0 的所有解]
flowchart LR
A[矩阵 A] --> B[列空间 C A ]
A --> C[零空间 N A ]
B --> D[子空间 of R^m]
C --> E[子空间 of R^n]
D --> F[Ax = b 有解 ⇔ b ∈ C A ]
E --> G[Ax = 0 的所有解]
flowchart LR
A[矩阵 A] --> B[列空间 C A ]
A --> C[零空间 N A ]
B --> D[子空间 of R^m]
C --> E[子空间 of R^n]
D --> F[Ax = b 有解 ⇔ b ∈ C A ]
E --> G[Ax = 0 的所有解]
flowchart LR
A[矩阵 A] --> B[列空间 C A ]
A --> C[零空间 N A ]
B --> D[子空间 of R^m]
C --> E[子空间 of R^n]
D --> F[Ax = b 有解 ⇔ b ∈ C A ]
E --> G[Ax = 0 的所有解]
解释 :
该流程图展示了矩阵 A A A (m × n m \times n m × n )如何自然导出两个关键子空间:
列空间 C ( A ) ⊆ R m C(A) \subseteq \mathbb{R}^m C ( A ) ⊆ R m ,决定方程 A x = b Ax = b A x = b 的可解性;
零空间 N ( A ) ⊆ R n N(A) \subseteq \mathbb{R}^n N ( A ) ⊆ R n ,刻画齐次方程的解结构。
注 :本课为理解线性代数核心结构(四大子空间之二)奠定基础,后续将通过高斯消元法 系统计算列空间与零空间。
第7课:Ax = 0 —— 主变量、自由变量与特解
高质量学习笔记
🔑 核心摘要 (Key Takeaways)
主变量(pivot variables) 与 自由变量(free variables) 的划分由矩阵消元后的主元列决定;自由变量可任意赋值,主变量则通过回代求解。
特解(special solutions) 是通过依次将每个自由变量设为1、其余设为0,再求解主变量得到的;特解个数 = 自由变量个数 = n − r n - r n − r (n n n 为列数,r r r 为秩)。
零空间(null space) 是所有特解的线性组合 构成的子空间,即 Null ( A ) = span { 特解 1 , … , 特解 n − r } \text{Null}(A) = \text{span}\{\text{特解}_1, \dots, \text{特解}_{n-r}\} Null ( A ) = span { 特解 1 , … , 特解 n − r } 。
矩阵的秩 r r r 等于主元个数,也等于独立行/列的个数;它决定了方程组中真正有效的方程数量。
简化行阶梯形(Reduced Row Echelon Form, RREF) 矩阵 R R R 具有标准结构:主元为1,主元上下均为0,且主元列构成单位子矩阵;特解可直接从 R R R 的自由列读出(符号取反)。
📚 全面内容解析
1. 问题背景:求解 A\mathbf{x} = \mathbf{0}
目标:描述矩阵 A A A 的零空间 (null space),即所有满足 A x = 0 A\mathbf{x} = \mathbf{0} A x = 0 的向量 x \mathbf{x} x 。
核心思想:将定义 (零空间)转化为算法 (高斯消元 + 回代)。
关键性质:初等行变换不改变零空间 (因为对等式两边做相同合法操作,解集不变),但会改变列空间。
2. 示例矩阵与消元过程
考虑矩阵:
A = [ 2 4 6 8 3 6 8 10 ]
A = \begin{bmatrix}
2 & 4 & 6 & 8 \\
3 & 6 & 8 & 10
\end{bmatrix}
A = [ 2 3 4 6 6 8 8 10 ]
观察 :
第2列 = 2 × 第1列 → 列线性相关。
第3行(若存在)= 第1行 + 第2行 → 行线性相关(本例为2行,但原视频中为3行,此处以视频为准:实际为3行4列)。
注 :视频中实际矩阵为 3 行 4 列:
> A = [ > 2 4 6 8 > 3 6 8 10 > 5 10 14 18 > ] >
> A = \begin{bmatrix}
> 2 & 4 & 6 & 8 \\
> 3 & 6 & 8 & 10 \\
> 5 & 10 & 14 & 18
> \end{bmatrix}
> > A = > 2 > 3 > 5 4 6 10 6 8 14 8 10 18 > >
且第3行 = 第1行 + 第2行。
消元得上阶梯形 U
执行高斯消元(允许列跳过无主元的情况):
U = [ 2 4 6 8 0 0 2 4 0 0 0 0 ]
U = \begin{bmatrix}
2 & 4 & 6 & 8 \\
0 & 0 & 2 & 4 \\
0 & 0 & 0 & 0
\end{bmatrix}
U = 2 0 0 4 0 0 6 2 0 8 4 0
主元位置 :第1列、第3列 → 主元列(pivot columns) 。
非主元列 :第2列、第4列 → 自由列(free columns) 。
秩(rank) :r = 2 r = 2 r = 2 (主元个数)。
✅ 关键结论 :秩 r r r = 独立方程数 = 独立列数 = 独立行数。
3. 主变量 vs. 自由变量
变量总数 :n = 4 n = 4 n = 4 (列数)。
主变量 :对应主元列的变量 → x 1 , x 3 x_1, x_3 x 1 , x 3 。
自由变量 :对应非主元列的变量 → x 2 , x 4 x_2, x_4 x 2 , x 4 。
自由变量个数 :n − r = 4 − 2 = 2 n - r = 4 - 2 = 2 n − r = 4 − 2 = 2 。
💡 为什么叫“自由” ?因为可任意赋值 ,再通过方程解出主变量。
4. 构造特解(Special Solutions)
步骤:
对每个自由变量,依次设其为1,其余自由变量为0。
通过回代求解主变量。
得到一个特解。
特解 1:设 x_2 = 1, x_4 = 0
从 U x = 0 U\mathbf{x} = \mathbf{0} U x = 0 得方程:
{ 2 x 1 + 4 x 2 + 6 x 3 + 8 x 4 = 0 2 x 3 + 4 x 4 = 0 ⇒ { x 1 + 2 x 2 + 3 x 3 + 4 x 4 = 0 x 3 + 2 x 4 = 0
\begin{cases}
2x_1 + 4x_2 + 6x_3 + 8x_4 = 0 \\
2x_3 + 4x_4 = 0
\end{cases}
\Rightarrow
\begin{cases}
x_1 + 2x_2 + 3x_3 + 4x_4 = 0 \\
x_3 + 2x_4 = 0
\end{cases}
{ 2 x 1 + 4 x 2 + 6 x 3 + 8 x 4 = 0 2 x 3 + 4 x 4 = 0 ⇒ { x 1 + 2 x 2 + 3 x 3 + 4 x 4 = 0 x 3 + 2 x 4 = 0
代入 x 2 = 1 , x 4 = 0 x_2=1, x_4=0 x 2 = 1 , x 4 = 0 :
x 3 = 0 x_3 = 0 x 3 = 0
x 1 = − 2 x_1 = -2 x 1 = − 2
特解 1 :x ( 1 ) = [ − 2 1 0 0 ] \mathbf{x}^{(1)} = \begin{bmatrix} -2 \\ 1 \\ 0 \\ 0 \end{bmatrix} x ( 1 ) = − 2 1 0 0
例子解释 :该解表示 − 2 ⋅ col 1 + 1 ⋅ col 2 = 0 -2 \cdot \text{col}_1 + 1 \cdot \text{col}_2 = \mathbf{0} − 2 ⋅ col 1 + 1 ⋅ col 2 = 0 ,验证了第2列是第1列的2倍。
特解 2:设 x_2 = 0, x_4 = 1
代入得:
x 3 = − 2 x_3 = -2 x 3 = − 2
x 1 = 2 x_1 = 2 x 1 = 2
特解 2 :x ( 2 ) = [ 2 0 − 2 1 ] \mathbf{x}^{(2)} = \begin{bmatrix} 2 \\ 0 \\ -2 \\ 1 \end{bmatrix} x ( 2 ) = 2 0 − 2 1
例子解释 :2 ⋅ col 1 − 2 ⋅ col 3 + 1 ⋅ col 4 = 0 2 \cdot \text{col}_1 - 2 \cdot \text{col}_3 + 1 \cdot \text{col}_4 = \mathbf{0} 2 ⋅ col 1 − 2 ⋅ col 3 + 1 ⋅ col 4 = 0 ,验证列间线性关系。
5. 零空间的完整描述
零空间 = 所有特解的线性组合 :
Null ( A ) = { c 1 [ − 2 1 0 0 ] + c 2 [ 2 0 − 2 1 ] | c 1 , c 2 ∈ R }
\text{Null}(A) = \left\{ c_1 \begin{bmatrix} -2 \\ 1 \\ 0 \\ 0 \end{bmatrix} + c_2 \begin{bmatrix} 2 \\ 0 \\ -2 \\ 1 \end{bmatrix} \,\middle|\, c_1, c_2 \in \mathbb{R} \right\}
Null ( A ) = ⎩ ⎨ ⎧ c 1 − 2 1 0 0 + c 2 2 0 − 2 1 c 1 , c 2 ∈ R ⎭ ⎬ ⎫
这是一个二维子空间 (平面)嵌入在 R 4 \mathbb{R}^4 R 4 中。
✅ 通用公式 :若 A A A 为 m × n m \times n m × n 矩阵,秩为 r r r ,则零空间维数 = n − r n - r n − r 。
6. 简化行阶梯形(RREF)与矩阵 R
对 U U U 进一步化简:
主元上方消为0。
主元归一化为1。
得:
R = [ 1 2 0 − 2 0 0 1 2 0 0 0 0 ]
R = \begin{bmatrix}
1 & 2 & 0 & -2 \\
0 & 0 & 1 & 2 \\
0 & 0 & 0 & 0
\end{bmatrix}
R = 1 0 0 2 0 0 0 1 0 − 2 2 0
结构分析 :
主元列(1, 3)构成 2 × 2 2 \times 2 2 × 2 单位矩阵 I I I 。
自由列(2, 4)构成矩阵 F = [ 2 − 2 0 2 ] F = \begin{bmatrix} 2 & -2 \\ 0 & 2 \end{bmatrix} F = [ 2 0 − 2 2 ] 。
整体结构:R = [ I F 0 0 ] R = \begin{bmatrix} I & F \\ \mathbf{0} & \mathbf{0} \end{bmatrix} R = [ I 0 F 0 ]
从 R 直接读出特解
方程 R x = 0 R\mathbf{x} = \mathbf{0} R x = 0 即:
[ I F ] [ x pivot x free ] = 0 ⇒ x pivot + F x free = 0 ⇒ x pivot = − F x free
\begin{bmatrix} I & F \end{bmatrix} \begin{bmatrix} \mathbf{x}_{\text{pivot}} \\ \mathbf{x}_{\text{free}} \end{bmatrix} = \mathbf{0}
\Rightarrow \mathbf{x}_{\text{pivot}} + F \mathbf{x}_{\text{free}} = \mathbf{0}
\Rightarrow \mathbf{x}_{\text{pivot}} = -F \mathbf{x}_{\text{free}}
[ I F ] [ x pivot x free ] = 0 ⇒ x pivot + F x free = 0 ⇒ x pivot = − F x free
设 x free = [ 1 0 ] \mathbf{x}_{\text{free}} = \begin{bmatrix} 1 \\ 0 \end{bmatrix} x free = [ 1 0 ] → x pivot = − [ 2 0 ] \mathbf{x}_{\text{pivot}} = -\begin{bmatrix} 2 \\ 0 \end{bmatrix} x pivot = − [ 2 0 ] → 特解 = [ − 2 1 0 0 ] \begin{bmatrix} -2 \\ 1 \\ 0 \\ 0 \end{bmatrix} − 2 1 0 0
设 x free = [ 0 1 ] \mathbf{x}_{\text{free}} = \begin{bmatrix} 0 \\ 1 \end{bmatrix} x free = [ 0 1 ] → x pivot = − [ − 2 2 ] = [ 2 − 2 ] \mathbf{x}_{\text{pivot}} = -\begin{bmatrix} -2 \\ 2 \end{bmatrix} = \begin{bmatrix} 2 \\ -2 \end{bmatrix} x pivot = − [ − 2 2 ] = [ 2 − 2 ] → 特解 = [ 2 0 − 2 1 ] \begin{bmatrix} 2 \\ 0 \\ -2 \\ 1 \end{bmatrix} 2 0 − 2 1
✅ 结论 :特解 = [ − F I ] \begin{bmatrix} -F \\ I \end{bmatrix} [ − F I ] ,其中 I I I 为 ( n − r ) × ( n − r ) (n-r) \times (n-r) ( n − r ) × ( n − r ) 单位阵。
7. 第二个例子:A^\top 的零空间
取 A ⊤ A^\top A ⊤ (原 A A A 为 3×4,则 A ⊤ A^\top A ⊤ 为 4×3):
A^\top = \begin{bmatrix}
2 & 3 \\
4 & 6 \\
6 & 8 \\
8 & 10
\end{bmatrix}
\quad \text{(实际应为 4×3,但视频中为转置原3×4矩阵)}
视频中实际为 :
> A = [ > 2 4 6 8 > 3 6 8 10 > ] > ⇒ A ⊤ = [ > 2 3 > 4 6 > 6 8 > 8 10 > ] >
> A = \begin{bmatrix}
> 2 & 4 & 6 & 8 \\
> 3 & 6 & 8 & 10
> \end{bmatrix}
> \Rightarrow A^\top = \begin{bmatrix}
> 2 & 3 \\
> 4 & 6 \\
> 6 & 8 \\
> 8 & 10
> \end{bmatrix}
> > A = [ > 2 > 3 4 6 6 8 8 10 > ] >⇒ A ⊤ = > 2 > 4 > 6 > 8 3 6 8 10 > >
但后续计算显示为 3列 ,故应为原 A A A 为 2×3?此处以视频逻辑为准:新矩阵为 3 列,秩为 2 。
消元得:
U = [ 2 4 6 0 2 2 0 0 0 0 0 0 ] ⇒ R = [ 1 0 1 0 1 1 0 0 0 0 0 0 ]
U = \begin{bmatrix}
2 & 4 & 6 \\
0 & 2 & 2 \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix}
\Rightarrow
R = \begin{bmatrix}
1 & 0 & 1 \\
0 & 1 & 1 \\
0 & 0 & 0 \\
0 & 0 & 0
\end{bmatrix}
U = 2 0 0 0 4 2 0 0 6 2 0 0 ⇒ R = 1 0 0 0 0 1 0 0 1 1 0 0
秩 r = 2 r = 2 r = 2 ,列数 n = 3 n = 3 n = 3 → 自由变量个数 = 3 − 2 = 1 3 - 2 = 1 3 − 2 = 1 。
自由变量:x 3 x_3 x 3
设 x 3 = 1 x_3 = 1 x 3 = 1 → x 2 = − 1 x_2 = -1 x 2 = − 1 , x 1 = − 1 x_1 = -1 x 1 = − 1
特解 :x = [ − 1 − 1 1 ] \mathbf{x} = \begin{bmatrix} -1 \\ -1 \\ 1 \end{bmatrix} x = − 1 − 1 1
零空间 :Null ( A ⊤ ) = { c [ − 1 − 1 1 ] | c ∈ R } \text{Null}(A^\top) = \left\{ c \begin{bmatrix} -1 \\ -1 \\ 1 \end{bmatrix} \,\middle|\, c \in \mathbb{R} \right\} Null ( A ⊤ ) = ⎩ ⎨ ⎧ c − 1 − 1 1 c ∈ R ⎭ ⎬ ⎫ (一条直线)
例子验证 :− 1 ⋅ col 1 − 1 ⋅ col 2 + 1 ⋅ col 3 = 0 -1 \cdot \text{col}_1 -1 \cdot \text{col}_2 + 1 \cdot \text{col}_3 = \mathbf{0} − 1 ⋅ col 1 − 1 ⋅ col 2 + 1 ⋅ col 3 = 0 ,因第3列 = 第1列 + 第2列。
8. 零空间矩阵(Null Space Matrix)
定义:矩阵 N N N ,其列向量为所有特解。
对第一个例子:
N = [ − 2 2 1 0 0 − 2 0 1 ] = [ − F I ]
N = \begin{bmatrix}
-2 & 2 \\
1 & 0 \\
0 & -2 \\
0 & 1
\end{bmatrix}
= \begin{bmatrix} -F \\ I \end{bmatrix}
N = − 2 1 0 0 2 0 − 2 1 = [ − F I ]
满足:A N = 0 A N = \mathbf{0} A N = 0 ,R N = 0 R N = \mathbf{0} RN = 0
💡 MATLAB 命令 :N = null(A) 返回零空间的一组标准正交基(但教学版可返回上述 N N N )。
📊 可视化:零空间构造流程(Mermaid)
flowchart LR
A[输入矩阵 A] --> B[高斯消元 → U]
B --> C{识别主元列与自由列}
C --> D[主变量: x_pivot\n自由变量: x_free]
D --> E[对每个自由变量:\n设其为1,其余为0]
E --> F[回代求主变量]
F --> G[得到一个特解]
G --> H{是否处理完所有自由变量?}
H -- 否 --> E
H -- 是 --> I[零空间 = 所有特解的线性组合]
flowchart LR
A[输入矩阵 A] --> B[高斯消元 → U]
B --> C{识别主元列与自由列}
C --> D[主变量: x_pivot\n自由变量: x_free]
D --> E[对每个自由变量:\n设其为1,其余为0]
E --> F[回代求主变量]
F --> G[得到一个特解]
G --> H{是否处理完所有自由变量?}
H -- 否 --> E
H -- 是 --> I[零空间 = 所有特解的线性组合]
flowchart LR
A[输入矩阵 A] --> B[高斯消元 → U]
B --> C{识别主元列与自由列}
C --> D[主变量: x_pivot\n自由变量: x_free]
D --> E[对每个自由变量:\n设其为1,其余为0]
E --> F[回代求主变量]
F --> G[得到一个特解]
G --> H{是否处理完所有自由变量?}
H -- 否 --> E
H -- 是 --> I[零空间 = 所有特解的线性组合]
flowchart LR
A[输入矩阵 A] --> B[高斯消元 → U]
B --> C{识别主元列与自由列}
C --> D[主变量: x_pivot\n自由变量: x_free]
D --> E[对每个自由变量:\n设其为1,其余为0]
E --> F[回代求主变量]
F --> G[得到一个特解]
G --> H{是否处理完所有自由变量?}
H -- 否 --> E
H -- 是 --> I[零空间 = 所有特解的线性组合]
解释 :该流程图展示了从矩阵 A A A 出发,通过消元、变量分类、赋值回代,最终构造出零空间的完整算法步骤。每一步都对应视频中强调的核心操作。
🧠 关键公式总结
✅ 复习提示 :掌握“消元 → 分主/自由变量 → 构造特解 → 线性组合得零空间”这一主线,即可应对所有 A x = 0 A\mathbf{x} = \mathbf{0} A x = 0 类问题。RREF 是最清晰的表达形式,特解可直接读出。
第8课:Ax = b 的可解性与解的结构 — 高质量学习笔记
核心摘要 (Key Takeaways)
可解性条件 :线性方程组 A x = b A\mathbf{x} = \mathbf{b} A x = b 有解 当且仅当 b \mathbf{b} b 属于 A A A 的列空间 ;等价地,若某行组合使 A A A 的行变为零行,则相同组合作用于 b \mathbf{b} b 必须得到 0。
解的结构 :若解存在,则通解 = 一个特解 + 零空间中的任意向量 ,即 x = x p + x n \mathbf{x} = \mathbf{x}_p + \mathbf{x}_n x = x p + x n 。
自由变量与主元变量 :通过高斯消元识别主元列(pivot columns)和自由列(free columns);设自由变量为 0 可得一个特解。
秩决定解的个数 :设 A A A 为 m × n m \times n m × n 矩阵,秩为 r r r :
若 r = n r = n r = n (满列秩):零空间只有零向量,至多一个解 (0 或 1 个)。
若 r = m r = m r = m (满行秩):对任意 b \mathbf{b} b 都有解,无穷多解 (因 n > m n > m n > m 时存在自由变量)。
若 r = m = n r = m = n r = m = n :矩阵可逆,唯一解 。
若 r < m r < m r < m 且 r < n r < n r < n :可能无解,也可能无穷多解。
1. 可解性条件(Solvability Conditions)
1.1 列空间视角
方程 A x = b A\mathbf{x} = \mathbf{b} A x = b 有解 ⇔ b ∈ Col ( A ) \mathbf{b} \in \text{Col}(A) b ∈ Col ( A )
即 b \mathbf{b} b 是 A A A 的列向量的线性组合。
1.2 行空间视角(通过消元揭示)
若存在行的线性组合使得 A A A 的某些行变为 零行 ,则对 b \mathbf{b} b 施加相同的组合 必须得到 0 。
例子 :考虑矩阵
A = [ 1 2 2 2 2 4 6 8 3 6 8 10 ]
A = \begin{bmatrix}
1 & 2 & 2 & 2 \\
2 & 4 & 6 & 8 \\
3 & 6 & 8 & 10
\end{bmatrix}
A = 1 2 3 2 4 6 2 6 8 2 8 10
第三行 = 第一行 + 第二行 ⇒ 行组合:R 3 − R 1 − R 2 = 0 R_3 - R_1 - R_2 = \mathbf{0} R 3 − R 1 − R 2 = 0
⇒ 对 b = [ b 1 b 2 b 3 ] \mathbf{b} = \begin{bmatrix} b_1 \\ b_2 \\ b_3 \end{bmatrix} b = b 1 b 2 b 3 必须满足:
b 3 − b 1 − b 2 = 0 即 b 1 + b 2 = b 3
b_3 - b_1 - b_2 = 0 \quad \text{即} \quad b_1 + b_2 = b_3
b 3 − b 1 − b 2 = 0 即 b 1 + b 2 = b 3
案例 :若 b = [ 1 5 6 ] \mathbf{b} = \begin{bmatrix} 1 \\ 5 \\ 6 \end{bmatrix} b = 1 5 6 ,则 1 + 5 = 6 1 + 5 = 6 1 + 5 = 6 ,满足条件,有解 。
若 b = [ 1 5 17 ] \mathbf{b} = \begin{bmatrix} 1 \\ 5 \\ 17 \end{bmatrix} b = 1 5 17 ,则 1 + 5 ≠ 17 1 + 5 \ne 17 1 + 5 = 17 ,无解 。
✅ 关键点 :消元过程在增广矩阵 [ A ∣ b ] [A \mid \mathbf{b}] [ A ∣ b ] 上进行,若出现形如 0 = 非零 0 = \text{非零} 0 = 非零 的矛盾行,则无解。
2. 解的结构:通解 = 特解 + 零空间
2.1 算法步骤
检查可解性 :对增广矩阵 [ A ∣ b ] [A \mid \mathbf{b}] [ A ∣ b ] 做行消元,确保无矛盾方程(如 0 = c ≠ 0 0 = c \ne 0 0 = c = 0 )。
求一个特解 x p \mathbf{x}_p x p :
求零空间 Null ( A ) \text{Null}(A) Null ( A ) :
找出所有特殊解 (每个自由变量依次设为 1,其余为 0)。
零空间 = 所有特殊解的线性组合。
通解 :x = x p + x n \mathbf{x} = \mathbf{x}_p + \mathbf{x}_n x = x p + x n ,其中 x n ∈ Null ( A ) \mathbf{x}_n \in \text{Null}(A) x n ∈ Null ( A ) 。
2.2 示例详解(基于上述 A 和 \mathbf{b} = [1,5,6]^T)
步骤 1:消元后系统
消元后得:
x 1 + 2 x 2 + 2 x 3 + 2 x 4 = 1 2 x 3 + 4 x 4 = 3 0 = 0
\begin{aligned}
x_1 + 2x_2 + 2x_3 + 2x_4 &= 1 \\
2x_3 + 4x_4 &= 3 \\
0 &= 0
\end{aligned}
x 1 + 2 x 2 + 2 x 3 + 2 x 4 2 x 3 + 4 x 4 0 = 1 = 3 = 0
主元列 :第 1 列(x 1 x_1 x 1 )、第 3 列(x 3 x_3 x 3 )
自由变量 :x 2 , x 4 x_2, x_4 x 2 , x 4
步骤 2:求特解 \mathbf{x}_p
设 x 2 = 0 , x 4 = 0 x_2 = 0, x_4 = 0 x 2 = 0 , x 4 = 0 ,则:
2 x 3 = 3 ⇒ x 3 = 3 2 2x_3 = 3 \Rightarrow x_3 = \frac{3}{2} 2 x 3 = 3 ⇒ x 3 = 2 3
x 1 + 2 ⋅ 3 2 = 1 ⇒ x 1 = 1 − 3 = − 2 x_1 + 2 \cdot \frac{3}{2} = 1 \Rightarrow x_1 = 1 - 3 = -2 x 1 + 2 ⋅ 2 3 = 1 ⇒ x 1 = 1 − 3 = − 2
⇒ 特解:
x p = [ − 2 0 3 2 0 ]
\mathbf{x}_p = \begin{bmatrix} -2 \\ 0 \\ \frac{3}{2} \\ 0 \end{bmatrix}
x p = − 2 0 2 3 0 步骤 3:求零空间(特殊解)
解 A x = 0 A\mathbf{x} = \mathbf{0} A x = 0 :
特殊解 1 :设 x 2 = 1 , x 4 = 0 x_2 = 1, x_4 = 0 x 2 = 1 , x 4 = 0
由 2 x 3 = 0 ⇒ x 3 = 0 2x_3 = 0 \Rightarrow x_3 = 0 2 x 3 = 0 ⇒ x 3 = 0
x 1 + 2 ( 1 ) = 0 ⇒ x 1 = − 2 x_1 + 2(1) = 0 \Rightarrow x_1 = -2 x 1 + 2 ( 1 ) = 0 ⇒ x 1 = − 2
⇒ s 1 = [ − 2 1 0 0 ] \mathbf{s}_1 = \begin{bmatrix} -2 \\ 1 \\ 0 \\ 0 \end{bmatrix} s 1 = − 2 1 0 0
特殊解 2 :设 x 2 = 0 , x 4 = 1 x_2 = 0, x_4 = 1 x 2 = 0 , x 4 = 1
2 x 3 + 4 ( 1 ) = 0 ⇒ x 3 = − 2 2x_3 + 4(1) = 0 \Rightarrow x_3 = -2 2 x 3 + 4 ( 1 ) = 0 ⇒ x 3 = − 2
x 1 + 2 ( − 2 ) + 2 ( 1 ) = 0 ⇒ x 1 = 2 x_1 + 2(-2) + 2(1) = 0 \Rightarrow x_1 = 2 x 1 + 2 ( − 2 ) + 2 ( 1 ) = 0 ⇒ x 1 = 2
⇒ s 2 = [ 2 0 − 2 1 ] \mathbf{s}_2 = \begin{bmatrix} 2 \\ 0 \\ -2 \\ 1 \end{bmatrix} s 2 = 2 0 − 2 1
✅ 验证:A s 2 = 0 A\mathbf{s}_2 = \mathbf{0} A s 2 = 0 ?
第一行:1 ⋅ 2 + 2 ⋅ 0 + 2 ⋅ ( − 2 ) + 2 ⋅ 1 = 2 − 4 + 2 = 0 1\cdot2 + 2\cdot0 + 2\cdot(-2) + 2\cdot1 = 2 -4 +2 = 0 1 ⋅ 2 + 2 ⋅ 0 + 2 ⋅ ( − 2 ) + 2 ⋅ 1 = 2 − 4 + 2 = 0 ✓
步骤 4:通解
x = x p + c 1 s 1 + c 2 s 2 = [ − 2 0 3 2 0 ] + c 1 [ − 2 1 0 0 ] + c 2 [ 2 0 − 2 1 ] , c 1 , c 2 ∈ R
\mathbf{x} = \mathbf{x}_p + c_1 \mathbf{s}_1 + c_2 \mathbf{s}_2 =
\begin{bmatrix} -2 \\ 0 \\ \frac{3}{2} \\ 0 \end{bmatrix} + c_1 \begin{bmatrix} -2 \\ 1 \\ 0 \\ 0 \end{bmatrix} + c_2 \begin{bmatrix} 2 \\ 0 \\ -2 \\ 1 \end{bmatrix}, \quad c_1, c_2 \in \mathbb{R}
x = x p + c 1 s 1 + c 2 s 2 = − 2 0 2 3 0 + c 1 − 2 1 0 0 + c 2 2 0 − 2 1 , c 1 , c 2 ∈ R
3. 秩 r 与解的存在性/唯一性
设 A A A 为 m × n m \times n m × n 矩阵,秩为 r r r (即主元个数)。
情况
条件
零空间
对任意 b \mathbf{b} b 是否总有解?
解的个数
满秩方阵
r = m = n r = m = n r = m = n
{ 0 } \{\mathbf{0}\} { 0 }
是
唯一解
满列秩
r = n < m r = n < m r = n < m
{ 0 } \{\mathbf{0}\} { 0 }
否(仅当 b ∈ Col ( A ) \mathbf{b} \in \text{Col}(A) b ∈ Col ( A ) )
0 或 1 个解
满行秩
r = m < n r = m < n r = m < n
维数 = n − m > 0 = n - m > 0 = n − m > 0
是
无穷多解
秩亏
r < m r < m r < m 且 r < n r < n r < n
维数 = n − r > 0 = n - r > 0 = n − r > 0
否(需满足相容性条件)
0 或 无穷多解
3.1 示例分析
例 1:满列秩(r = n = 2, m = 4)
A = [ 1 2 6 5 3 1 1 1 ]
A = \begin{bmatrix}
1 & 2 \\
6 & 5 \\
3 & 1 \\
1 & 1
\end{bmatrix}
A = 1 6 3 1 2 5 1 1
两列线性无关 ⇒ r = 2 = n r = 2 = n r = 2 = n
零空间 = { 0 } \{\mathbf{0}\} { 0 }
但 :4 个方程,2 个未知数 ⇒ 通常无解
有解当且仅当 b \mathbf{b} b 是两列的线性组合
例子 :b = [ 4 3 7 6 ] = col 1 + col 2 \mathbf{b} = \begin{bmatrix} 4 \\ 3 \\ 7 \\ 6 \end{bmatrix} = \text{col}_1 + \text{col}_2 b = 4 3 7 6 = col 1 + col 2 ⇒ 解为 x = [ 1 , 1 ] T \mathbf{x} = [1, 1]^T x = [ 1 , 1 ] T (唯一)
例 2:满行秩(r = m = 2, n = 4)
A = [ 1 2 6 5 3 1 1 1 ]
A = \begin{bmatrix}
1 & 2 & 6 & 5 \\
3 & 1 & 1 & 1
\end{bmatrix}
A = [ 1 3 2 1 6 1 5 1 ]
行满秩 ⇒ 消元后无零行 ⇒ 对任意 b ∈ R 2 \mathbf{b} \in \mathbb{R}^2 b ∈ R 2 都有解
自由变量数 = n − r = 2 n - r = 2 n − r = 2 ⇒ 无穷多解
例 3:满秩方阵(r = m = n = 2)
A = [ 1 2 3 1 ]
A = \begin{bmatrix} 1 & 2 \\ 3 & 1 \end{bmatrix}
A = [ 1 3 2 1 ]
可逆 ⇒ A x = b A\mathbf{x} = \mathbf{b} A x = b 对任意 b \mathbf{b} b 有唯一解
零空间 = { 0 } \{\mathbf{0}\} { 0 }
行最简形 = I I I
4. 几何解释:解集的形状
零空间 :是 R n \mathbb{R}^n R n 中的子空间 (过原点)。
A x = b A\mathbf{x} = \mathbf{b} A x = b 的解集 (当有解时):
是仿射子空间 (affine subspace)
= 特解 x p \mathbf{x}_p x p + 零空间
不过原点 (除非 b = 0 \mathbf{b} = \mathbf{0} b = 0 )
维数 = 零空间维数 = n − r n - r n − r
📌 例子 :前述 4 4 4 维问题中,解集是一个二维平面 ,平移至通过点 x p \mathbf{x}_p x p ,但不包含原点。
5. 总结:秩 r 决定一切
“The rank tells you everything about the number of solutions.”
存在性 :取决于 r r r 与 m m m 的关系(是否满行秩)
唯一性 :取决于 r r r 与 n n n 的关系(是否满列秩)
解的结构 :由特解 + 零空间给出,零空间维数 = n − r n - r n − r
✅ 复习提示 :做题时务必先做消元,判断可解性,再按“设自由变量为0 → 求特解 → 求零空间 → 写通解”四步走。