矩阵代数(二):秩与线性方程组

秩(Rank)

矩阵的秩

任一矩阵可以经过初等行变换化成行阶梯形矩阵,这个行阶梯形矩阵所含非零行的行数实际上就是矩阵的秩,它是矩阵的一个数字特征,对研究矩阵的性质有着重要的作用。

如果矩阵 A\bm AA 中有一个 rrr 阶子式 DrD_rDr​ 不等于零,而所有 r+1r+1r+1 阶子式(如果存在的话)全等于零,则称数 rrr 是矩阵 A\bm AA 的秩,记作 R(A)R(\bm A)R(A) ,规定零矩阵的秩为零。

显然,对于 m×nm\times nm×n 矩阵 A\bm AA ,有:

R(Am×n)≤min⁡{m,n}R(\bm A_{m\times n})\leq\min\{m,n\}R(Am×n​)≤min{m,n}

R(AT)=R(A)R(\bm A^T)=R(\bm A)R(AT)=R(A)

为什么行阶梯形矩阵所含非零行的行数就是矩阵的秩?这就要涉及到矩阵的秩的另外一个性质:

设矩阵 A\bm AA 经过有限次初等变换化为矩阵 B\bm BB ,则 R(A)=R(B)R(\bm A)=R(\bm B)R(A)=R(B) 。

上面这个定理也可以理解为等价矩阵具有相同的秩:设 A\bm AA 为 m×nm\times nm×n 矩阵, P\bm PP 是 mmm 阶可逆矩阵, Q\bm QQ 是 nnn 阶可逆矩阵,则 R(A)=R(PA)=R(AQ)=R(PAQ)R(\bm A)=R(\bm P\bm A)=R(\bm A\bm Q)=R(\bm P\bm A\bm Q)R(A)=R(PA)=R(AQ)=R(PAQ)

两个重要结论(在后文证明):

R(AB)≤min⁡{R(A),R(B)}R(\bm A\bm B)\leq\min\{R(\bm A),R(\bm B)\}R(AB)≤min{R(A),R(B)}

R(A+B)≤R(A)+R(B)R(\bm A+\bm B)\leq R(\bm A)+R(\bm B)R(A+B)≤R(A)+R(B)

当矩阵的秩和行数相等时,称作行满秩矩阵;当矩阵的秩和列数相等时,称作列满秩矩阵。

当矩阵 A\bm AA 为 nnn 阶方阵时,若 R(A)=nR(\bm A)=nR(A)=n ,则称 A\bm AA 为满秩矩阵;若 R(A)

矩阵可逆的充要条件是 ∣A∣≠0|\bm A|\neq 0∣A∣=0 ,因此满秩矩阵可逆,降秩矩阵不可逆。

关于行、列满秩矩阵,有以下定理:

对行满秩矩阵 Am×n\bm A_{m\times n}Am×n​ ,必有列满秩矩阵 Bn×m\bm B_{n\times m}Bn×m​ ,使得 AB=I\bm A\bm B=\bm IAB=I 。

证明:

当 m=nm=nm=n 时,由满秩矩阵可逆,定理显然成立。

当 m

AP=[A1,A2]\bm A\bm P=[\bm A_1,\bm A_2]

AP=[A1​,A2​]

其中 A1\bm A_1A1​ 可逆,令

B=[A1−1O]\bm B=\begin{bmatrix}\bm A_1^{-1}\\\bm O\end{bmatrix}

B=[A1−1​O​]

又因为 R(B)=R(A1−1)=mR(\bm B)=R(\bm A_1^{-1})=mR(B)=R(A1−1​)=m ,于是 B\bm BB 为 n×mn\times mn×m 列满秩矩阵,且有

AB=[A1,A2][A1−1O]=I\bm A\bm B=[\bm A_1,\bm A_2]\begin{bmatrix}\bm A_1^{-1}\\\bm O\end{bmatrix}=\bm I

AB=[A1​,A2​][A1−1​O​]=I

矩阵乘积的秩的性质:

设矩阵 Am×n,Bn×p\bm A_{m\times n},\bm B_{n\times p}Am×n​,Bn×p​ ,则 R(AB)≥R(A)+R(B)−nR(\bm A\bm B)\geq R(\bm A)+R(\bm B)-nR(AB)≥R(A)+R(B)−n 。

证明:

设 R(A)=rR(\bm A)=rR(A)=r ,存在 mmm 阶可逆矩阵 P\bm PP 和 nnn 阶可逆矩阵 Q\bm QQ ,使得有以下标准形矩阵:

PAQ=[IrOOO]\bm P\bm A\bm Q=\begin{bmatrix}\bm I_r&\bm O\\\bm O&\bm O\end{bmatrix}

PAQ=[Ir​O​OO​]

将矩阵 Q−1B\bm Q^{-1}\bm BQ−1B 分块为

Q−1B=[B1B2]\bm Q^{-1}\bm B=\begin{bmatrix}\bm B_1\\\bm B_2\end{bmatrix}

Q−1B=[B1​B2​​]

其中 B1\bm B_1B1​ 是 r×pr\times pr×p 矩阵, B2\bm B_2B2​ 是 (n−r)×p(n-r)\times p(n−r)×p 矩阵。由于

PAB=PAQQ−1B=[IrOOO][B1B2]=[B1O]\bm P\bm A\bm B=\bm P\bm A\bm Q\bm Q^{-1}\bm B=\begin{bmatrix}\bm I_r&\bm O\\\bm O&\bm O\end{bmatrix}\begin{bmatrix}\bm B_1\\\bm B_2\end{bmatrix}=\begin{bmatrix}\bm B_1\\\bm O\end{bmatrix}

PAB=PAQQ−1B=[Ir​O​OO​][B1​B2​​]=[B1​O​]

所以

R(AB)=R(PAB)=R[B1O]=R(B1)R(\bm A\bm B)=R(\bm P\bm A\bm B)=R\begin{bmatrix}\bm B_1\\\bm O\end{bmatrix}=R(\bm B_1)

R(AB)=R(PAB)=R[B1​O​]=R(B1​)

B1\bm B_1B1​ 是 Q−1B\bm Q^{-1}\bm BQ−1B 去掉 n−rn-rn−r 行得到的矩阵,而矩阵每去掉一行秩减一或不变,因此

R(B1)≥R(Q−1B)−(n−r)=R(B)−(n−r)R(\bm B_1)\geq R(\bm Q^{-1}\bm B)-(n-r)=R(\bm B)-(n-r)

R(B1​)≥R(Q−1B)−(n−r)=R(B)−(n−r)

从而

R(AB)≥R(A)+R(B)−nR(\bm A\bm B)\geq R(\bm A)+R(\bm B)-n

R(AB)≥R(A)+R(B)−n

伴随矩阵的秩的性质:

设 A\bm AA 为 n (n≥2)n\ (n\geq 2)n (n≥2) 阶方阵, A∗\bm A^*A∗ 是 A\bm AA 的伴随矩阵,则:

当 R(A)=nR(\bm A)=nR(A)=n 时, R(A∗)=nR(\bm A^*)=nR(A∗)=n

当 R(A)=n−1R(\bm A)=n-1R(A)=n−1 时, R(A∗)=1R(\bm A^*)=1R(A∗)=1

当 R(A)

证明:

当 R(A)=nR(\bm A)=nR(A)=n 时,即 A\bm AA 为满秩矩阵,所以 ∣A∗∣=∣A∣n−1≠0|\bm A^*|=|\bm A|^{n-1}\neq 0∣A∗∣=∣A∣n−1=0 ,从而 R(A∗)=nR(\bm A^*)=nR(A∗)=n 。

当 R(A)=n−1R(\bm A)=n-1R(A)=n−1 时, ∣A∣=0|\bm A|=0∣A∣=0 ,所以 AA∗=∣A∣I=O\bm A\bm A^*=|\bm A|\bm I=\bm OAA∗=∣A∣I=O ,

由 R(A)+R(A∗)≤nR(\bm A)+R(\bm A^*)\leq nR(A)+R(A∗)≤n ,得 R(A∗)≤1R(\bm A^*)\leq 1R(A∗)≤1 ,

又因为 R(A)=n−1≥1R(\bm A)=n-1\geq 1R(A)=n−1≥1 ,所以 A∗\bm A^*A∗ 是非零矩阵,从而有 R(A∗)≥1R(\bm A^*)\geq 1R(A∗)≥1 ,故 R(A∗)=1R(\bm A^*)=1R(A∗)=1 。

当 R(A)

向量组的线性相关性

向量组的等价关系:

设 α1,α2,⋯ ,αs\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_sα1​,α2​,⋯,αs​ 为 nnn 维向量组, k1,k2,⋯ ,ksk_1,k_2,\cdots,k_sk1​,k2​,⋯,ks​ 为一组数,则下式

k1α1+k2α2+⋯+ksαsk_1\bm\alpha_1+k_2\bm\alpha_2+\cdots+k_s\bm\alpha_s

k1​α1​+k2​α2​+⋯+ks​αs​

称为该向量组的一个线性组合, k1,k2,⋯ ,ksk_1,k_2,\cdots,k_sk1​,k2​,⋯,ks​ 称为该线性组合的系数。若一个向量 α\bm\alphaα 可以被表示为一个向量组的线性组合,则称向量 α\bm\alphaα 可以被该向量组线性表示。

若一个向量组中的每一个向量都能由另一个向量组线性表示,即两个向量组能够互相线性表示,则称这两个向量组等价。

向量组的等价关系具有反身性,对称性和传递性。

线性相关:

若对于向量组 α1,α2,⋯ ,αs\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_sα1​,α2​,⋯,αs​ ,存在不全为零的数 λ1,λ2,⋯ ,λs\lambda_1,\lambda_2,\cdots,\lambda_sλ1​,λ2​,⋯,λs​ ,使得

λ1α1+λ2α2+⋯+λsαs=0\lambda_1\bm\alpha_1+\lambda_2\bm\alpha_2+\cdots+\lambda_s\bm\alpha_s=0

λ1​α1​+λ2​α2​+⋯+λs​αs​=0

则称向量组 α1,α2,⋯ ,αs\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_sα1​,α2​,⋯,αs​ 线性相关,否则,称 α1,α2,⋯ ,αs\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_sα1​,α2​,⋯,αs​ 线性无关。

线性无关的判别方法:如果存在数 λ1,λ2,⋯ ,λs\lambda_1,\lambda_2,\cdots,\lambda_sλ1​,λ2​,⋯,λs​ ,使得 λ1α1+λ2α2+⋯+λsαs=0\lambda_1\bm\alpha_1+\lambda_2\bm\alpha_2+\cdots+\lambda_s\bm\alpha_s=0λ1​α1​+λ2​α2​+⋯+λs​αs​=0 ,则必然 λ1=λ2=⋯=λs=0\lambda_1=\lambda_2=\cdots=\lambda_s=0λ1​=λ2​=⋯=λs​=0 。

单个向量 α\bm\alphaα 线性相关的充分条件是 α=0\bm\alpha=\bm 0α=0 。

两个向量线性相关的充要条件是它们对应的分量成比例。

线性相关向量组的任何扩大组必线性相关,即若 α1,α2,⋯ ,αs\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_sα1​,α2​,⋯,αs​ 线性相关,任意增加有限个向量 αs+1,⋯ ,αm\bm\alpha_{s+1},\cdots,\bm\alpha_mαs+1​,⋯,αm​ 所构成的新向量组 α1,α2,⋯ ,αs,αs+1,⋯ ,αm\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_s,\bm\alpha_{s+1},\cdots,\bm\alpha_mα1​,α2​,⋯,αs​,αs+1​,⋯,αm​ 仍然线性相关。

线性无关向量组的任何以一个非空部分向量组仍线性无关。

向量组 α1,α2,⋯ ,αs\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_sα1​,α2​,⋯,αs​ 线性相(无)关的充要条件是齐次线性方程组 x1α1+x2α2+⋯+xsαs=0x_1\bm\alpha_1+x_2\bm\alpha_2+\cdots+x_s\bm\alpha_s=\bm 0x1​α1​+x2​α2​+⋯+xs​αs​=0 有(无)非零解。

推论:

存在向量组 α1,α2,⋯ ,αs\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_sα1​,α2​,⋯,αs​ , 矩阵 A=[α1,α2,⋯ ,αs]\bm A=[\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_s]A=[α1​,α2​,⋯,αs​]

向量组线性相关的充要条件是 R(A)

向量组线性无关的充要条件是 R(A)=sR(\bm A)=sR(A)=s

nnn 个 nnn 维向量线性无关的充要条件是它们排成的 nnn 阶行列式值不为零。

m>nm>nm>n 时, mmm 个 nnn 维向量一定线性相关。

线性相关与线性表示的关系:

向量组 α1,α2,⋯ ,αs\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_sα1​,α2​,⋯,αs​ 线性相关的充要条件是该向量组中至少存在一个向量能由其余的 s−1s-1s−1 个向量线性表示。

设向量组 α1,α2,⋯ ,αs\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_sα1​,α2​,⋯,αs​ 线性无关,且向量 β\bm\betaβ 能由 α1,α2,⋯ ,αs\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_sα1​,α2​,⋯,αs​ 线性表示,则表示法是唯一的。

设向量组 α1,α2,⋯ ,αs\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_sα1​,α2​,⋯,αs​ 线性无关, 且向量组 α1,α2,⋯ ,αs,β\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_s,\bm\betaα1​,α2​,⋯,αs​,β 线性相关,则向量 β\bm\betaβ 能由 α1,α2,⋯ ,αs\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_sα1​,α2​,⋯,αs​ 唯一线性表示。

向量组的秩

对于向量组 A:α1,α2,⋯ ,αsA:\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_sA:α1​,α2​,⋯,αs​ ,如果存在 AAA 的部分向量组 A0:αj1,αj2,⋯ ,αjrA_0:\bm\alpha_{j_1},\bm\alpha_{j_2},\cdots,\bm\alpha_{j_r}A0​:αj1​​,αj2​​,⋯,αjr​​ ,满足:

向量组 A0A_0A0​ 线性无关;

向量组 AAA 中的任一向量可用 A0A_0A0​ 线性表示。

则称 A0A_0A0​ 是 AAA 的一个极大线性无关向量组,简称极大无关组,极大无关组所含的向量的个数 rrr 称为向量组 AAA 的秩,记作 R(α1,α2,⋯ ,αs)R(\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_s)R(α1​,α2​,⋯,αs​) ,向量组的秩是唯一确定的。

由上述定义我们可以推得如下结论:

向量组线性无关的充要条件是向量组的秩等于该组向量的个数;

向量组线性相关的充要条件是向量组的秩小于该组向量的个数。

向量组 AAA 的部分向量组 A0A_0A0​ 为 AAA 的极大无关组的充要条件是:

1)向量组 A0A_0A0​ 线性无关;

2)AAA 中任意 r+1r+1r+1 个向量都线性相关。

若向量组 AAA 的秩为 r (r>0)r\ (r>0)r (r>0) ,则 AAA 中任意 rrr 个线性无关的向量都是 AAA 的一个极大无关组。

性质:

向量组与它的任意一个极大无关组等价。

推论:一向量组的任意两个极大无关组等价。

设向量组 AAA 能由向量组 BBB 线性表示,则 R(A)≤R(B)R(A)\leq R(B)R(A)≤R(B) 。

等价向量组的秩相同。

矩阵的行秩与列秩

有了向量组的秩的概念后,我们就可以定义矩阵的行秩和列秩:矩阵的行向量组的秩称为矩阵的行秩,列向量组的秩称为列秩。

事实上,矩阵的秩 === 矩阵的行秩 === 矩阵的列秩。

证明:

设矩阵 A\bm AA 的秩 R(A)=rR(\bm A)=rR(A)=r ,并设 rrr 阶子式 Dr≠0D_r\neq 0Dr​=0 。

由 Dr≠0D_r\neq 0Dr​=0 可知 DrD_rDr​ 所在的 rrr 个列向量都线性无关;又由 A\bm AA 中所有 r+1r+1r+1 阶子式的值均为零,可知 A\bm AA 中任意 r+1r+1r+1 个列向量都线性相关,

因此, DrD_rDr​ 所在的 rrr 个列是 A\bm AA 的列向量组的一个极大无关组,所以 A\bm AA 的列秩等于 rrr ,即矩阵 A\bm AA 的秩等于列秩。

由 R(A)=R(AT)R(\bm A)=R(\bm A^T)R(A)=R(AT) ,而 AT\bm A^TAT 的列秩就是 A\bm AA 的行秩,同理可证得,矩阵 A\bm AA 的秩等于行秩。

因为初等变换不改变矩阵的秩,从而不改变行秩和列秩,因此可以用初等变换来求向量组的秩和极大无关组:

例: 有一向量组 {α1,α2,α3,α4,α5}\{\bm\alpha_1,\bm\alpha_2,\bm\alpha_3,\bm\alpha_4,\bm\alpha_5\}{α1​,α2​,α3​,α4​,α5​} ,将该向量组写成矩阵形式,并进行初等行变换,得到:

[α1,α2,α3,α4,α5]→[1a1a2a3a401b1b2b30001c100000][\bm\alpha_1,\bm\alpha_2,\bm\alpha_3,\bm\alpha_4,\bm\alpha_5]\rightarrow\begin{bmatrix}1&a_1&a_2&a_3&a_4\\0&1&b_1&b_2&b_3\\0&0&0&1&c_1\\0&0&0&0&0\end{bmatrix}

[α1​,α2​,α3​,α4​,α5​]→​1000​a1​100​a2​b1​00​a3​b2​10​a4​b3​c1​0​​

取非零行的首非零元所在的列,可以得到一个三阶非零子式:

D=∣1a1a301b2001∣D=\begin{vmatrix}1&a_1&a_3\\0&1&b_2\\0&0&1\end{vmatrix}

D=​100​a1​10​a3​b2​1​​

从而该向量组的秩为3, α1,α2,α4\bm\alpha_1,\bm\alpha_2,\bm\alpha_4α1​,α2​,α4​ 是该向量组的一个极大无关组。

有了前面的理论,我们将方便地用向量组地秩地结论讨论矩阵秩的有关结论:

证明: R(AB)≤min⁡{R(A),R(B)}R(\bm A\bm B)\leq\min\{R(\bm A),R(\bm B)\}R(AB)≤min{R(A),R(B)}

记 Cm×n=Am×nBn×p\bm C_{m \times n}=\bm A_{m \times n}\bm B_{n \times p}Cm×n​=Am×n​Bn×p​ ,并设

C=[c1,c2,⋯ ,cp]A=[a1,a2,⋯ ,an]B=[bij]\bm C=[\bm c_1,\bm c_2,\cdots,\bm c_p]\\

\bm A=[\bm a_1,\bm a_2,\cdots,\bm a_n]\\

\bm B=[b_{ij}]C=[c1​,c2​,⋯,cp​]A=[a1​,a2​,⋯,an​]B=[bij​]

[c1,c2,⋯ ,cp]=[a1,a2,⋯ ,an][b11⋱bnp][\bm c_1,\bm c_2,\cdots,\bm c_p]=[\bm a_1,\bm a_2,\cdots,\bm a_n]\begin{bmatrix}b_{11}&&\\&\ddots&\\&&b_{np}\end{bmatrix}

[c1​,c2​,⋯,cp​]=[a1​,a2​,⋯,an​]​b11​​⋱​bnp​​​

可知,矩阵 C\bm CC 的列向量能用 A\bm AA 的列向量线性表示,所以

R(C)≤R(A)R(\bm C)\leq R(\bm A)

R(C)≤R(A)

又因为 CT=BTAT\bm C^T=\bm B^T\bm A^TCT=BTAT ,用类似的方法证明可得 R(CT)≤R(BT)R(\bm C^T)\leq R(\bm B^T)R(CT)≤R(BT) ,即

R(C)≤R(B)R(\bm C)\leq R(\bm B)

R(C)≤R(B)

综上所述,可以证得:

R(AB)≤min⁡{R(A),R(B)}R(\bm A\bm B)\leq\min\{R(\bm A),R(\bm B)\}

R(AB)≤min{R(A),R(B)}

证明: R(A+B)≤R(A)+R(B)R(\bm A+\bm B)\leq R(\bm A)+R(\bm B)R(A+B)≤R(A)+R(B)

显然 A+B\bm A+\bm BA+B 的列向量组可由 A\bm AA 的列向量组和 B\bm BB 的列向量组线性表示。

设 R(A)=s,R(B)=tR(\bm A)=s,R(\bm B)=tR(A)=s,R(B)=t ,不妨设 α1,α2,⋯ ,αs\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_sα1​,α2​,⋯,αs​ 是 A\bm AA 的一个极大无关组, β1,β2,⋯ ,βt\bm\beta_1,\bm\beta_2,\cdots,\bm\beta_tβ1​,β2​,⋯,βt​ 是 B\bm BB 的一个极大无关组。

由于向量组和它的极大无关组等价,由传递性可知 A+B\bm A+\bm BA+B 的列向量组可由向量组 α1,α2,⋯ ,αs\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_sα1​,α2​,⋯,αs​ 和 β1,β2,⋯ ,βt\bm\beta_1,\bm\beta_2,\cdots,\bm\beta_tβ1​,β2​,⋯,βt​ 线性表示,因此

R(A+B)≤R(α1,⋯ ,αs,β1,⋯ ,βt)≤s+t=R(A)+R(B)\begin{aligned}R(\bm A+\bm B)&\leq R(\bm\alpha_1,\cdots,\bm\alpha_s,\bm\beta_1,\cdots,\bm\beta_t)\\

&\leq s+t\\

&=R(\bm A)+R(\bm B)\end{aligned}R(A+B)​≤R(α1​,⋯,αs​,β1​,⋯,βt​)≤s+t=R(A)+R(B)​

秩的几何意义

我们可以将矩阵写成列向量组的形式 A=[α1,α2,⋯ ,αn]\bm A=[\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_n]A=[α1​,α2​,⋯,αn​] ,这些列向量可以张成一个列空间,即线性表示出的向量

α=x1α1+x2α2+⋯+xnαn\bm\alpha=x_1\bm\alpha_1+x_2\bm\alpha_2+\cdots+x_n\bm\alpha_n

α=x1​α1​+x2​α2​+⋯+xn​αn​

所形成的空间。而秩所代表的,就是这样一个列空间的维度。

而矩阵变换就是将原来的向量变换到列空间中,因此列空间的维度就是变换后向量的维度,即矩阵的秩就是向量在经过这一矩阵变换后所处的空间维度。

由此,我们可以得到秩的几何意义:

秩是列空间的维度。

秩是图像经过矩阵变换后的空间维度。

解线性方程组

一般地, nnn 个未知量 mmm 个方程的线性方程组可以表示为:

{a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b1⋯am1x1+am2x2+⋯+amnxn=b1\left\{\begin{aligned}

&a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1\\

&a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=b_1\\

&\qquad\qquad\qquad\cdots\\

&a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n=b_1

\end{aligned}\right.⎩⎨⎧​​a11​x1​+a12​x2​+⋯+a1n​xn​=b1​a21​x1​+a22​x2​+⋯+a2n​xn​=b1​⋯am1​x1​+am2​x2​+⋯+amn​xn​=b1​​

可以记作

A=[a11⋱amn],x=[x1x2⋮xn],b=[b1b2⋮bn]\bm A=\begin{bmatrix}a_{11}&&\\&\ddots&\\&&a_{mn}\end{bmatrix},\bm x=\begin{bmatrix}x_1\\x_2\\\vdots\\x_n\end{bmatrix},\bm b=\begin{bmatrix}b_1\\b_2\\\vdots\\b_n\end{bmatrix}

A=​a11​​⋱​amn​​​,x=​x1​x2​⋮xn​​​,b=​b1​b2​⋮bn​​​

Ax=b\bm{Ax}=\bm b

Ax=b

称 m×nm\times nm×n 矩阵 A\bm AA 为线性方程组的系数矩阵(Coefficient matrix),称 m×(n+1)m\times(n+1)m×(n+1) 矩阵 B=[A,b]\bm B=[\bm A,\bm b]B=[A,b] 为线性方程组的增广矩阵(Augmented matrix)。

当 b=0\bm b=0b=0 时,该线性方程组称作齐次线性方程组(Homogeneous linear equations);反之,当 b≠0\bm b\neq 0b=0 时,该线性方程组称作非齐次线性方程组(Nonhomogeneous linear equations)。

若找到常数 ξ1,ξ2,⋯ ,ξn\xi_1,\xi_2,\cdots,\xi_nξ1​,ξ2​,⋯,ξn​ 依次代替未知量 x1,x2,⋯ ,xnx_1,x_2,\cdots,x_nx1​,x2​,⋯,xn​ ,使方程组中所有方程均为恒等式,则此时方程组有解,并称向量

ξ=[x1x2⋮xn]\bm\xi=\begin{bmatrix}x_1\\x_2\\\vdots\\x_n\end{bmatrix}

ξ=​x1​x2​⋮xn​​​

为方程组的解向量,或说 x=ξ\bm x=\bm\xix=ξ 是 Ax=b\bm{Ax}=\bm bAx=b 的解。

线性方程组有解时,该线性方程组是相容的(Consistent),否则是不相容的(Inconsistent)。

克莱姆法则(Cramer’s rule)

nnn 个未知量 nnn 个方程的线性方程组 Ax=b\bm{Ax}=\bm bAx=b ,若 ∣A∣≠0|\bm A|\neq 0∣A∣=0 ,则方程组有唯一解:

xj=Dj∣A∣,j=1,2,⋯ ,nx_j=\frac{D_j}{|\bm A|},\quad j=1,2,\cdots,n

xj​=∣A∣Dj​​,j=1,2,⋯,n

其中 DjD_jDj​ 是以 b\bm bb 的元素代替 ∣A∣|\bm A|∣A∣ 中第 jjj 列所得到的行列式。

这实际上就是 x=A−1b\bm x=\bm A^{-1}\bm bx=A−1b 的展开形式。

证明:

充分性:

因为 ∣A∣≠0|\bm A|\neq 0∣A∣=0 ,所以 A\bm AA 可逆,那么显然 x0=A−1b\bm x_0=\bm A^{-1}\bm bx0​=A−1b 是方程组的一个解,又设有另一个不同于 x1\bm x_1x1​ 的解 x1\bm x_1x1​ 使得 Ax1=b\bm{Ax}_1=\bm bAx1​=b ,两边同时左乘 A−1\bm A^{-1}A−1 得

A−1(Ax1)=A−1b=x0\bm A^{-1}(\bm{Ax}_1)=\bm A^{-1}\bm b=\bm x_0

A−1(Ax1​)=A−1b=x0​

又因为

A−1(Ax1)=(A−1A)x1=Ix1=x1\bm A^{-1}(\bm{Ax}_1)=(\bm A^{-1}\bm A)\bm x_1=\bm I\bm x_1=\bm x_1

A−1(Ax1​)=(A−1A)x1​=Ix1​=x1​

则 x1=x0\bm x_1=\bm x_0x1​=x0​ 产生矛盾,因此不存在和 x0\bm x_0x0​ 不同的解。

必要性:

设方程组存在唯一解 x0\bm x_0x0​ ,若 A\bm AA 不可逆,则齐次线性方程组 Ax=0\bm{Ax}=\bm 0Ax=0 有非零解 x1\bm x_1x1​ ,使得

A(x0+x1)=Ax0+Ax1=b+0=b\bm A(\bm x_0+\bm x_1)=\bm{Ax}_0+\bm{Ax}_1=\bm b+\bm 0=\bm b

A(x0​+x1​)=Ax0​+Ax1​=b+0=b

因此 x0+x1\bm x_0+\bm x_1x0​+x1​ 也是方程组的解,与方程组有唯一解产生矛盾,故 A\bm AA 必然可逆。

消元法

设非齐次线性方程组 Ax=b\bm{Ax}=\bm bAx=b ,其中 A=(aij)m×n\bm A=(a_{ij})_{m\times n}A=(aij​)m×n​ ,且 R(A)=rR(\bm A)=rR(A)=r 。

不妨设矩阵 A\bm AA 的前 rrr 列中有 rrr 阶非零子式,对增广矩阵 B=[A,b]\bm B=[\bm A,\bm b]B=[A,b] 施以行的换法变换,将非零子式所在的行调整至前 rrr 行,再经过若干次初等行变换,将 B\bm BB 化为行最简矩阵:

(C,d)=[10⋯0c1,r+1⋯c1nd11⋱⋮⋮⋮⋮⋱0cr−1,r+1⋯cr−1,ndr−11cr,r+1⋯crndr0⋯0dr+10⋯00⋮⋮⋮0⋯00](\bm C,\bm d)=\begin{bmatrix}

1&0&\cdots&0&c_{1,r+1}&\cdots&c_{1n}&d_1\\

&1&\ddots&\vdots&\vdots&&\vdots&\vdots\\

&&\ddots&0&c_{r-1,r+1}&\cdots&c_{r-1,n}&d_{r-1}\\

&&&1&c_{r,r+1}&\cdots&c_{rn}&d_r\\

&&&&0&\cdots&0&d_{r+1}\\

&&&&0&\cdots&0&0\\

&&&&\vdots&&\vdots&\vdots\\

&&&&0&\cdots&0&0

\end{bmatrix}(C,d)=​1​01​⋯⋱⋱​0⋮01​c1,r+1​⋮cr−1,r+1​cr,r+1​00⋮0​⋯⋯⋯⋯⋯⋯​c1n​⋮cr−1,n​crn​00⋮0​d1​⋮dr−1​dr​dr+1​0⋮0​​

它所对应的与原方程 Ax=b\bm{Ax}=\bm bAx=b 同解的方程组为:

{x1+c1,r+1xr+1+⋯c1nxn=d1x2+c2,r+1xr+1+⋯c1nxn=d2⋯xr+cr,r+1xr+1+⋯+crn=dr0=dr+10=0⋯0=0\left\{\begin{matrix}

x_1&&&+c_{1,r+1}x_{r+1}&+\cdots&c_{1n}x_n&=&d_1\\

&x_2&&+c_{2,r+1}x_{r+1}&+\cdots&c_{1n}x_n&=&d_2\\

&&&&&\cdots\\

&&x_r&+c_{r,r+1}x_{r+1}&+\cdots&+c_{rn}&=&d_r\\

&&&&&0&=&d_{r+1}\\

&&&&&0&=&0\\

&&&&&\cdots\\

&&&&&0&=&0\\

\end{matrix}\right.⎩⎨⎧​x1​​x2​​xr​​+c1,r+1​xr+1​+c2,r+1​xr+1​+cr,r+1​xr+1​​+⋯+⋯+⋯​c1n​xn​c1n​xn​⋯+crn​00⋯0​======​d1​d2​dr​dr+1​00​

由于初等变换不改变矩阵的秩,所以

R(A)=R(C)=rR(\bm A)=R(\bm C)=r

R(A)=R(C)=r

从而

R(A,b)=R(C,d)={r,dr+1=0r+1,dr+1≠0R(\bm A,\bm b)=R(\bm C,\bm d)=\left\{\begin{aligned}&r,&d_{r+1}=0\\&r+1,&d_{r+1}\neq 0\end{aligned}\right.

R(A,b)=R(C,d)={​r,r+1,​dr+1​=0dr+1​=0​

当 dr+1≠0d_{r+1}\neq 0dr+1​=0 时,方程组的第 r+1r+1r+1 个方程产生矛盾,故方程组无解。

当 dr+1=0d_{r+1}=0dr+1​=0 时, R(A,b)=R(A)=rR(\bm A,\bm b)=R(\bm A)=rR(A,b)=R(A)=r ,若 r=nr=nr=n ,则方程组有唯一解

xj=dj(j=1,2,⋯ ,n)x_j=d_j\quad(j=1,2,\cdots,n)

xj​=dj​(j=1,2,⋯,n)

若 r

{x1=d1−c1,r+1xr+1−⋯−c1nxnx2=d2−c2,r+1xr+1−⋯−c2nxn⋯xr=dr−cr,r+1xr+1−⋯−crnxn\left\{\begin{aligned}

x_1=d_1-c_{1,r+1}x_{r+1}-\cdots-c_{1n}x_n\\

x_2=d_2-c_{2,r+1}x_{r+1}-\cdots-c_{2n}x_n\\

\cdots\qquad\qquad\qquad\qquad\\

x_r=d_r-c_{r,r+1}x_{r+1}-\cdots-c_{rn}x_n\\

\end{aligned}\right.⎩⎨⎧​x1​=d1​−c1,r+1​xr+1​−⋯−c1n​xn​x2​=d2​−c2,r+1​xr+1​−⋯−c2n​xn​⋯xr​=dr​−cr,r+1​xr+1​−⋯−crn​xn​​

由此可见,任给 xr+1,xr+2,⋯ ,xnx_{r+1},x_{r+2},\cdots,x_nxr+1​,xr+2​,⋯,xn​ 的一组值,就可以确定对应的 x1,x2,⋯ ,xrx_1,x_2,\cdots,x_rx1​,x2​,⋯,xr​ 的值,由此得到方程组的一个解。此时,方程组拥有无穷多个解,称 xr+1,xr+2,⋯ ,xnx_{r+1},x_{r+2},\cdots,x_nxr+1​,xr+2​,⋯,xn​ 为一组自由未知量。

综合以上讨论,我们可以得到以下几个定理。

线性方程组解的存在定理:

nnn 元非齐次线性方程组 Ax=b\bm{Ax}=\bm bAx=b 有解的充要条件是 R(A)=R(A,b)R(\bm A)=R(\bm A,\bm b)R(A)=R(A,b)

有无穷多解: R(A)=R(A,b)

有唯一解: R(A)=R(A,b)=nR(\bm A)=R(\bm A,\bm b)=nR(A)=R(A,b)=n

nnn 元齐次线性方程组 Ax=0\bm{Ax}=\bm 0Ax=0 有非零解的充要条件是 R(A)

仅有零解的充要条件是 R(A)=nR(\bm A)=nR(A)=n

解的结构

针对方程组具有无穷多解的情况,我们需要讨论解的结构。

齐次线性方程组解的结构:

设 ξ1,ξ2,⋯ ,ξt\bm\xi_1,\bm\xi_2,\cdots,\bm\xi_tξ1​,ξ2​,⋯,ξt​ 是齐次线性方程组的解,并且

ξ1,ξ2,⋯ ,ξt\bm\xi_1,\bm\xi_2,\cdots,\bm\xi_tξ1​,ξ2​,⋯,ξt​ 线性无关;

方程组的任一解都可以用 ξ1,ξ2,⋯ ,ξt\bm\xi_1,\bm\xi_2,\cdots,\bm\xi_tξ1​,ξ2​,⋯,ξt​ 线性表示,

则称 ξ1,ξ2,⋯ ,ξt\bm\xi_1,\bm\xi_2,\cdots,\bm\xi_tξ1​,ξ2​,⋯,ξt​ 是方程组的一个基础解系。

基础解系实际上就是全体解向量的一个极大无关组。

当方程组 Ax=0\bm{Ax}=\bm 0Ax=0 有非零解时,求其基础解系:

R(A)=r

C=[1⋯0c11⋯c1,n−r⋮⋮⋮⋮0⋯1cr1⋯cr,n−r0⋯00⋯0⋮⋮⋮⋮0⋯00⋯0]\bm C=\begin{bmatrix}

1&\cdots&0&c_{11}&\cdots&c_{1,n-r}\\

\vdots&&\vdots&\vdots&&\vdots\\

0&\cdots&1&c_{r1}&\cdots&c_{r,n-r}\\

0&\cdots&0&0&\cdots&0\\

\vdots&&\vdots&\vdots&&\vdots\\

0&\cdots&0&0&\cdots&0\\

\end{bmatrix}C=​1⋮00⋮0​⋯⋯⋯⋯​0⋮10⋮0​c11​⋮cr1​0⋮0​⋯⋯⋯⋯​c1,n−r​⋮cr,n−r​0⋮0​​

与 C\bm CC 对应的方程组为:

{x1=−c11xr+1−⋯−c1,n−rxnx2=−c21xr+1−⋯−c2,n−rxn⋯xr=−cr1xr+1−⋯−cr,n−rxn\left\{\begin{aligned}

x_1=-c_{11}x_{r+1}-\cdots-c_{1,n-r}x_n\\

x_2=-c_{21}x_{r+1}-\cdots-c_{2,n-r}x_n\\

\cdots\qquad\qquad\qquad\\

x_r=-c_{r1}x_{r+1}-\cdots-c_{r,n-r}x_n\\

\end{aligned}\right.⎩⎨⎧​x1​=−c11​xr+1​−⋯−c1,n−r​xn​x2​=−c21​xr+1​−⋯−c2,n−r​xn​⋯xr​=−cr1​xr+1​−⋯−cr,n−r​xn​​

这个方程组是原方程组的一个同解方程组。

现在令 xr+1,⋯ ,xnx_{r+1},\cdots,x_nxr+1​,⋯,xn​ 分别取下列数:

[xr+1xr+2⋮xn]=[10⋮0],[01⋮0],⋯ ,[00⋮1]\begin{bmatrix}x_{r+1}\\x_{r+2}\\\vdots\\x_n\end{bmatrix}=\begin{bmatrix}1\\0\\\vdots\\0\end{bmatrix},\begin{bmatrix}0\\1\\\vdots\\0\end{bmatrix},\cdots,\begin{bmatrix}0\\0\\\vdots\\1\end{bmatrix}

​xr+1​xr+2​⋮xn​​​=​10⋮0​​,​01⋮0​​,⋯,​00⋮1​​

则由上述方程组可以依次求得:

[xr+1xr+2⋮xn]=[−c11−c21⋮−cr1],[−c12−c22⋮−cr2],⋯ ,[−c1,n−r−c2,n−r⋮−cr,n−r]\begin{bmatrix}x_{r+1}\\x_{r+2}\\\vdots\\x_n\end{bmatrix}=\begin{bmatrix}-c_{11}\\-c_{21}\\\vdots\\-c_{r1}\end{bmatrix},\begin{bmatrix}-c_{12}\\-c_{22}\\\vdots\\-c_{r2}\end{bmatrix},\cdots,\begin{bmatrix}-c_{1,n-r}\\-c_{2,n-r}\\\vdots\\-c_{r,n-r}\end{bmatrix}

​xr+1​xr+2​⋮xn​​​=​−c11​−c21​⋮−cr1​​​,​−c12​−c22​⋮−cr2​​​,⋯,​−c1,n−r​−c2,n−r​⋮−cr,n−r​​​

从而求得方程组的 n−rn-rn−r 个解:

ξ1=[−c11−c21⋮−cr110⋮0],ξ2=[−c12−c22⋮−cr201⋮0],⋯ ,ξn−r=[−c1,n−r−c2,n−r⋮−cr,n−r00⋮1]\bm\xi_1=\begin{bmatrix}-c_{11}\\-c_{21}\\\vdots\\-c_{r1}\\1\\0\\\vdots\\0\end{bmatrix},\bm\xi_2=\begin{bmatrix}-c_{12}\\-c_{22}\\\vdots\\-c_{r2}\\0\\1\\\vdots\\0\end{bmatrix},\cdots,\bm\xi_{n-r}=\begin{bmatrix}-c_{1,n-r}\\-c_{2,n-r}\\\vdots\\-c_{r,n-r}\\0\\0\\\vdots\\1\end{bmatrix}

ξ1​=​−c11​−c21​⋮−cr1​10⋮0​​,ξ2​=​−c12​−c22​⋮−cr2​01⋮0​​,⋯,ξn−r​=​−c1,n−r​−c2,n−r​⋮−cr,n−r​00⋮1​​

ξ1,ξ2,⋯ ,ξn−r\bm\xi_1,\bm\xi_2,\cdots,\bm\xi_{n-r}ξ1​,ξ2​,⋯,ξn−r​ 就是方程组的一个基础解系,方程组的所有解都可以由其线性表示,称之为方程组的通解:

x=k1ξ1+k2ξ2+⋯+kn−rξn−r\bm x=k_1\bm\xi_1+k_2\bm\xi_2+\cdots+k_{n-r}\bm\xi_{n-r}

x=k1​ξ1​+k2​ξ2​+⋯+kn−r​ξn−r​

基础解系并不是唯一的,对于有非零解的齐次线性方程组,它的任意 n−rn-rn−r 个线性无关的解向量都可以构成一个基础解系,在实际求解方程组时,自由未知量的选择也并不是唯一的。

非齐次线性方程组解的结构:

设 x=η\bm x=\bm\etax=η 和 x=η0\bm x=\bm\eta_0x=η0​ 是非齐次线性方程组 Ax=b\bm{Ax}=\bm bAx=b 的解,则

A(η−η0)=Aη−Aη0=b−b=0\bm A(\bm\eta-\bm\eta_0)=\bm{A\eta}-\bm{A\eta}_0=\bm b-\bm b=\bm 0

A(η−η0​)=Aη−Aη0​=b−b=0

因此 x=η−η0\bm x=\bm\eta-\bm\eta_0x=η−η0​ 是其对应的齐次线性方程组 Ax=0\bm{Ax}=\bm 0Ax=0 的解。

设 x=η\bm x=\bm\etax=η 是非齐次线性方程组 Ax=b\bm{Ax}=\bm bAx=b 的解, x=ξ\bm x=\bm\xix=ξ 是其对应的齐次线性方程组 Ax=0\bm{Ax}=\bm 0Ax=0 的解,则

A(ξ+η)=Aξ+Aη=0+b=b\bm A(\bm\xi+\bm\eta)=\bm{A\xi}+\bm{A\eta}=\bm 0+\bm b=\bm b

A(ξ+η)=Aξ+Aη=0+b=b

因此 x=ξ+η\bm x=\bm\xi+\bm\etax=ξ+η 也是 Ax=b\bm{Ax}=\bm bAx=b 的解。

由此,我们可以证得非齐次线性方程组解的结构定理:

设 ξ1,ξ2,⋯ ,ξn−r\bm\xi_1,\bm\xi_2,\cdots,\bm\xi_{n-r}ξ1​,ξ2​,⋯,ξn−r​ 是 Ax=0\bm{Ax}=\bm 0Ax=0 的基础解系,存在一组常数 k1,k2,⋯ ,kn−rk_1,k_2,\cdots,k_{n-r}k1​,k2​,⋯,kn−r​ ,使得

η−η0=k1ξ1+k2ξ2+⋯+kn−rξn−r\bm\eta-\bm\eta_0=k_1\bm\xi_1+k_2\bm\xi_2+\cdots+k_{n-r}\bm\xi_{n-r}

η−η0​=k1​ξ1​+k2​ξ2​+⋯+kn−r​ξn−r​

所以 Ax=b\bm{Ax}=\bm bAx=b 的通解为:

η=k1ξ1+k2ξ2+⋯+kn−rξn−r+η0\bm\eta=k_1\bm\xi_1+k_2\bm\xi_2+\cdots+k_{n-r}\bm\xi_{n-r}+\bm\eta_0

η=k1​ξ1​+k2​ξ2​+⋯+kn−r​ξn−r​+η0​

综上所述,只要找到非齐次线性方程组对应的齐次线性方程组的基础解系和非齐次线性方程组的一个解,就可以求出非齐次线性方程组的通解。