在中学阶段我们已经学过了大部分方程(组)的解法了。对于一些不太显然看出解的方程,我们通常需要将其变形为一些简洁的、可以直接看出解的形式。比如对于f(x)=g(x),两边经过相同的操作,变为\(\tilde f(x) = \tilde g(x)\)。但是我们的问题是,二者是否有相同的解,即定义\(\Omega \equiv \{ x|f(x) = g(x)\} \),\(\tilde \Omega \equiv {\rm{\{ }}x|\tilde f(x) = \tilde g(x)\} \),问是否有\(\Omega = \tilde \Omega \)?
答案自然是否定的。我们只能得到\(\Omega \subseteq \tilde \Omega \),因为变形的意思就是如果x满足f(x)=g(x),则能推出\(\tilde f(x) = \tilde g(x)\)。所以任意x∈Ω,有\(f(x) = g(x) \Rightarrow \tilde f(x) = \tilde g(x) \Rightarrow x \in \tilde \Omega \),因此\(\Omega \subseteq \tilde \Omega \)。这说明变形后,方程的解集会不变或者增多。比如x=1,对两边平方得到\({x^2} = 1\),解集增多了。所以方程变形过后得到了解,我们需要将其带回检验,看其是不是原方程的解(就像中学时期解分式方程,需要检验变形后的解是否是增根)。在写作业的时候,很多人解方程Ax=b(其中A可逆)的时候直接将两边乘以\({A^{ - 1}}\)得到\(x = {A^{ - 1}}b\),这样做的确没有错,但是出于严格性考虑,我建议尽量加一步验算步:\(x = {A^{ - 1}}b\)的时候的确有Ax=b,因此\(x = {A^{ - 1}}b\)的确为方程Ax=b的解。否则假设A只有左逆\({A^{左}}\),我们将得出\(x = {A^{左}}b\)的错误结论。
解集增多自然是我们不希望出现的坏情况。接下来要问了,何时解集不增多呢?这需要变形是可逆的,这样由\(\tilde f(x) = \tilde g(x)\)可变回f(x)=g(x),得出\(\tilde \Omega \subseteq \Omega \),因此\(\Omega = \tilde \Omega \)。
回到线性方程组Ax=b。对两边做线性行变换(即左乘一个矩阵P)得到PAx=Pb,将A化为一种特殊形状的梯形阵PA,以得方便到方程的解。我们希望方程的解不增多,就需要P可逆。由于任何可逆阵都可以分解为三种初等方阵的乘积,所以我们需要通过对方程做三种初等的行变换才能将方程化为比较简洁的形式同时又不使方程的解增多。因此在这里,我们发现的确可以将Ax=b的解写成x=\(x = {A^{ - 1}}b\)的形式。不过对于刚开始接触线代的人来说,我还是建议写作业尽量严谨一些。