线性代数的本质:线性组合
上篇笔记有三个重点:
1. 向量的加法和标量乘法
2. 二维向量的坐标和坐标系统
3. 基向量和向量空间的初步介绍
本篇接续上篇,对上篇引入的话题进行更深入的分析,进而介绍线性代数的三个重要概念:
【线性组合】(linear combination)、【生成空间】(span)、【基向量】(basis vector)
二、线性组合
线性组合,是一个全新的概念,离我们现存的熟悉的概念距离较远,因此我们的出发点,仍然是坐标系统,这是我们理解今天三个新概念的关键。
上一篇,我们大致介绍了平面直角坐标系的构成,这些知识虽然对大多数人来说是旧知识,但是其中蕴含着非常独特的新视角(不知你领悟到了没有?)。如果没有,也不要紧,现在,我们就来深入谈谈这个话题。
在一个平面二维坐标系统内,当你有有一个二维向量[3,-2],我希望读者把这一对数看做是两个标量。还记得我们上篇笔记结尾,提到基向量i,j,由这两个基向量经过标量乘法得到两个体量分别为mi和nj的向量吗?现在,把这个讨论再重复一遍:
设有一向量,其代数表示为[3,-2],其几何表示为下图:

现在我们把3和-2这两个数看叫做向量的坐标数,亦即,看做是该向量的两个标量,亦即,负责向量「体量」的量。

这样,就可以把这个向量看做是分别向x-轴的右方和y-轴的上方增加了3倍和-2倍体量的向量。

你可以想象这个向量在体量增大之前应当什么样吗?对了!就是体量为1向量。

这个向量,就是i+j。根据我们前一篇笔记,任何向量都可以看做另外两个向量的标量乘法和向量加法的和,这里i和j的标量都为1,因此构成i+j向量的另外两个向量分别是i和j。因此我们的现在的向量[3,-2]分别是是向量i向右体量增加了三倍,得到3i,向量j向下体量增加的-2倍得到-2j后,3i+(-2)j的和。结果如图:

这个和可以用前篇笔记正向量加法,首尾法确认:

这两个单元向量,i = [1,0],j = [0,1]称作xy坐标系统的基向量(basis vector)。这句话,切记!切记!这个基向量i和j,遍布我们整个「网格」坐标空间——向量空间(vector space)。

因此所有向量都可以看做是基向量经过标量乘法和向量加法运算后得到的结果:设任意向量为v,标量为m, n,那么,通过标量乘法,m·i、n·j,和向量加法,我们就获得向量
v = m · i + n · j
为此,再看一个例子:

基向量i经过-5倍放大,j经过2倍放大,二者相加,我们得到向量(-5)i+ (2)j,这个向量如果用代数法表示恰好就是[-5, 2]。所以,这个向量的一对坐标数,就是这个基向量标量-5,2倍放大。因此,描述向量的一对坐标数,就是该向量的标量,亦即,该向量的体量指标。换句话说,在一个给定的坐标系统内,任何一个向量,都对应着一个两个基向量。在我们目前的坐标系统内,这两个基向量恰好是沿着x-轴和y-轴的两个单位向量,i 和 j,亦即,任何一个给定的向量,都可以分解为两个基向量m、n倍的水平和垂直向量,我们基向量也恰好是沿着x、y-轴扩大体量。下面有趣的事情发生了。如果,一个给定的向量,它的基向量不是沿着x,y-轴扩大体量会怎么样?也就是说,我们的【基向量】不在x,y-轴上会怎么样?

结果就是,我们选择了一个完全不同的坐标系统。举个例子,现在有两个向量,它们的几何表示为:

但是,这一次,我们拿这两个向量作为我们新坐标系统的「坐标轴」,当前的向量的长度作为单位长,这样,我们就有了新的【基向量】。

现在,我们用这两个新的【基向量】做标量乘法,扩大或缩小其体量。

这时,我们有了两个新的基向量的标量乘积:1.50v 表示我们新的基向量v扩大了1.5倍,073w表示我们取得了新的基向量w的0.73倍。然后,和我们前面的做法一样,用这两个标量:1.5,和0.73,用首尾法将这两个向量相加,我们得到第三个向量,1.5v+0.6w

这个时候,如果我们改变【基向量】的标量——伸缩量,在不同的【基向量】的标量乘积下,我们就会得到各种不同的和向量。

向量v的系数(标量值)变成负数,这使得向量方向相反

w和v的标量全都变成负数

我们利用w和v向量的标量值和正负改变,可以使其和向量达到二维向量空间的任何位置。

最后,我们来看一下在新坐标系统下和旧坐标系统下紫色箭头所代表的向量值。在新系统下,向量值是:

其代数表示为:

下面看一下在旧坐标系统内的情况:

两个坐标系下向量值的比较:

上面,我们展示了另外一个坐标系统,尽管这个系统对大多读者来说还不像传统的直角坐标系那么直观,但是只要你真正理解了第一篇笔记的内容,会很容易抓住这里问题的关键:任何一个向量都是由它的【基向量】决定的。另一个常常被忽略的的事实是:我们有任何一对数描述一个向量时,实际上我们是隐含地选择了这个向量的【基向量】。所以每当你「伸缩」(scaling)两个基向量并得到两个向量之和时,你就会得到第三个向量,这第三个向量就叫做【线性组合】。
三、(线性)生成空间(span)
再说一遍,所谓线性组合就是两个基向量伸缩变化后的和。那么,这里的【线性】是什么意思?这种「线性组合」与直线有什么关系?完全展开,你会在下一篇笔记:《线性转换》中看到,现在,要理解【线性】的意义,只要把两个基向量其中的一个的伸缩量固,让另一个随意改变,我们就看出一些端倪。
例如下图中,我们固定w的标量为1,让它保持其【基向量】的体量,而让v向量伸缩变化





如果这次我们固定v,让w自由伸缩,则会产生这样的效果:





如果我们允许两个标量可以同时改变,

我们就会得到下列一系列向量:







从上面的一系列动画的截屏来看,每当两个基向量的标量——伸缩量改变时,就会得到一个新的向量,因此,只要有足够的耐心,我们会让这个向量空间占满。
当然,如果两个向量的方向相同,我们就会得到两个重叠的向量:

此时两个基向量重叠,因此就无法构成一个二维空间,只能是一维的直线的伸缩。



当然,还有一种可能性,两个向量均为0,此时,只剩下一个点。

可以看出,不同的线性组合可以得到不同的线性空间。当我们通过不断改变w和v的标量得到不同的线性组合时,所有这些线性组合——所有这些紫色向量的集合,称作w和v的【生成空间】(span)

其中,w和v是【基向量】,a和b分别是w和v的的标量。通过改变a、b的值就可以得到所有的线性组合。但是当两个基向量重合时,所谓「生成空间只是一维直线」。

此时,这两个重叠的向量不会生成不同于这条直线的任何线性组合,因此其中一个向量是多余的,因为这两个向量其中任何一个都可以得到同样的线性组合。这和两个不同【基向量】所产生的线性组合不同,没有「生产性」。
通过以上的演示和讨论,我们现在可以明白向量的基本性质是由向量加法和标量乘法决定的,同时,我们可以选择任意两个向量作为坐标系统的基向量,这样我们就可以有不同的坐标系统进而有不同的向量空间。
(未完待续)