从零开始学习线性代数:再谈【基】
上篇笔记正式引入了三个基本概念 —— 【基】、【向量】和【矩阵】,非正式引入了【向量空间】的概念,其中,我认为,最最重要的概念就是【基】。
首先,对于【基】的概念,我们有三种称呼:【基数】,这是指一维空间中的【基】,表达方式是一个实数;【基向量】,这是指多维空间中每个维度的【基】,表达方式是一个相应维度的实数向量;【基】,这是指多维空间的【基】,表达方式是相应维度的方形矩阵。
在谈论一维的数轴空间的【基数】时,我们提到,自然数作为一个数系,它的基数是1,正是有了1作为基数,我们才在小时候学会了数数。【基数】决定了数集的性质。基数是1,这个数集就是自然数,基数是2,这个数集就是偶数,基数是其它任意自然数n,这个数集就是以n作为基数的等差数列,例如:5, 10, 15, 20, 25,...这个数集的【基】是5,而10, 20, 30, 40, 50,... 这个数集的【基】是10。
由此我们获得了一个重要结论,要学习研究一个数集,首先要确认这个数集的【基】什么,【基】是代数研究中一个非常重要的概念。例如在抽象代数关于「群」的定义中,【基】就是其中性质之一,不过,这个时候不叫作【基】,而叫作【单位元】(identity)。我们会在后面的笔记中详细讨论「代数结构」的概念以及向量空间的代数结构。从现在开始,我们要
- 把任何给定的独立实数n看作为是一个乘积,1 × n,除非n被当做标量
- 把任何实数的加法 m + n 看做是一个特殊的线性组合:1 × m + 1 × n
- 把向量、矩阵中的数看作是标量,在矩阵 × 向量 的表达式中,矩阵是【基】,矩阵中每个列向量是相应坐标周上的 基向量,而向量中的元素是相应坐标轴上 基向量 的【标量】。合起来,矩阵是基,向量是矩阵的标量。
上述这三点要切记!!切记!!如果不太理解,一定要深入思考直到透彻理解。如果你真的理解了这一层,相信你会对线性代数的思维方式会发生巨大的变化、对线性代数的所有内容都会有全新的认识。
下面,我们来详细研究二维空间的【基向量】和空间的【基】。和数轴上的基数一样,【基向量】也不必是 ( (1, 0), (0, 1) ),可以由任何向量充当。但是,首先让我们看一下当【基向量】是( (1, 0), (0, 1) )的情况,因为和自然数一样,这是【基】最简单的情况。这次,我们从几何 —— 平面直角坐标系的角度观察:
在下列坐标系中,有两个维度,通过水平的横坐标和垂直的纵坐标表示。整个坐标系空间由平行于横、纵两坐标的直线被分割成许多方形的小格子,每个小格子的边长为1,这就是空间的【基】。其中,从原点—— 两坐标轴的交叉处出发,分别向右、向上延伸1,得到两个向量,向右,得到向量 (1,0),向上得到向量(0,1),图中分别用戴了帽子的 i 和 j 表示(因字体缘故,这里仅用 i, j 表示)。这一对i和j就是这个向量空间中两个维度的基向量。可以用复合向量 ( i, j )表示。

和数一样,任何向量都可以以【基向量】与标量乘积和的形式表达,例如,(3, -2) 就是:
(1, 0) × 3 + (0, 1) × (-2) = (3, -2)
或者以【单元矩阵】作为空间的【基】:
| 1 0 | | 3 | | 0 1 | | -2 | = (3, -2)
如果用i和j代表【基向量】,则表达式为:
i · 3 + j · (-2) = 3i - 2j = (3, -2)
其几何表示为:

仔细观察向量(3, -2) 对角线形成的长方形,其中正好有3 × 2 个方格,因此,每个方格其实代表了这个空间的基向量 —— 也就是我们用单元矩阵表达的那个向量的向量:( (1,0), (0,1))。
现在,最令人感兴趣的问题来了,如果向量空间的【基】不再是单元矩阵,或者,每个维度的【基向量】不再是(1,0)和(0,1),而是由其它实数构成的向量,将会怎样?可以想象的是,坐标图上的那些小方格的形状将会发生改变,空间中的向量的大小、方向都会发生变化:

其中,左面的矩阵就是向量空间的【基】,而列向量则是每个维度上的【标量】。现在我们来分析一下这个矩阵的结构。行向量(1, -3) 代表了新的「横」坐标,行向量(2, 4)代表了新的「纵」坐标。而作为由两个维度标量构成的向量(5, 7),在经过【基】的变化之后,也成为另一个向量(-16,38)。这个变化的直观是这样的:

其中的白线是坐标轴,蓝线是新的【基】,灰线是原来的【基】。这就是向量的线性转换:给定一个输入向量,通过改变该向量【基】,这个【基】通过一个矩阵表达,获得一个新的向量。如果把平面上的向量看做是由原点到点的有向线段,那么,通过转换就获得了一个新的线段,如果把向量看做是一个点,那么这个点从这个位置移到了另外一个位置,例如上例,点从(5,7)移动到了(-16,38)的位置。倘若坐标上的向量有多个,那么随着向量空间【基】的改变,所有向量都会产生移动:

这就是线性转换:给定一个向量,与代表向量空间的【基】进行乘法运算后,得到一个新向量:
转换 ( 输入向量) = 输出向量
这个转换的实质就是我们在上篇与本篇一直讨论的概念:【基】。向量空间的【基】是由一个 n × n 的方形矩阵构成。 线性转换与前面的「点」转换实质一样:转换过程中,坐标系的原点不能变,转换后的向量应当与转换前的向量具有同样的性质,这个性质用数学术语叫做「闭包」。
深刻理解了【基】的概念,就可以理解线性转换的意义,理解了线性转换也就牵住了线性代数的牛鼻子,可以说已经成功地掌握了线性代数的本质。