线性代数空间理解

打印 上一主题 下一主题

主题 1930|帖子 1930|积分 5790

学习线性代数已经很久,但是在利用过程中仍旧还是不明所以,好比不知道特征向量和特征值的含义、矩阵的相乘是什么意思、怎样理解矩阵的秩……。随着遇到的次数越来越多,因此我决定需要对线性代数的本质做一次深刻的探讨了。
  本次重要是参考了3Blue1Brown和其他若干博客来对此睁开笔记的记录。
  需要说明的是,这里的是记录线性代数的本质,因此关于怎样计算的方法或者内容则相对较少。
  向量是什么

先抛出一个问题,什么是向量。这里存在着三个观点。虽然差别,但是存在着一定的联系。
重要由物理专业、计算机专业和数学专业三种角度来对待这个问题。



  • 物理学家以为,向量是空间中的箭头,决定一个向量的是它的长度和它所指的方向。因此只要在空间中,能够包管以上两个特征,那么就可以自由移动一个向量而保持不变。
  • 计算机专业的则以为,向量是有序数字列表
   这两种观点的存在就导致在利用或者讨论过程中存在两种观点,即向量到底是空间中的箭头,还是一组有序的序列?
  

  

  • 因此,数学家则实验概括这两种环境,其以为,向量只要包管两个向量相加数字与向量相乘有详细的含义,则向量可以是任何的东西。也正因如此,向量在利用过程中,可以将空间中的箭头转为对应的有序数列;而有序的序列也可以转为空间中的一个箭头(具有多少意义)。
           这里之所以被数学家以为只需要考虑加法和乘法,我以为是因为对于一个空间来说,根据一个坐标空间中的基向量,只用加法和乘法就是可以完全表示基向量所在的空间。因此不需要考虑其他的运算了。
        这个过程可以参考视频来理解。
因此,线性代数的意义有:
  1. 1. **为数据分析提供了一条将大量数据列表概念化和可视化的渠道,了解特定运算的含义。** 
  2. 1. **给物理学家和计算机程序员提供了一种语言,这样就可以通过计算机能处理数字,进一步而操纵空间。**
复制代码
线性变更和矩阵

先说线性变更。线性变更其实就是函数,只不外输入就是向量,输出还是向量而已。但是为什么从功能上来看是一样的利用,但是却要用两个概念来界说呢?
这是因为,线性变更体现在变更这个词上。The word “transformation” suggests that you think using movement. 也就是,线性变更就是一种向量的变更/运动

原则上,变更可以是多种多样的,但是线性代数将变更进行了束缚,即限制在线性的特殊变更上。
   这里说一下线性的两个特点,只要满意皆为线性变更:1)直线变更之后仍旧保持为直线;2)原点必须保持固定。
  假如要是从图形的角度上来看,那么借助带有网格线的坐标系来看,所谓的能够符合线性变更的界说的变更,就是变更之后的网格线仍旧保持平行且等距的特点。此时就可以以为是线性变更。
  下面只有第一个图才是线性变更,其他的都不是。
   
  
  
  
  那么接下来就引出“怎样用数值来描述这些线性变更呢?”这就要引出接下来要说的矩阵了。
先说一个列向量                                             V                            ^                                  =                         [                         1                         ,                         2                                   ]                            T                                       \hat V = [1,2]^T                  V^=[1,2]T,用基向量                                   i                         ,                         j                              i, j                  i,j可以在坐标系中表示如下:

那么我们进行坐标系的整体旋转。如下图所示,原坐标系为浅色细线构成,剪切后(视频中界说为Shear,它是一种拉伸。而旋转被界说为Rotation,它是常见的旋转利用)的坐标系为蓝色粗线构成。
此时基向量在原来的坐标系中表示为                                   [                         1                         ,                         −                         2                                   ]                            T                                       [1, -2]^T                  [1,−2]T和                                   [                         3                         ,                         0                                   ]                            T                                       [3, 0]^T                  [3,0]T。转变后的向量                                             V                            ^                                       \hat V                  V^等于                                   [                         5                         ,                         2                                   ]                            T                                       [5, 2]^T                  [5,2]T。


至此,便可以总结几点信息:

  • 在原直角坐标系中,基坐标                                        i                            =                            [                            1                            ,                            0                                       ]                               T                                      ,                            j                            =                            [                            0                            ,                            1                                       ]                               T                                            i=[1, 0]^T, j=[0, 1]^T                     i=[1,0]T,j=[0,1]T;
  • 向量的线性转化在公示上体现为左乘一个矩阵,该矩阵就是一个新坐标系的基(当然该矩阵的列向量可以线性相干,也可以线性无关。好比在二维平面中,线性相干就表示为两个重叠的基向量,那么就体现为一条直线了);
  • 线性变更的本质其实就是向量的空间变更
  • 其实这个过程也可以侧面说明,为什么数学家把向量的界说为向量只要包管两个向量相加和数字与向量相乘有详细的含义。在线性变更的过程中,也就只利用了加法和乘法两种运算就实现了线性变更。
  • 同时这也可以看出,只需要记录基向量,那么就可以表示出任意向量的落脚点。
线性变更的复合和矩阵乘法

先说结论:两矩阵相乘的多少意义,也就是两个线性变化的相继作用(multiplying two matrices like this has the geometric meaning of applying one transformation then another)
如下图所示,基向量经过两次复合变更。但是怎样记录这两次复合变更的过程。这就需要用到矩阵的相乘。

其实这就很简单,只需要按照变更的顺序,写出对应的变更矩阵就可以了,剩下的就是交给矩阵相乘。

行列式

   “The purpose of computation is insight, not numbers”—Richard Hamming
  在线性变更的时候,网格图的单位坐标会发生缩放,那么对于单位长度围成的图形来说,就可以计算出对应的面积。那么在缩放单位坐标时,所围成的图形的面积也跟着对应缩放。
在下图中,图形由原来的面积A变为6A,面积增长了6倍。此时就引出了行列式在多少中的界说:线性变更改变面积的比例被称为线性变更的行列式

这里还有一个特殊环境,就是当行列式为0时,那么对应的多少效果如下。这时候说明它将整个平面压缩到一条线上,甚至是在一个点上。

正是因为有这个特性,那么可以得出一个结论:只需要查验一个矩阵的行列式是否为0,我们就能相识这个矩阵所代表的变更是否将空间压缩到更小的维度上
换句话说,只有矩阵代表的变更将空间压缩到更低的维度时(空间压缩对应的就是矩阵的行列式为零),才会存在一个非零向量,使得矩阵和它的乘积向量为零向量。

实际上,特征值是存在为负数的环境的,那么该怎样理解缩放为负数倍的环境呢?
动画说明
这里以二维平面为例,从多少上来说,其实是空间上的一次翻转,就雷同一枚硬币,从正面翻转到反面的效果。
那么假如从基向量的角度上来看,那么就可以以为是两个基向量的相对位置发生了变更。详细如下面两张图所示.
   
  
  扩展相识:

  • 怎样理解为什么负的面积与定向(orientation)的改变有关?
  •                                         d                            e                            t                            (                            M                            )                            <                            0                                  det(M) \lt 0                     det(M)<0意味着什么? 在三维空间下是什么意思?
  • 怎样计算行列式?在多少层面行列式的计算证明。
矩阵的逆

矩阵的逆时应用在解方程组的时候利用的。
详细来说,对于一个线性变更                                    A                                   x                            ⃗                                  =                                   v                            ⃗                                       A \vec{x} = \vec{v}                  Ax             =v              ,其对应的多少变更如下图所示,即需要找到一个向量                                             x                            ⃗                                       \vec{x}                  x             在变更矩阵                                   A                              A                  A的作用下,使得与向量                                             v                            ⃗                                       \vec{v}                  v             重合(如粉赤色箭头所示)。
而矩阵的逆或者说逆变更则是指与向量                                             v                            ⃗                                       \vec{v}                  v             重合之后,通过线性变更再变回向量                                             x                            ⃗                                       \vec{x}                  x             。而此时的计算就变为了                                             x                            ⃗                                  =                                   A                                       −                               1                                                      v                            ⃗                                       \vec{x} = A^{-1} \vec{v}                  x             =A−1v             。这时就需要考虑$ A^{-1} $的环境
在#行列式#一节中说到,变更矩阵的行列式决定了该线性变更是否会产生压缩空间的环境发生。因此$ A^{-1}                                    有两种环境,即                              有两种环境,即                  有两种环境,即det(A)=?0$。
当                                   d                         e                         t                         (                         A                         )                         ≠                         0                              det(A) \ne 0                  det(A)=0时,就多少变更如下图所示(存在非零向量的变更)
   
  
    其实这两张图更直观地可以看出                                                   A                                           −                                  1                                                 A                            =                            E                                  A^{-1} A=E                     A−1A=E,表示什么变更都没有。
  假如                                   d                         e                         t                         (                         A                         )                         =                         0                              det(A) = 0                  det(A)=0时,那么在多少上就表示为变更空间压缩到更低的维度上。由于不能将一条线反转或者解压缩为一个平面(以2-D为例),因此就不存在这样的逆变更。

基变更

前文一直以来都是以标准的直角坐标系来当作基向量来说明向量。但是事实上,还是存在其他的基向量,好比下图中,两个基向量分别是                                                        b                               1                                      ⃗                                  ,                                              b                               2                                      ⃗                                       \vec{b_1}, \vec{b_2}                  b1​             ​,b2​             ​。那么对应的向量就是单位向量。
但是在标准的直角坐标系中,                                                        b                               1                                      ⃗                                  ,                                              b                               2                                      ⃗                                       \vec{b_1}, \vec{b_2}                  b1​             ​,b2​             ​就不是单位向量了(如下图)。
正是因为对基的差别选择,那么就造成了差别向量的表达。那么该怎样实现差别基下的向量转换呢?
好比,在新坐标系中,有一直量                                   [                                                                                     −                                        1                                                                                                              2                                                                   ]                              \begin{bmatrix} -1 \\ 2 \end{bmatrix}                  [−12​]。那么在标准的直角坐标系中应该是多少呢?

其实很简单,根据#线性变更和矩阵#章节的内容就可以知道,矩阵与向量的乘积就表示了基向量的转换。计算过程如下图所示。新坐标系中,基向量为                                                        b                               1                                      ⃗                                  =                                   [                                                                              2                                                                                                          1                                                                          ]                                  ;                                              b                               2                                      ⃗                                  =                                   [                                                                                             −                                           1                                                                                                                        1                                                                          ]                                       \vec{b_1} = \begin{bmatrix} 2 \\ 1 \end{bmatrix};\vec{b_2} = \begin{bmatrix} -1 \\ 1\end{bmatrix}                  b1​             ​=[21​];b2​             ​=[−11​]。

   r假如仔细想一想,上述的过程是反着的。正常的逻辑不应该是用新坐标系中的                                        [                                                                                             −                                           1                                                                                                                        2                                                                          ]                                  \begin{bmatrix} -1 \\ 2 \end{bmatrix}                     [−12​]与                                                               b                                  1                                          ⃗                                      ,                                                   b                                  2                                          ⃗                                            \vec{b_1}, \vec{b_2}                     b1​              ​,b2​              ​构成的向量的逆相乘吗?这样才气够变更回去呀。
  但是假如再仔细一想,新基向量为                                                               b                                  1                                          ⃗                                      =                                       [                                                                                     2                                                                                                                   1                                                                                 ]                                      ;                                                   b                                  2                                          ⃗                                      =                                       [                                                                                                     −                                              1                                                                                                                                  1                                                                                 ]                                            \vec{b_1} = \begin{bmatrix} 2 \\ 1 \end{bmatrix};\vec{b_2} = \begin{bmatrix} -1 \\ 1\end{bmatrix}                     b1​              ​=[21​];b2​              ​=[−11​]是在标准坐标系中表示的。那么假设                                        A                            =                                       [                                                                                     2                                                                                                             −                                              1                                                                                                                                  1                                                                                             2                                                                                 ]                                            A=\begin{bmatrix} 2 & -1 \\ 1 & 2 \end{bmatrix}                     A=[21​−12​],那么对于新坐标系来说,其要转为标准直角坐标系下的向量,那么变更的逆矩阵就是A。
  
接下来就基变更的问题来引申出以往见过的矩阵表达式                                             A                                       −                               1                                            M                         A                              A^{-1}MA                  A−1MA的含义是什么。
在标准的直角坐标系中,坐标系的逆时针循转可以用如下的矩阵来实现。

那么假如用基向量为                                                        b                               1                                      ⃗                                  =                                   [                                                                              2                                                                                                          1                                                                          ]                                  ;                                              b                               2                                      ⃗                                  =                                   [                                                                                             −                                           1                                                                                                                        1                                                                          ]                                       \vec{b_1} = \begin{bmatrix} 2 \\ 1 \end{bmatrix};\vec{b_2} = \begin{bmatrix} -1 \\ 1\end{bmatrix}                  b1​             ​=[21​];b2​             ​=[−11​]的新坐标系中实现某一直量                                             v                            ⃗                                       \vec{v}                  v             在新坐标系中的转换呢?
在下图的公式中(矩阵相乘从右往左看)就给出了计算的转换方法。其中                                   A                         =                                   [                                                                              2                                                                                                     −                                           1                                                                                                                        1                                                                                      2                                                                          ]                                       A=\begin{bmatrix} 2 & -1 \\ 1 & 2 \end{bmatrix}                  A=[21​−12​],                                   M                         =                                   [                                                                              0                                                                                                     −                                           1                                                                                                                        1                                                                                      0                                                                          ]                                       M=\begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix}                  M=[01​−10​]

所以,                                                   A                                           −                                  1                                                 M                            A                                  A^{-1}MA                     A−1MA暗示了一种数学上的转移作用,中心矩阵                                        M                                  M                     M表示某种变更,而外侧的两个矩阵代表着转移作用,页就是视觉上的转化。
特征值和特征向量

首先考虑这样一个问题,对于一个向量,其张成的空间如下图所示(也就是通过原点和向量尖端的直线)
现在让这个坐标系进行变更,变更矩阵为                                   [                                                                       3                                                                               1                                                                                                 0                                                                               2                                                                   ]                              \begin{bmatrix} 3&1\\ 0&2\\ \end{bmatrix}                  [30​12​],那么此时大部门的向量脱离了其张成的空间,效果如下图:
但是,有一些向量却没有脱离其张成的空间,变更矩阵只是对其进行了缩放而已,效果如下图所示:
在经过定性分析之后,我们睁开对其的定量分析。在变更的过程中我们发现有两组向量张成的空间是特殊的(即没有脱离其张成的空间),我们依次来看。
首先是x轴的变更,如下图所示,在变更之后,单位长度被放大了3倍。
   
  
  而向量                                   [                         −                         1                         ,                         1                         ]                              [-1, 1 ]                  [−1,1]也是同样,但是其单位长度倍放大了2倍。
   
  
  那么对这两个向量的缩放效果如下图所示:
而这两个向量就是我们所说的特征向量,而缩放的倍数就是特征值。
特征向量的特点:在旋转之后还会留在他张成(形成)的向量空间里。
特征值是衡量特征向量在变更中拉伸或者压缩比例的因子。
   从这里可以看出特征值的乘积就是经过线性变更后矩阵行列式的值,假如特征值出现了负数,那么其多少含义与行列式是一样的。
  理解线性变更作用的关键通常较少依靠于特定坐标系。(This gives too mush weight to our coordinate system)
  更好的方法就是求出它的特征向量和特征值。
  
扩展相识:

  • 若想考虑为什么那么重要,那么具有效途并值得研究,那么就来考虑三维空间中的旋转。
  • 对角矩阵的应用以及怎样转化。
           假如一个矩阵可以对角化,那么可以有很多用处,好比幂迭代法求解特征值分解和奇异值分解等

2024/04/17:只对向量的本质作了进一步的相识。只能说数形联合太重要了

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

我可以不吃啊

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表