十念 发表于 2024-12-22 03:38:05

矩阵:Input-Output Interpretation of Matrices (中英双语)

矩阵的输入-输出解释:深入明白与应用

在线性代数中,矩阵与向量的乘积 (                                    y                         =                         A                         x                              y = Ax                  y=Ax ) 是一个极为紧张的关系。通过这一公式,我们可以将矩阵 (                                    A                              A                  A ) 看作一个将输入向量 (                                    x                              x                  x ) 映射到输出向量 (                                    y                              y                  y ) 的线性变换。在这种输入-输出解释中,向量 (                                    x                              x                  x ) 表示输入,而向量 (                                    y                              y                  y ) 表示对应的输出,而矩阵 (                                    A                              A                  A ) 则充当转换关系的焦点。这种解释在很多领域都有广泛的应用,包罗物理、数据科学、机器学习和工程等。
1. 基本界说与形式

对于一个 (                                    m                         ×                         n                              m \times n                  m×n ) 矩阵 (                                    A                              A                  A ),如果我们有一个 (                                    n                              n                  n )-维输入向量 (                                    x                              x                  x ),通过矩阵-向量乘法 (                                    y                         =                         A                         x                              y = Ax                  y=Ax ),可以得到一个 (                                    m                              m                  m )-维输出向量 (                                    y                              y                  y )。用公式表示为:
                                                    y                               i                                    =                                       ∑                                           k                                  =                                  1                                          n                                                 A                                           i                                  k                                                            x                               k                                    =                                       A                                           i                                  1                                                            x                               1                                    +                                       A                                           i                                  2                                                            x                               2                                    +                            ⋯                            +                                       A                                           i                                  n                                                            x                               n                                    ,                                     i                            =                            1                            ,                            …                            ,                            m                            .                                  y_i = \sum_{k=1}^n A_{ik} x_k = A_{i1}x_1 + A_{i2}x_2 + \cdots + A_{in}x_n, \quad i = 1, \dots, m.                     yi​=k=1∑n​Aik​xk​=Ai1​x1​+Ai2​x2​+⋯+Ain​xn​,i=1,…,m.
这里,


[*](                                                    y                               i                                          y_i                     yi​ ) 是输出向量 (                                       y                                  y                     y ) 的第 (                                       i                                  i                     i ) 个分量,
[*](                                                    A                                           i                                  k                                                       A_{ik}                     Aik​ ) 是矩阵 (                                       A                                  A                     A ) 的第 (                                       i                                  i                     i ) 行、第 (                                       k                                  k                     k ) 列的元素,
[*](                                                    x                               k                                          x_k                     xk​ ) 是输入向量 (                                       x                                  x                     x ) 的第 (                                       k                                  k                     k ) 个分量。
这种形式表明,输出向量 (                                    y                              y                  y ) 的每个分量 (                                              y                            i                                       y_i                  yi​ ) 都是输入向量 (                                    x                              x                  x ) 的各个分量 (                                              x                            k                                       x_k                  xk​ ) 经过 (                                              A                                       i                               k                                                 A_{ik}                  Aik​ ) 加权后的线性组合。
2. 矩阵元素的解释

矩阵 (                                    A                              A                  A ) 的元素 (                                              A                                       i                               j                                                 A_{ij}                  Aij​ ) 可以解释为 输入向量 (                                                    x                               j                                          x_j                     xj​ ) 对输出向量 (                                                    y                               i                                          y_i                     yi​ ) 的贡献因子。换句话说,矩阵元素 (                                              A                                       i                               j                                                 A_{ij}                  Aij​ ) 表示 (                                              x                            j                                       x_j                  xj​ ) 对 (                                              y                            i                                       y_i                  yi​ ) 的影响巨细和方向。这种解释可以带来以下结论:

[*] 正负关系

[*]如果 (                                                                A                                                   i                                        j                                                         >                                  0                                          A_{ij} > 0                           Aij​>0 ),则 (                                                                x                                     j                                                      x_j                           xj​ ) 的增大会导致 (                                                                y                                     i                                                      y_i                           yi​ ) 增大。
[*]如果 (                                                                A                                                   i                                        j                                                         <                                  0                                          A_{ij} < 0                           Aij​<0 ),则 (                                                                x                                     j                                                      x_j                           xj​ ) 的增大会导致 (                                                                y                                     i                                                      y_i                           yi​ ) 减小。

[*] 强弱关系

[*]如果 (                                                                A                                                   i                                        j                                                                   A_{ij}                           Aij​ ) 值很大,说明 (                                                                y                                     i                                                      y_i                           yi​ ) 对 (                                                                x                                     j                                                      x_j                           xj​ ) 的依赖水平很强。
[*]如果 (                                                                A                                                   i                                        j                                                                   A_{ij}                           Aij​ ) 值接近零,说明 (                                                                x                                     j                                                      x_j                           xj​ ) 对 (                                                                y                                     i                                                      y_i                           yi​ ) 几乎没有影响。

[*] 行或列的相对巨细

[*]如果矩阵第 (                                                   i                                          i                           i ) 行中某个元素 (                                                                A                                                   i                                        j                                                                   A_{ij}                           Aij​ ) 比其他元素大很多,那么输出 (                                                                y                                     i                                                      y_i                           yi​ ) 重要依赖于 (                                                                x                                     j                                                      x_j                           xj​ )。
[*]如果第 (                                                   j                                          j                           j ) 列的元素都很大,说明 (                                                                x                                     j                                                      x_j                           xj​ ) 对多个 (                                                                y                                     i                                                      y_i                           yi​ ) 都有较大的影响。

3. 矩阵特别结构的解释

矩阵的结构对输入-输出关系有紧张影响,以下是几个常见的矩阵结构及其对应的解释:

[*] 下三角矩阵(Lower Triangular Matrix)
如果矩阵 (                                              A                                    A                        A ) 是下三角矩阵,即 (                                                          A                                             i                                     j                                                      =                               0                                    A_{ij} = 0                        Aij​=0 ) 当 (                                              j                               >                               i                                    j > i                        j>i ) 时,则:

[*]输出 (                                                                y                                     i                                                      y_i                           yi​ ) 仅依赖于输入 (                                                                x                                     1                                              ,                                             x                                     2                                              ,                                  …                                  ,                                             x                                     i                                                      x_1, x_2, \dots, x_i                           x1​,x2​,…,xi​ )。
[*]这种结构经常出如今递归或因果关系中,例如动态系统的时间序列建模。

[*] 对角矩阵(Diagonal Matrix)
如果 (                                              A                                    A                        A ) 是对角矩阵,即 (                                                          A                                             i                                     j                                                      =                               0                                    A_{ij} = 0                        Aij​=0 ) 当 (                                              i                               ≠                               j                                    i \neq j                        i=j ) 时,则:

[*]每个 (                                                                y                                     i                                                      y_i                           yi​ ) 只依赖于对应的 (                                                                x                                     i                                                      x_i                           xi​ ),没有其他分量的影响。
[*]这种结构常用于独立变量的缩放(Scaling)或权重调解。

[*] 稀疏矩阵(Sparse Matrix)
如果 (                                              A                                    A                        A ) 是稀疏矩阵(大部门元素为零),则:

[*]只有非零元素所在列的输入 (                                                                x                                     j                                                      x_j                           xj​ ) 会对某些 (                                                                y                                     i                                                      y_i                           yi​ ) 产生影响。
[*]稀疏矩阵广泛用于表示稀疏网络、关系图或局部连接结构。

4. 具体例子

示例 1:简单矩阵输入-输出关系

假设我们有如下矩阵 (                                    A                              A                  A ) 和输入向量 (                                    x                              x                  x ):
                                       A                            =                                       [                                                                                     2                                                                                                             −                                              1                                                                                                            0                                                                                                                   0                                                                                             1                                                                                             3                                                                                                                   4                                                                                             0                                                                                             2                                                                                 ]                                    ,                                     x                            =                                       [                                                                                     1                                                                                                                   2                                                                                                                   3                                                                                 ]                                    .                                  A = \begin{bmatrix} 2 & -1 & 0 \\ 0 & 1 & 3 \\ 4 & 0 & 2 \end{bmatrix}, \quad x = \begin{bmatrix} 1 \\ 2 \\ 3 \end{bmatrix}.                     A=               ​204​−110​032​               ​,x=               ​123​               ​.
盘算输出向量 (                                    y                         =                         A                         x                              y = Ax                  y=Ax ):
                                                    y                               1                                    =                            2                            ⋅                            1                            +                            (                            −                            1                            )                            ⋅                            2                            +                            0                            ⋅                            3                            =                            0                            ,                                       y                               2                                    =                            0                            ⋅                            1                            +                            1                            ⋅                            2                            +                            3                            ⋅                            3                            =                            11                            ,                                       y                               3                                    =                            4                            ⋅                            1                            +                            0                            ⋅                            2                            +                            2                            ⋅                            3                            =                            10.                                  y_1 = 2 \cdot 1 + (-1) \cdot 2 + 0 \cdot 3 = 0, y_2 = 0 \cdot 1 + 1 \cdot 2 + 3 \cdot 3 = 11, y_3 = 4 \cdot 1 + 0 \cdot 2 + 2 \cdot 3 = 10.                     y1​=2⋅1+(−1)⋅2+0⋅3=0,y2​=0⋅1+1⋅2+3⋅3=11,y3​=4⋅1+0⋅2+2⋅3=10.
因此,输出向量为:
                                       y                            =                                       [                                                                                     0                                                                                                                   11                                                                                                                   10                                                                                 ]                                    .                                  y = \begin{bmatrix} 0 \\ 11 \\ 10 \end{bmatrix}.                     y=               ​01110​               ​.
示例 2:Python 实现

以下是用 Python 实现矩阵-向量乘法的代码:
import numpy as np

# 定义矩阵 A 和输入向量 x
A = np.array([, , ])
x = np.array()

# 计算输出向量 y
y = np.dot(A, x)

print("Output vector y:", y)
运行结果为:
Output vector y: [ 0 11 10 ]

5. 应用场景


[*] 物理建模
在物理系统中,矩阵 (                                              A                                    A                        A ) 可以表示某种系统特性(如力的传递系数、热传导系数等),输入向量 (                                              x                                    x                        x ) 表示输入条件(如力、热源),输出向量 (                                              y                                    y                        y ) 表示系统的相应。
[*] 机器学习
在神经网络的全连接层中,矩阵-向量乘法被用来将上一层的输出(输入向量 (                                              x                                    x                        x ))映射到当前层的输出(向量 (                                              y                                    y                        y ))。矩阵 (                                              A                                    A                        A ) 表示该层的权重。
[*] 数据分析
在主成分分析(PCA)中,矩阵 (                                              A                                    A                        A ) 是主成分矩阵,输入 (                                              x                                    x                        x ) 是原始数据,输出 (                                              y                                    y                        y ) 是数据在主成分方向上的投影。
[*] 信号处理
在数字滤波中,矩阵 (                                              A                                    A                        A ) 表示滤波器,输入向量 (                                              x                                    x                        x ) 表示信号,输出向量 (                                              y                                    y                        y ) 是滤波后的信号。
6. 总结

矩阵 (                                    A                              A                  A ) 的输入-输出解释为我们提供了一种明白线性变换的直观方式,通过分析矩阵元素的巨细和符号,我们可以深入明白输入与输出之间的依赖关系。这种分析方法在各种实际场景中具有广泛的应用代价,从物理建模到机器学习,再到信号处理和数据分析,矩阵的输入-输出解释无处不在,是学习和应用线性代数的紧张工具。
英文版

Input-Output Interpretation of Matrices: A Detailed Overview

In linear algebra, the equation (                                    y                         =                         A                         x                              y = Ax                  y=Ax ) plays a fundamental role, where (                                    A                              A                  A ) is a matrix, (                                    x                              x                  x ) is an input vector, and (                                    y                              y                  y ) is the corresponding output vector. This relationship can be interpreted as a linear mapping where (                                    A                              A                  A ) transforms the input (                                    x                              x                  x ) into the output (                                    y                              y                  y ). This input-output interpretation provides a conceptual framework that is widely used in physics, machine learning, data science, and engineering.
1. Basic Definition

For an (                                    m                         ×                         n                              m \times n                  m×n ) matrix (                                    A                              A                  A ), multiplying it by an (                                    n                              n                  n )-dimensional input vector (                                    x                              x                  x ) results in an (                                    m                              m                  m )-dimensional output vector (                                    y                              y                  y ). This process is described as:
                                                    y                               i                                    =                                       ∑                                           k                                  =                                  1                                          n                                                 A                                           i                                  k                                                            x                               k                                    =                                       A                                           i                                  1                                                            x                               1                                    +                                       A                                           i                                  2                                                            x                               2                                    +                            ⋯                            +                                       A                                           i                                  n                                                            x                               n                                    ,                                     i                            =                            1                            ,                            …                            ,                            m                            .                                  y_i = \sum_{k=1}^n A_{ik} x_k = A_{i1}x_1 + A_{i2}x_2 + \cdots + A_{in}x_n, \quad i = 1, \dots, m.                     yi​=k=1∑n​Aik​xk​=Ai1​x1​+Ai2​x2​+⋯+Ain​xn​,i=1,…,m.
Here:


[*](                                                    y                               i                                          y_i                     yi​ ) is the (                                       i                                  i                     i )-th element of the output vector (                                       y                                  y                     y ),
[*](                                                    A                                           i                                  k                                                       A_{ik}                     Aik​ ) is the element in the (                                       i                                  i                     i )-th row and (                                       k                                  k                     k )-th column of (                                       A                                  A                     A ),
[*](                                                    x                               k                                          x_k                     xk​ ) is the (                                       k                                  k                     k )-th element of the input vector (                                       x                                  x                     x ).
This equation tells us that each component (                                              y                            i                                       y_i                  yi​ ) of the output is a weighted sum of the input components (                                              x                            k                                       x_k                  xk​ ), where the weights are the elements of the matrix (                                    A                              A                  A ).
2. Meaning of Matrix Elements

The element (                                              A                                       i                               j                                                 A_{ij}                  Aij​ ) in the matrix (                                    A                              A                  A ) has a clear interpretation: it represents the influence of the (                                       j                                  j                     j )-th input variable (                                                    x                               j                                          x_j                     xj​ ) on the (                                       i                                  i                     i )-th output variable (                                                    y                               i                                          y_i                     yi​ ). Some specific conclusions can be drawn from this:

[*] Positive or Negative Relationship

[*]If (                                                                A                                                   i                                        j                                                         >                                  0                                          A_{ij} > 0                           Aij​>0 ), then an increase in (                                                                x                                     j                                                      x_j                           xj​ ) will cause (                                                                y                                     i                                                      y_i                           yi​ ) to increase.
[*]If (                                                                A                                                   i                                        j                                                         <                                  0                                          A_{ij} < 0                           Aij​<0 ), then an increase in (                                                                x                                     j                                                      x_j                           xj​ ) will cause (                                                                y                                     i                                                      y_i                           yi​ ) to decrease.

[*] Strength of Dependence

[*]A large magnitude of (                                                                A                                                   i                                        j                                                                   A_{ij}                           Aij​ ) indicates that (                                                                y                                     i                                                      y_i                           yi​ ) strongly depends on (                                                                x                                     j                                                      x_j                           xj​ ).
[*]A small (                                                   ∣                                             A                                                   i                                        j                                                         ∣                                          |A_{ij}|                           ∣Aij​∣ ) means that (                                                                x                                     j                                                      x_j                           xj​ ) has little effect on (                                                                y                                     i                                                      y_i                           yi​ ).

[*] Row and Column Effects

[*]If (                                                                A                                                   i                                        j                                                                   A_{ij}                           Aij​ ) in the (                                                   i                                          i                           i )-th row is significantly larger than the other elements, (                                                                y                                     i                                                      y_i                           yi​ ) depends heavily on (                                                                x                                     j                                                      x_j                           xj​ ).
[*]If a specific column (                                                   j                                          j                           j ) contains large values, then (                                                                x                                     j                                                      x_j                           xj​ ) has a strong influence on multiple output components (                                                                y                                     i                                                      y_i                           yi​ ).

3. Special Matrix Structures

The structure of the matrix (                                    A                              A                  A ) has a significant impact on how the input and output are related:

[*] Lower Triangular Matrix
In a lower triangular matrix (where (                                                          A                                             i                                     j                                                      =                               0                                    A_{ij} = 0                        Aij​=0 ) for ($ j > i$ )):

[*]Each output (                                                                y                                     i                                                      y_i                           yi​ ) only depends on (                                                                x                                     1                                              ,                                  …                                  ,                                             x                                     i                                                      x_1, \dots, x_i                           x1​,…,xi​ ).
[*]This is useful for systems with causality or stepwise dependencies, such as dynamic systems or recursive models.

[*] Diagonal Matrix
In a diagonal matrix (where (                                                          A                                             i                                     j                                                      =                               0                                    A_{ij} = 0                        Aij​=0 ) for (                                              i                               ≠                               j                                    i \neq j                        i=j )):

[*]Each (                                                                y                                     i                                                      y_i                           yi​ ) depends only on the corresponding (                                                                x                                     i                                                      x_i                           xi​ ).
[*]This represents independent scaling of each input component.

[*] Sparse Matrix
In a sparse matrix (with many zero elements):

[*]Only inputs (                                                                x                                     j                                                      x_j                           xj​ ) corresponding to non-zero entries in (                                                   A                                          A                           A ) influence the outputs (                                                                y                                     i                                                      y_i                           yi​ ).
[*]Sparse matrices are widely used in graph representations and localized systems.

4. Examples

Example 1: Simple Input-Output Relationship

Let the matrix (                                    A                              A                  A ) and input vector (                                    x                              x                  x ) be:
                                       A                            =                                       [                                                                                     2                                                                                                             −                                              1                                                                                                            0                                                                                                                   0                                                                                             1                                                                                             3                                                                                                                   4                                                                                             0                                                                                             2                                                                                 ]                                    ,                                     x                            =                                       [                                                                                     1                                                                                                                   2                                                                                                                   3                                                                                 ]                                    .                                  A = \begin{bmatrix} 2 & -1 & 0 \\ 0 & 1 & 3 \\ 4 & 0 & 2 \end{bmatrix}, \quad x = \begin{bmatrix} 1 \\ 2 \\ 3 \end{bmatrix}.                     A=               ​204​−110​032​               ​,x=               ​123​               ​.
The output vector (                                    y                         =                         A                         x                              y = Ax                  y=Ax ) is calculated as:
                                                    y                               1                                    =                            2                            ⋅                            1                            +                            (                            −                            1                            )                            ⋅                            2                            +                            0                            ⋅                            3                            =                            0                            ,                                       y                               2                                    =                            0                            ⋅                            1                            +                            1                            ⋅                            2                            +                            3                            ⋅                            3                            =                            11                            ,                                       y                               3                                    =                            4                            ⋅                            1                            +                            0                            ⋅                            2                            +                            2                            ⋅                            3                            =                            10.                                  y_1 = 2 \cdot 1 + (-1) \cdot 2 + 0 \cdot 3 = 0, y_2 = 0 \cdot 1 + 1 \cdot 2 + 3 \cdot 3 = 11, y_3 = 4 \cdot 1 + 0 \cdot 2 + 2 \cdot 3 = 10.                     y1​=2⋅1+(−1)⋅2+0⋅3=0,y2​=0⋅1+1⋅2+3⋅3=11,y3​=4⋅1+0⋅2+2⋅3=10.
Thus, the output is:
                                       y                            =                                       [                                                                                     0                                                                                                                   11                                                                                                                   10                                                                                 ]                                    .                                  y = \begin{bmatrix} 0 \\ 11 \\ 10 \end{bmatrix}.                     y=               ​01110​               ​.
Example 2: Python Implementation

Below is the Python implementation of the above example:
import numpy as np

# Define matrix A and input vector x
A = np.array([, , ])
x = np.array()

# Compute output vector y
y = np.dot(A, x)

print("Output vector y:", y)
Output:
Output vector y: [ 0 11 10 ]

5. Applications


[*] Physics and Engineering

[*]In physics, the matrix (                                                   A                                          A                           A ) might represent a system’s characteristics (e.g., thermal conductivity, forces). The input (                                                   x                                          x                           x ) represents external stimuli (e.g., heat sources, forces), and (                                                   y                                          y                           y ) is the system’s response.

[*] Machine Learning

[*]In neural networks, matrix-vector multiplication (                                                   y                                  =                                  A                                  x                                          y = Ax                           y=Ax ) is used in fully connected layers, where (                                                   A                                          A                           A ) represents the layer’s weights.

[*] Data Analysis

[*]In Principal Component Analysis (PCA), the matrix (                                                   A                                          A                           A ) transforms high-dimensional data (                                                   x                                          x                           x ) into lower-dimensional components (                                                   y                                          y                           y ).

[*] Signal Processing

[*]In digital signal processing, (                                                   A                                          A                           A ) can represent a filter, with (                                                   x                                          x                           x ) as the input signal and (                                                   y                                          y                           y ) as the filtered output.

[*] Economics

[*]Input-output models in economics use (                                                   y                                  =                                  A                                  x                                          y = Ax                           y=Ax ) to represent how outputs of one sector depend on inputs from others.

6. Conclusion

The input-output interpretation of (                                    y                         =                         A                         x                              y = Ax                  y=Ax ) provides a powerful framework for understanding linear transformations. By analyzing the structure and elements of (                                    A                              A                  A ), we can understand how input components (                                    x                              x                  x ) influence output components (                                    y                              y                  y ). This perspective has broad applications, from physics and engineering to machine learning and data analysis, making it an indispensable tool for both theoretical and practical purposes.
增补

假设我们有一个矩阵 (                                    A                              A                  A ),它的维度是 (                                    3                         ×                         3                              3 \times 3                  3×3 ),并且有一个输入向量 (                                    x                              x                  x ) 和输出向量 (                                    y                              y                  y )。矩阵 (                                    A                              A                  A ) 和向量 (                                    x                              x                  x ) 如下所示:
                                       A                            =                                       [                                                                                     3                                                                                             1                                                                                             0                                                                                                                   2                                                                                             4                                                                                             1                                                                                                                   0                                                                                             0                                                                                             5                                                                                 ]                                    ,                                     x                            =                                       [                                                                                     1                                                                                                                   2                                                                                                                   3                                                                                 ]                                          A = \begin{bmatrix} 3 & 1 & 0 \\ 2 & 4 & 1 \\ 0 & 0 & 5 \end{bmatrix}, \quad x = \begin{bmatrix} 1 \\ 2 \\ 3 \end{bmatrix}                     A=               ​320​140​015​               ​,x=               ​123​               ​
通过矩阵与向量的乘法,输出向量 (                                    y                              y                  y ) 是:
                                       y                            =                            A                            ×                            x                            =                                       [                                                                                     3                                                                                             1                                                                                             0                                                                                                                   2                                                                                             4                                                                                             1                                                                                                                   0                                                                                             0                                                                                             5                                                                                 ]                                    ×                                       [                                                                                     1                                                                                                                   2                                                                                                                   3                                                                                 ]                                    =                                       [                                                                                                   3                                              ×                                              1                                              +                                              1                                              ×                                              2                                              +                                              0                                              ×                                              3                                                                                                                                                2                                              ×                                              1                                              +                                              4                                              ×                                              2                                              +                                              1                                              ×                                              3                                                                                                                                                0                                              ×                                              1                                              +                                              0                                              ×                                              2                                              +                                              5                                              ×                                              3                                                                                                ]                                    =                                       [                                                                                     5                                                                                                                   13                                                                                                                   15                                                                                 ]                                          y = A \times x = \begin{bmatrix} 3 & 1 & 0 \\ 2 & 4 & 1 \\ 0 & 0 & 5 \end{bmatrix} \times \begin{bmatrix} 1 \\ 2 \\ 3 \end{bmatrix} = \begin{bmatrix} 3 \times 1 + 1 \times 2 + 0 \times 3 \\ 2 \times 1 + 4 \times 2 + 1 \times 3 \\ 0 \times 1 + 0 \times 2 + 5 \times 3 \end{bmatrix} = \begin{bmatrix} 5 \\ 13 \\ 15 \end{bmatrix}                     y=A×x=               ​320​140​015​               ​×               ​123​               ​=               ​3×1+1×2+0×32×1+4×2+1×30×1+0×2+5×3​               ​=               ​51315​               ​
矩阵 (                                    A                              A                  A ) 的第 (                                    j                              j                  j ) 列的元素表示输入向量 (                                    x                              x                  x ) 的第 (                                    j                              j                  j ) 个分量对多个输出分量的贡献。具体来说,第 (                                    j                              j                  j ) 列的元素怎样影响各个输出 (                                              y                            i                                       y_i                  yi​ ),反映了输入的不同分量怎样通过该列的系数影响多个输出。
明白 “如果第 (                                    j                              j                  j ) 列的元素都很大,说明 (                                              x                            j                                       x_j                  xj​ ) 对多个 (                                              y                            i                                       y_i                  yi​ ) 都有较大的影响”:

我们来看矩阵 (                                    A                              A                  A ) 的第 (                                    2                              2                  2 ) 列:
                                                    A                               列2                                    =                                       [                                                                                     1                                                                                                                   4                                                                                                                   0                                                                                 ]                                          A_{\text{列2}} = \begin{bmatrix} 1 \\ 4 \\ 0 \end{bmatrix}                     A列2​=               ​140​               ​


[*]该列的元素分别是 (                                                    A                               12                                    =                            1                                  A_{12} = 1                     A12​=1 ),(                                                    A                               22                                    =                            4                                  A_{22} = 4                     A22​=4 ),和 (                                                    A                               32                                    =                            0                                  A_{32} = 0                     A32​=0 )。
从矩阵与向量的乘法中,我们看到 (                                              x                            2                                  =                         2                              x_2 = 2                  x2​=2 ),而第 (                                    2                              2                  2 ) 列的元素分别对输出 (                                              y                            1                                       y_1                  y1​ ), (                                              y                            2                                       y_2                  y2​ ), 和 (                                              y                            3                                       y_3                  y3​ ) 有不同的贡献:


[*](                                                    y                               1                                    =                            3                            ×                            1                            +                            1                            ×                            2                            +                            0                            ×                            3                            =                            5                                  y_1 = 3 \times 1 + 1 \times 2 + 0 \times 3 = 5                     y1​=3×1+1×2+0×3=5 ),此中 (                                       1                            ×                            2                                  1 \times 2                     1×2 ) 表示 (                                                    x                               2                                          x_2                     x2​ ) 对 (                                                    y                               1                                          y_1                     y1​ ) 的贡献是 (                                       2                                  2                     2 ),影响较小。
[*](                                                    y                               2                                    =                            2                            ×                            1                            +                            4                            ×                            2                            +                            1                            ×                            3                            =                            13                                  y_2 = 2 \times 1 + 4 \times 2 + 1 \times 3 = 13                     y2​=2×1+4×2+1×3=13 ),此中 (                                       4                            ×                            2                                  4 \times 2                     4×2 ) 表示 (                                                    x                               2                                          x_2                     x2​ ) 对 (                                                    y                               2                                          y_2                     y2​ ) 的贡献是 (                                       8                                  8                     8 ),影响较大。
[*](                                                    y                               3                                    =                            0                            ×                            1                            +                            0                            ×                            2                            +                            5                            ×                            3                            =                            15                                  y_3 = 0 \times 1 + 0 \times 2 + 5 \times 3 = 15                     y3​=0×1+0×2+5×3=15 ),(                                                    x                               2                                          x_2                     x2​ ) 对 (                                                    y                               3                                          y_3                     y3​ ) 的贡献是 (                                       0                                  0                     0 ),没有影响。
所以,如果矩阵的某一列的元素较大,这意味着该输入分量(例如 (                                                    x                               2                                          x_2                     x2​ ))对多个输出分量(例如 (                                                    y                               1                                          y_1                     y1​ ) 和 (                                                    y                               2                                          y_2                     y2​ ))都有较大的影响,并且影响的水平会随系数的巨细变革。例如,在第 (                                    2                              2                  2 ) 列中,系数 (                                              A                            22                                  =                         4                              A_{22} = 4                  A22​=4 ) 对输出 (                                              y                            2                                       y_2                  y2​ ) 贡献了较大的影响。
总结来说,矩阵的某一列的元素大,意味着该输入项对多个输出项有较强的影响,特别是在相干系数较大的情况下。
后记

2024年12月20日15点13分于上海,在GPT4o大模子辅助下完成。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 矩阵:Input-Output Interpretation of Matrices (中英双语)