《从零到一:深入浅出剖析支持向量机的对偶标题》

打印 上一主题 下一主题

主题 1022|帖子 1022|积分 3066

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
支持向量机是什么?

支持向量机是一种用于分类的机器学习算法。它的任务是根据一些已知的数据点,找到一个最佳的“分隔线”,把不同类别的数据点分开。这个分隔线就像一条直线或一个平面,把数据空间分成两个部分,每个部分包含一种类别的数据点.
为什么叫“支持向量”?

在所有大概的分隔线中,有一些数据点离分隔线近来,这些点就是“支持向量”。它们决定了分隔线的位置和方向。假如这些点轻微移动一下,分隔线也会跟着移动。所以,这些点就像在“支持”着这条线,这就是“支持向量”的由来.
如何找到最佳分隔线?

为了找到最佳的分隔线,我们必要思量两个因素:

  • 正确分类:分隔线必须把不同类别的数据点正确分开。
  • 最大隔断:分隔线两侧的隔断(即支持向量到分隔线的隔断)要尽大概大,如许可以提高分类的正确性.
公式解释

假设我们有一些数据点 ( x_i ),每个点都有一个标签 ( y_i ),表示它是哪一类(比如赤色为1,蓝色为-1).
我们用一个线性函数 (
                                         f                            (                            x                            )                            =                            w                            ⋅                            x                            +                            b                                  f(x) = w \cdot x + b                     f(x)=w⋅x+b
) 来表示分隔线,此中 ( w ) 是一个向量,( b ) 是一个常数.
为了找到最佳的 ( w ) 和 ( b ),我们必要办理以下优化标题:
[
                                         最大化                                                2                                           ∥                                  w                                  ∥                                                       \text{最大化} \quad \frac{2}{\|w\|}                     最大化∥w∥2​
]
[
                                         约束条件                                                y                               i                                      (                            w                            ⋅                                       x                               i                                      +                            b                            )                            ≥                            1                                                               \text{约束条件} \quad y_i (w \cdot x_i + b) \geq 1 \                     约束条件yi​(w⋅xi​+b)≥1 
]


  • 最大化隔断:(
                                                                    2                                                   ∥                                        w                                        ∥                                                                   \frac{2}{\|w\|}                           ∥w∥2​
    ) 表示分隔线两侧的隔断,我们希望这个隔断尽大概大.
  • 约束条件:(
                                                                    y                                     i                                              (                                  w                                  ⋅                                               x                                     i                                              +                                  b                                  )                                  ≥                                  1                                          y_i (w \cdot x_i + b) \geq 1                           yi​(w⋅xi​+b)≥1
    ) 确保每个数据点 ( x_i ) 被正确分类,并且离分隔线的隔断至少为1.
总结

支持向量机通过找到一个最佳的分隔线来区分不同类别的数据点。它利用支持向量来确定分隔线的位置和方向,并通过优化标题来最大化类别之间的隔断,从而提高分类的正确性。希望这个解释能资助你更好地明白支持向量机!
支持向量机(SVM)的优化标题

为了求解支持向量机(SVM)的优化标题,我们使用拉格朗日乘子法。这个标题可以表示为:
[
                                         最大化                                                2                                           ∥                                  w                                  ∥                                                       \text{最大化} \quad \frac{2}{\|w\|}                     最大化∥w∥2​
]
[
                                         约束条件                                                y                               i                                      (                            w                            ⋅                                       x                               i                                      +                            b                            )                            ≥                            1                                  \text{约束条件} \quad y_i (w \cdot x_i + b) \geq 1                     约束条件yi​(w⋅xi​+b)≥1
]
起首,我们转换最大化标题为最小化标题,因为拉格朗日乘子法通常用于最小化标题。我们最小化 (
                                                    1                               2                                      ∥                            w                                       ∥                               2                                            \frac{1}{2} \|w\|^2                     21​∥w∥2
) 而不是 (
                                                    2                                           ∥                                  w                                  ∥                                                       \frac{2}{\|w\|}                     ∥w∥2​
),因为这两个标题在 ( w ) 上是等价的。
所以,我们的优化标题变为:
[
                                         最小化                                                1                               2                                      ∥                            w                                       ∥                               2                                                                         \text{最小化} \quad \frac{1}{2} \|w\|^2 \                     最小化21​∥w∥2 
]
[
                                         约束条件                                                y                               i                                      (                            w                            ⋅                                       x                               i                                      +                            b                            )                            ≥                            1                                  \text{约束条件} \quad y_i (w \cdot x_i + b) \geq 1                     约束条件yi​(w⋅xi​+b)≥1
]
接下来,我们引入拉格朗日乘子 (
                                                    α                               i                                            \alpha_i                     αi​
) 来处理约束条件。拉格朗日函数 ( L ) 定义为:
[
                                         L                            (                            w                            ,                            b                            ,                            α                            )                            =                                       1                               2                                      ∥                            w                                       ∥                               2                                      −                                       ∑                                           i                                  =                                  1                                          n                                                 α                               i                                      [                                       y                               i                                      (                            w                            ⋅                                       x                               i                                      +                            b                            )                            −                            1                            ]                                  L(w, b, \alpha) = \frac{1}{2} \|w\|^2 - \sum_{i=1}^n \alpha_i [y_i (w \cdot x_i + b) - 1]                     L(w,b,α)=21​∥w∥2−i=1∑n​αi​[yi​(w⋅xi​+b)−1]
]
此中 (
                                                    α                               i                                      ≥                            0                                  \alpha_i \geq 0                     αi​≥0
) 是拉格朗日乘子。
为了找到 ( w ) 和 ( b ) 的最优值,我们必要对 ( L ) 关于 ( w ) 和 ( b ) 求偏导数,并令其等于零:
[
                                                                ∂                                  L                                                      ∂                                  w                                                 =                            w                            −                                       ∑                                           i                                  =                                  1                                          n                                                 α                               i                                                 y                               i                                                 x                               i                                      =                            0                                                               \frac{\partial L}{\partial w} = w - \sum_{i=1}^n \alpha_i y_i x_i = 0 \                     ∂w∂L​=w−i=1∑n​αi​yi​xi​=0 
]
[
                                                                ∂                                  L                                                      ∂                                  b                                                 =                            −                                       ∑                                           i                                  =                                  1                                          n                                                 α                               i                                                 y                               i                                      =                            0                                  \frac{\partial L}{\partial b} = -\sum_{i=1}^n \alpha_i y_i = 0                     ∂b∂L​=−i=1∑n​αi​yi​=0
]
从第一个方程中,我们得到:
[
                                         w                            =                                       ∑                                           i                                  =                                  1                                          n                                                 α                               i                                                 y                               i                                                 x                               i                                            w = \sum_{i=1}^n \alpha_i y_i x_i                     w=i=1∑n​αi​yi​xi​
]
从第二个方程中,我们得到:
[
                                                    ∑                                           i                                  =                                  1                                          n                                                 α                               i                                                 y                               i                                      =                            0                                                               \sum_{i=1}^n \alpha_i y_i = 0 \                     i=1∑n​αi​yi​=0 
]
如今,我们将 ( w ) 的表达式代入拉格朗日函数 ( L ),得到关于 ( \alpha ) 的对偶标题:
[
                                         L                            (                            α                            )                            =                                       1                               2                                                 (                                           ∑                                               i                                     =                                     1                                              n                                                      α                                  i                                                      y                                  i                                                      x                                  i                                          )                                      ⋅                                       (                                           ∑                                               j                                     =                                     1                                              n                                                      α                                  j                                                      y                                  j                                                      x                                  j                                          )                                      −                                       ∑                                           i                                  =                                  1                                          n                                                 α                               i                                      [                                       y                               i                                      (                            w                            ⋅                                       x                               i                                      +                            b                            )                            −                            1                            ]                                  L(\alpha) = \frac{1}{2} \left( \sum_{i=1}^n \alpha_i y_i x_i \right) \cdot \left( \sum_{j=1}^n \alpha_j y_j x_j \right) - \sum_{i=1}^n \alpha_i [y_i (w \cdot x_i + b) - 1]                     L(α)=21​(i=1∑n​αi​yi​xi​)⋅(j=1∑n​αj​yj​xj​)−i=1∑n​αi​[yi​(w⋅xi​+b)−1]
]
[
                                         L                            (                            α                            )                            =                                       1                               2                                                 ∑                                           i                                  =                                  1                                          n                                                 ∑                                           j                                  =                                  1                                          n                                                 α                               i                                                 α                               j                                                 y                               i                                                 y                               j                                      (                                       x                               i                                      ⋅                                       x                               j                                      )                            −                                       ∑                                           i                                  =                                  1                                          n                                                 α                               i                                      [                                       y                               i                                      (                                       ∑                                           j                                  =                                  1                                          n                                                 α                               j                                                 y                               j                                                 x                               j                                      ⋅                                       x                               i                                      +                            b                            )                            −                            1                            ]                                  L(\alpha) = \frac{1}{2} \sum_{i=1}^n \sum_{j=1}^n \alpha_i \alpha_j y_i y_j (x_i \cdot x_j) - \sum_{i=1}^n \alpha_i [y_i (\sum_{j=1}^n \alpha_j y_j x_j \cdot x_i + b) - 1]                     L(α)=21​i=1∑n​j=1∑n​αi​αj​yi​yj​(xi​⋅xj​)−i=1∑n​αi​[yi​(j=1∑n​αj​yj​xj​⋅xi​+b)−1]
]
[
                                         L                            (                            α                            )                            =                                       1                               2                                                 ∑                                           i                                  =                                  1                                          n                                                 ∑                                           j                                  =                                  1                                          n                                                 α                               i                                                 α                               j                                                 y                               i                                                 y                               j                                      (                                       x                               i                                      ⋅                                       x                               j                                      )                            −                                       ∑                                           i                                  =                                  1                                          n                                                 α                               i                                                 y                               i                                      (                                       ∑                                           j                                  =                                  1                                          n                                                 α                               j                                                 y                               j                                                 x                               j                                      ⋅                                       x                               i                                      +                            b                            )                            +                                       ∑                                           i                                  =                                  1                                          n                                                 α                               i                                            L(\alpha) = \frac{1}{2} \sum_{i=1}^n \sum_{j=1}^n \alpha_i \alpha_j y_i y_j (x_i \cdot x_j) - \sum_{i=1}^n \alpha_i y_i (\sum_{j=1}^n \alpha_j y_j x_j \cdot x_i + b) + \sum_{i=1}^n \alpha_i                     L(α)=21​i=1∑n​j=1∑n​αi​αj​yi​yj​(xi​⋅xj​)−i=1∑n​αi​yi​(j=1∑n​αj​yj​xj​⋅xi​+b)+i=1∑n​αi​
]
[
                                         L                            (                            α                            )                            =                                       1                               2                                                 ∑                                           i                                  =                                  1                                          n                                                 ∑                                           j                                  =                                  1                                          n                                                 α                               i                                                 α                               j                                                 y                               i                                                 y                               j                                      (                                       x                               i                                      ⋅                                       x                               j                                      )                            −                                       ∑                                           i                                  =                                  1                                          n                                                 ∑                                           j                                  =                                  1                                          n                                                 α                               i                                                 α                               j                                                 y                               i                                                 y                               j                                      (                                       x                               i                                      ⋅                                       x                               j                                      )                            −                                       ∑                                           i                                  =                                  1                                          n                                                 α                               i                                                 y                               i                                      b                            +                                       ∑                                           i                                  =                                  1                                          n                                                 α                               i                                            L(\alpha) = \frac{1}{2} \sum_{i=1}^n \sum_{j=1}^n \alpha_i \alpha_j y_i y_j (x_i \cdot x_j) - \sum_{i=1}^n \sum_{j=1}^n \alpha_i \alpha_j y_i y_j (x_i \cdot x_j) - \sum_{i=1}^n \alpha_i y_i b + \sum_{i=1}^n \alpha_i                     L(α)=21​i=1∑n​j=1∑n​αi​αj​yi​yj​(xi​⋅xj​)−i=1∑n​j=1∑n​αi​αj​yi​yj​(xi​⋅xj​)−i=1∑n​αi​yi​b+i=1∑n​αi​
]
[
                                         L                            (                            α                            )                            =                            −                                       1                               2                                                 ∑                                           i                                  =                                  1                                          n                                                 ∑                                           j                                  =                                  1                                          n                                                 α                               i                                                 α                               j                                                 y                               i                                                 y                               j                                      (                                       x                               i                                      ⋅                                       x                               j                                      )                            +                                       ∑                                           i                                  =                                  1                                          n                                                 α                               i                                                                         L(\alpha) = -\frac{1}{2} \sum_{i=1}^n \sum_{j=1}^n \alpha_i \alpha_j y_i y_j (x_i \cdot x_j) + \sum_{i=1}^n \alpha_i \                     L(α)=−21​i=1∑n​j=1∑n​αi​αj​yi​yj​(xi​⋅xj​)+i=1∑n​αi​ 
]
因此,对偶标题为:
[
                                         最大化                                     L                            (                            α                            )                            =                                       ∑                                           i                                  =                                  1                                          n                                                 α                               i                                      −                                       1                               2                                                 ∑                                           i                                  =                                  1                                          n                                                 ∑                                           j                                  =                                  1                                          n                                                 α                               i                                                 α                               j                                                 y                               i                                                 y                               j                                      (                                       x                               i                                      ⋅                                       x                               j                                      )                                  \text{最大化} \quad L(\alpha) = \sum_{i=1}^n \alpha_i - \frac{1}{2} \sum_{i=1}^n \sum_{j=1}^n \alpha_i \alpha_j y_i y_j (x_i \cdot x_j)                     最大化L(α)=i=1∑n​αi​−21​i=1∑n​j=1∑n​αi​αj​yi​yj​(xi​⋅xj​)
]
[
                                         约束条件                                                α                               i                                      ≥                            0                                  \text{约束条件} \quad \alpha_i \geq 0                     约束条件αi​≥0
]
[
                                         约束条件                                                ∑                                           i                                  =                                  1                                          n                                                 α                               i                                                 y                               i                                      =                            0                                  \text{约束条件} \quad \sum_{i=1}^n \alpha_i y_i = 0                     约束条件i=1∑n​αi​yi​=0
]
通过求解这个对偶标题,我们可以找到 (
                                                    α                               i                                            \alpha_i                     αi​
) 的值。然后,我们可以使用 (
                                         w                            =                                       ∑                                           i                                  =                                  1                                          n                                                 α                               i                                                 y                               i                                                 x                               i                                            w = \sum_{i=1}^n \alpha_i y_i x_i                     w=i=1∑n​αi​yi​xi​
) 来找到 ( w ) 的值。最后,我们可以通过选择一个支持向量 ( x_i ) 并使用 (
                                                    y                               i                                      (                            w                            ⋅                                       x                               i                                      +                            b                            )                            =                            1                                  y_i (w \cdot x_i + b) = 1                     yi​(w⋅xi​+b)=1
) 来找到 ( b ) 的值。
如许,我们就找到了 ( w ) 和 ( b ) 的最优值,从而得到了 SVM 的分隔线 (
                                         f                            (                            x                            )                            =                            w                            ⋅                            x                            +                            b                                  f(x) = w \cdot x + b                     f(x)=w⋅x+b
)。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

大号在练葵花宝典

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表