《近似线性可分支持向量机的原理推导》 拉格朗日函数 公式解析 ...

打印 上一主题 下一主题

主题 2305|帖子 2305|积分 6915

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本文是将文章《近似线性可分支持向量机的原理推导》中的公式单独拿出来做一个具体的解析,便于初学者更好的明白。

公式 9-41 解释:

                                         L                            (                            w                            ,                            b                            ,                            ξ                            ,                            α                            ,                            μ                            )                            =                                       1                               2                                      ∥                            w                                       ∥                               2                                      +                            C                                       ∑                                           i                                  =                                  1                                          N                                                 ξ                               i                                      −                                       ∑                                           i                                  =                                  1                                          N                                                 α                               i                                                 (                                           y                                  i                                          (                                           w                                  T                                                      x                                  i                                          +                               b                               )                               −                               (                               1                               −                                           ξ                                  i                                          )                               )                                      −                                       ∑                                           i                                  =                                  1                                          N                                                 μ                               i                                                 ξ                               i                                            L(w, b, \xi, \alpha, \mu) = \frac{1}{2} \|w\|^2 + C \sum_{i=1}^{N} \xi_i - \sum_{i=1}^{N} \alpha_i \left( y_i(w^T x_i + b) - (1 - \xi_i) \right) - \sum_{i=1}^{N} \mu_i \xi_i                     L(w,b,ξ,α,μ)=21​∥w∥2+Ci=1∑N​ξi​−i=1∑N​αi​(yi​(wTxi​+b)−(1−ξi​))−i=1∑N​μi​ξi​
公式 9-41 是 近似线性可分支持向量机(SVM)拉格朗日函数。该公式用于将原始的优化标题(如公式 9-39)转化为一个带有拉格朗日乘子约束的优化标题,从而可以使用对偶标题的方法进行求解。
1. 公式的配景:

在支持向量机的优化过程中,我们通常会碰到约束优化标题。在这种情况下,拉格朗日函数是一种非常有效的工具,它答应我们将约束条件和目标函数结合在一起。通过引入拉格朗日乘子,可以将一个约束优化标题转化为无约束的优化标题,然后可以通过求解这个拉格朗日函数的极值来得到最优解。
2. 公式的组成部门:

公式 9-41 将原始目标函数和约束条件结合起来。它包罗以下几项:
(1) 目标函数部门:

                                                    1                               2                                      ∥                            w                                       ∥                               2                                      +                            C                                       ∑                                           i                                  =                                  1                                          N                                                 ξ                               i                                            \frac{1}{2} \|w\|^2 + C \sum_{i=1}^{N} \xi_i                     21​∥w∥2+Ci=1∑N​ξi​
这一部门是原始优化标题的目标函数:


  •                                                          1                                  2                                          ∥                               w                                           ∥                                  2                                                 \frac{1}{2} \|w\|^2                        21​∥w∥2:这一项表示支持向量机的最大分类间隔。最小化                                         ∥                            w                                       ∥                               2                                            \|w\|^2                     ∥w∥2 可以找到一个使分类间隔最大化的超平面。
  •                                              C                                           ∑                                               i                                     =                                     1                                              N                                                      ξ                                  i                                                 C \sum_{i=1}^{N} \xi_i                        C∑i=1N​ξi​:这一项表示误分类惩罚的总和。通过最小化松弛变量                                                    ξ                               i                                            \xi_i                     ξi​ 的总和,我们可以控制答应的误分类样本数量。参数                                         C                                  C                     C 是惩罚系数,它控制模子对误分类的容忍度。
(2) 第一个约束条件部门:

                                         −                                       ∑                                           i                                  =                                  1                                          N                                                 α                               i                                                 (                                           y                                  i                                          (                                           w                                  T                                                      x                                  i                                          +                               b                               )                               −                               (                               1                               −                                           ξ                                  i                                          )                               )                                            -\sum_{i=1}^{N} \alpha_i \left( y_i(w^T x_i + b) - (1 - \xi_i) \right)                     −i=1∑N​αi​(yi​(wTxi​+b)−(1−ξi​))
这一部门是将第一个约束条件                                              y                            i                                  (                                   w                            T                                            x                            i                                  +                         b                         )                         ≥                         1                         −                                   ξ                            i                                       y_i(w^T x_i + b) \geq 1 - \xi_i                  yi​(wTxi​+b)≥1−ξi​ 融入拉格朗日函数中的表示:


  •                                                          α                                  i                                                 \alpha_i                        αi​:这是拉格朗日乘子,它的作用是将约束条件与目标函数结合起来。对于每个样本                                         i                                  i                     i,都有一个对应的                                                    α                               i                                            \alpha_i                     αi​,它反映了该样本对模子的贡献。若                                                    α                               i                                      =                            0                                  \alpha_i = 0                     αi​=0,说明该样本不会影响模子;若                                                    α                               i                                      >                            0                                  \alpha_i > 0                     αi​>0,说明该样本是支持向量,影响模子的决议界限。
  •                                                          y                                  i                                          (                                           w                                  T                                                      x                                  i                                          +                               b                               )                                      y_i(w^T x_i + b)                        yi​(wTxi​+b):这是分类函数的输出,表示样本                                                    x                               i                                            x_i                     xi​ 与超平面的距离。
  •                                              (                               1                               −                                           ξ                                  i                                          )                                      (1 - \xi_i)                        (1−ξi​):这是原始约束中的右边部门。通过减去                                         (                            1                            −                                       ξ                               i                                      )                                  (1 - \xi_i)                     (1−ξi​),我们可以使约束条件成立,即分类结果与软间隔条件匹配。
(3) 第二个约束条件部门:

                                         −                                       ∑                                           i                                  =                                  1                                          N                                                 μ                               i                                                 ξ                               i                                            -\sum_{i=1}^{N} \mu_i \xi_i                     −i=1∑N​μi​ξi​
这一项是对松弛变量                                              ξ                            i                                  ≥                         0                              \xi_i \geq 0                  ξi​≥0 的约束条件引入的拉格朗日乘子表示:


  •                                                          μ                                  i                                                 \mu_i                        μi​:这是另一个拉格朗日乘子,用于确保松弛变量                                                    ξ                               i                                            \xi_i                     ξi​ 大于便是 0(即                                                    ξ                               i                                      ≥                            0                                  \xi_i \geq 0                     ξi​≥0)。每个样本                                         i                                  i                     i 都有一个对应的                                                    μ                               i                                            \mu_i                     μi​,如果                                                    ξ                               i                                      =                            0                                  \xi_i = 0                     ξi​=0,则                                                    μ                               i                                      ≥                            0                                  \mu_i \geq 0                     μi​≥0。
3. 拉格朗日函数的直观解释:

拉格朗日函数通过引入拉格朗日乘子(                                             α                            i                                       \alpha_i                  αi​ 和                                              μ                            i                                       \mu_i                  μi​),将原始的优化标题及其约束条件结合在一起。通过优化这个拉格朗日函数,我们可以同时思量:


  • 目标函数:最大化分类间隔并最小化误分类数量。
  • 约束条件:使每个样本                                                    x                               i                                            x_i                     xi​ 尽量满足                                                    y                               i                                      (                                       w                               T                                                 x                               i                                      +                            b                            )                            ≥                            1                            −                                       ξ                               i                                            y_i(w^T x_i + b) \geq 1 - \xi_i                     yi​(wTxi​+b)≥1−ξi​,而且松弛变量                                                    ξ                               i                                      ≥                            0                                  \xi_i \geq 0                     ξi​≥0。
4. 公式中的各部门解释:

(1) 第一部门                                              1                            2                                  ∥                         w                                   ∥                            2                                       \frac{1}{2} \|w\|^2                  21​∥w∥2:

这一部门代表支持向量机的目标,即最大化分类间隔。最小化这一项可以使得分类超平面与数据点之间的间隔最大化。
(2) 第二部门                                    C                                   ∑                                       i                               =                               1                                      N                                            ξ                            i                                       C \sum_{i=1}^{N} \xi_i                  C∑i=1N​ξi​:

这一部门代表了对误分类样本的惩罚。通过引入松弛变量                                              ξ                            i                                       \xi_i                  ξi​,我们答应某些样本违反分类间隔条件,但我们希望通过最小化这一项来淘汰这些误分类样本的数量。
(3) 第三部门                                              ∑                                       i                               =                               1                                      N                                            α                            i                                            (                                       y                               i                                      (                                       w                               T                                                 x                               i                                      +                            b                            )                            −                            (                            1                            −                                       ξ                               i                                      )                            )                                       \sum_{i=1}^{N} \alpha_i \left( y_i(w^T x_i + b) - (1 - \xi_i) \right)                  ∑i=1N​αi​(yi​(wTxi​+b)−(1−ξi​)):

这一部门是将原始的分类约束条件引入拉格朗日函数中。通过引入拉格朗日乘子                                              α                            i                                       \alpha_i                  αi​,我们可以确保每个样本的分类结果尽量满足                                              y                            i                                  (                                   w                            T                                            x                            i                                  +                         b                         )                         ≥                         1                         −                                   ξ                            i                                       y_i(w^T x_i + b) \geq 1 - \xi_i                  yi​(wTxi​+b)≥1−ξi​ 的约束。
(4) 第四部门                                              ∑                                       i                               =                               1                                      N                                            μ                            i                                            ξ                            i                                       \sum_{i=1}^{N} \mu_i \xi_i                  ∑i=1N​μi​ξi​:

这一部门引入了松弛变量                                              ξ                            i                                  ≥                         0                              \xi_i \geq 0                  ξi​≥0 的约束。通过引入拉格朗日乘子                                              μ                            i                                       \mu_i                  μi​,我们可以确保每个松弛变量                                              ξ                            i                                       \xi_i                  ξi​ 都是非负的。
5. 优化过程:

为了找到最优解,我们必要对拉格朗日函数                                    L                         (                         w                         ,                         b                         ,                         ξ                         ,                         α                         ,                         μ                         )                              L(w, b, \xi, \alpha, \mu)                  L(w,b,ξ,α,μ) 进行求解。具体过程如下:

  • 求对                                              w                                      w                        w、                                             b                                      b                        b、和                                                          ξ                                  i                                                 \xi_i                        ξi​ 的偏导数:这将帮助我们找到最优的                                         w                                  w                     w、                                        b                                  b                     b 和                                                    ξ                               i                                            \xi_i                     ξi​,使得拉格朗日函数对这些变量达到极值。
  • 对                                                          α                                  i                                                 \alpha_i                        αi​ 进行优化:通过优化                                                    α                               i                                            \alpha_i                     αi​,我们可以找到支持向量机的对偶标题。
  • 最终求解对偶标题:通过求解对偶标题,找到最优的支持向量并确定分类超平面的位置和外形。
6. 总结:

公式 9-41 是支持向量机的拉格朗日函数,通过引入拉格朗日乘子                                              α                            i                                       \alpha_i                  αi​ 和                                              μ                            i                                       \mu_i                  μi​,将原始标题的目标函数和约束条件结合在一起。拉格朗日函数的优化过程使得我们可以或许有效地解决带有约束的优化标题,从而找到最优的分类超平面。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

立聪堂德州十三局店

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表