Oracle线性可分支持向量机的原理推导最大化几何间隔d 公式解析

老婆出轨 发表于 2024-10-22 22:21:12

线性可分支持向量机的原理推导最大化几何间隔d 公式解析

本文是将文章《线性可分支持向量机的原理推导》中的公式单独拿出来做一个详细的解析，便于初学者更好的理解。
公式 9-4 为：
                                                            max                               ⁡                                                    w                               ,                               b                                                       d                               \max_{\mathbf{w}, b} \quad d                   w,bmaxd
                                    subject to                                              y                            i                                              (                                                    w                                  ⋅                                                 x                                     i                                              +                                  b                                                       ∥                                  w                                  ∥                                                    )                                  ≥                         d                         ,                                  i                         =                         1                         ,                         2                         ,                         ⋯                      ,                         N                               \text{subject to} \quad y_i \left( \frac{\mathbf{w} \cdot \mathbf{x}_i + b}{\|\mathbf{w}\|} \right) \geq d, \quad i = 1, 2, \cdots, N                   subject toyi(∥w∥w⋅xi+b)≥d,i=1,2,⋯,N
现在我们来详细解释这个准确的公式 9-4。
1. 公式 9-4 的含义

这个公式形貌了支持向量机中的最大化分类间隔的问题。公式中的目标是最大化几何间隔                                     d                               d                   d，并且所有样本点都必须满意约束条件。详细地：

[*]目标函数：                                                             max                               ⁡                                                    w                               ,                               b                                           d                               \max_{\mathbf{w}, b} \, d                   maxw,bd 表示我们希望找到一个使几何间隔                                     d                               d                   d 最大的                                     w                               \mathbf{w}                   w 和                                     b                               b                   b。
[*]约束条件：                                                 y                            i                                              (                                                    w                                  ⋅                                                 x                                     i                                              +                                  b                                                       ∥                                  w                                  ∥                                                    )                                  ≥                         d                               y_i \left( \frac{\mathbf{w} \cdot \mathbf{x}_i + b}{\|\mathbf{w}\|} \right) \geq d                   yi(∥w∥w⋅xi+b)≥d，表示每个样本点                                                 x                            i                                        \mathbf{x}_i                   xi 到超平面的几何距离至少为                                     d                               d                   d，同时确保它们被准确分类。
几何间隔解释：

几何间隔是样本点到超平面的距离，在支持向量机中，目标是最大化这个几何间隔，即找到一个最能有效分离差异类别的超平面。
2. 公式推导中的关键

这个公式中的几何间隔                                  d                            d                d 通过以下方式表示：
                                                            w                               ⋅                                           x                                  i                                           +                               b                                                    ∥                               w                               ∥                                                    \frac{\mathbf{w} \cdot \mathbf{x}_i + b}{\|\mathbf{w}\|}                   ∥w∥w⋅xi+b
此中：

[*]                                     w                         ⋅                                     x                            i                                  +                         b                               \mathbf{w} \cdot \mathbf{x}_i + b                   w⋅xi+b 表示超平面的分类函数，决定了样本点                                                 x                            i                                        \mathbf{x}_i                   xi 与超平面的相对位置。
[*]                                     ∥                         w                         ∥                               \|\mathbf{w}\|                   ∥w∥ 是超平面法向量                                     w                               \mathbf{w}                   w 的范数，表示分类超平面的陡峭水平。
通过将样本点的分类函数归一化为                                  ∥                      w                      ∥                            \|\mathbf{w}\|                ∥w∥，可以确保公式计算的是几何意义上的实际距离，而不是受法向量巨细影响的带符号距离。
3. 约束条件的意义

约束条件：
                                                y                            i                                              (                                                    w                                  ⋅                                                 x                                     i                                              +                                  b                                                       ∥                                  w                                  ∥                                                    )                                  ≥                         d                         ,                                  i                         =                         1                         ,                         2                         ,                         ⋯                      ,                         N                               y_i \left( \frac{\mathbf{w} \cdot \mathbf{x}_i + b}{\|\mathbf{w}\|} \right) \geq d, \quad i = 1, 2, \cdots, N                   yi(∥w∥w⋅xi+b)≥d,i=1,2,⋯,N
确保了每个样本点                                           x                         i                                     \mathbf{x}_i                xi 的分类结果与它的真实类别                                           y                         i                                     y_i                yi 同等。详细来说：

[*]对于                                                 y                            i                                  =                         +                         1                               y_i = +1                   yi=+1 的正类样本，约束条件要求                                     w                         ⋅                                     x                            i                                  +                         b                         ≥                         ∥                         w                         ∥                         d                               \mathbf{w} \cdot \mathbf{x}_i + b \geq \|\mathbf{w}\| d                   w⋅xi+b≥∥w∥d，也就是说，正类样本位于超平面的“正侧”且距离至少为                                     d                               d                   d。
[*]对于                                                 y                            i                                  =                         −                         1                               y_i = -1                   yi=−1 的负类样本，约束条件要求                                     w                         ⋅                                     x                            i                                  +                         b                         ≤                         −                         ∥                         w                         ∥                         d                               \mathbf{w} \cdot \mathbf{x}_i + b \leq -\|\mathbf{w}\| d                   w⋅xi+b≤−∥w∥d，负类样本位于超平面的“负侧”且距离至少为                                     d                               d                   d。
因此，这个约束确保了所有样本点不仅被准确分类，而且它们与超平面的距离不小于                                  d                            d                d。
4. 间隔最大化的头脑

支持向量机的焦点头脑是最大化最小间隔，即找到一个超平面，使得最靠近超平面的样本点（即支持向量）到超平面的距离                                  d                            d                d 尽大概大。在这个公式中，目标是直接最大化这个最小间隔                                  d                            d                d，在包管分类约束条件的情况下。
5. 公式 9-4 的进一步简化

接下来的推导中，最大化几何间隔                                  d                            d                d 的优化问题可以进一步简化。因为几何间隔的绝对值                                  d                            d                d 实际上不会影响问题的求解，因此在后续公式中我们可以假设                                  d                      =                      1                            d = 1                d=1，将问题简化为：
                                                            min                               ⁡                                                    w                               ,                               b                                                                   1                            2                                  ∥                         w                                     ∥                            2                                        \min_{\mathbf{w}, b} \quad \frac{1}{2} \|\mathbf{w}\|^2                   w,bmin21∥w∥2
                                    subject to                                              y                            i                                  (                         w                         ⋅                                     x                            i                                  +                         b                         )                         ≥                         1                         ,                                  i                         =                         1                         ,                         2                         ,                         ⋯                      ,                         N                               \text{subject to} \quad y_i (\mathbf{w} \cdot \mathbf{x}_i + b) \geq 1, \quad i = 1, 2, \cdots, N                   subject toyi(w⋅xi+b)≥1,i=1,2,⋯,N
这就是支持向量机优化问题的标准情势，即最小化法向量的范数                                  ∥                      w                      ∥                            \|\mathbf{w}\|                ∥w∥ 的平方，同时确保所有样本点满意分类约束。
总结

公式 9-4 的目标是最大化几何间隔                                  d                            d                d，确保每个样本点与超平面的距离至少为                                  d                            d                d 且被准确分类。这是支持向量机的焦点头脑，后续通过固定                                  d                      =                      1                            d = 1                d=1 来简化优化问题，从而得到最小化                                  w                            \mathbf{w}                w 的范数的最终优化情势。

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

页: [1]

IT评测·应用市场-qidao123.com技术社区's Archiver

线性可分支持向量机的原理推导 最大化几何间隔d 公式解析

线性可分支持向量机的原理推导最大化几何间隔d 公式解析