老婆出轨 发表于 2024-10-22 22:21:12

线性可分支持向量机的原理推导 最大化几何间隔d 公式解析

本文是将文章《线性可分支持向量机的原理推导》中的公式单独拿出来做一个详细的解析,便于初学者更好的理解。
公式 9-4 为:
                                                                max                                  ⁡                                                      w                                  ,                                  b                                                          d                                  \max_{\mathbf{w}, b} \quad d                     w,bmax​d
                                       subject to                                                y                               i                                                 (                                                      w                                     ⋅                                                   x                                        i                                                +                                     b                                                         ∥                                     w                                     ∥                                                      )                                    ≥                            d                            ,                                     i                            =                            1                            ,                            2                            ,                            ⋯                             ,                            N                                  \text{subject to} \quad y_i \left( \frac{\mathbf{w} \cdot \mathbf{x}_i + b}{\|\mathbf{w}\|} \right) \geq d, \quad i = 1, 2, \cdots, N                     subject toyi​(∥w∥w⋅xi​+b​)≥d,i=1,2,⋯,N
现在我们来详细解释这个准确的公式 9-4。
1. 公式 9-4 的含义

这个公式形貌了支持向量机中的最大化分类间隔的问题。公式中的目标是最大化几何间隔                                       d                                  d                     d,并且所有样本点都必须满意约束条件。详细地:


[*]目标函数:                                                               max                                  ⁡                                                      w                                  ,                                  b                                                  d                                  \max_{\mathbf{w}, b} \, d                     maxw,b​d 表示我们希望找到一个使几何间隔                                       d                                  d                     d 最大的                                       w                                  \mathbf{w}                     w 和                                       b                                  b                     b。
[*]约束条件:                                                   y                               i                                                 (                                                      w                                     ⋅                                                   x                                        i                                                +                                     b                                                         ∥                                     w                                     ∥                                                      )                                    ≥                            d                                  y_i \left( \frac{\mathbf{w} \cdot \mathbf{x}_i + b}{\|\mathbf{w}\|} \right) \geq d                     yi​(∥w∥w⋅xi​+b​)≥d,表示每个样本点                                                    x                               i                                          \mathbf{x}_i                     xi​ 到超平面的几何距离至少为                                       d                                  d                     d,同时确保它们被准确分类。
几何间隔解释:

几何间隔是样本点到超平面的距离,在支持向量机中,目标是最大化这个几何间隔,即找到一个最能有效分离差异类别的超平面。
2. 公式推导中的关键

这个公式中的几何间隔                                    d                              d                  d 通过以下方式表示:
                                                                w                                  ⋅                                             x                                     i                                              +                                  b                                                      ∥                                  w                                  ∥                                                       \frac{\mathbf{w} \cdot \mathbf{x}_i + b}{\|\mathbf{w}\|}                     ∥w∥w⋅xi​+b​
此中:


[*]                                        w                            ⋅                                       x                               i                                    +                            b                                  \mathbf{w} \cdot \mathbf{x}_i + b                     w⋅xi​+b 表示超平面的分类函数,决定了样本点                                                    x                               i                                          \mathbf{x}_i                     xi​ 与超平面的相对位置。
[*]                                        ∥                            w                            ∥                                  \|\mathbf{w}\|                     ∥w∥ 是超平面法向量                                       w                                  \mathbf{w}                     w 的范数,表示分类超平面的陡峭水平。
通过将样本点的分类函数归一化为                                    ∥                         w                         ∥                              \|\mathbf{w}\|                  ∥w∥,可以确保公式计算的是几何意义上的实际距离,而不是受法向量巨细影响的带符号距离。
3. 约束条件的意义

约束条件:
                                                    y                               i                                                 (                                                      w                                     ⋅                                                   x                                        i                                                +                                     b                                                         ∥                                     w                                     ∥                                                      )                                    ≥                            d                            ,                                     i                            =                            1                            ,                            2                            ,                            ⋯                             ,                            N                                  y_i \left( \frac{\mathbf{w} \cdot \mathbf{x}_i + b}{\|\mathbf{w}\|} \right) \geq d, \quad i = 1, 2, \cdots, N                     yi​(∥w∥w⋅xi​+b​)≥d,i=1,2,⋯,N
确保了每个样本点                                              x                            i                                       \mathbf{x}_i                  xi​ 的分类结果与它的真实类别                                              y                            i                                       y_i                  yi​ 同等。详细来说:


[*]对于                                                    y                               i                                    =                            +                            1                                  y_i = +1                     yi​=+1 的正类样本,约束条件要求                                       w                            ⋅                                       x                               i                                    +                            b                            ≥                            ∥                            w                            ∥                            d                                  \mathbf{w} \cdot \mathbf{x}_i + b \geq \|\mathbf{w}\| d                     w⋅xi​+b≥∥w∥d,也就是说,正类样本位于超平面的“正侧”且距离至少为                                       d                                  d                     d。
[*]对于                                                    y                               i                                    =                            −                            1                                  y_i = -1                     yi​=−1 的负类样本,约束条件要求                                       w                            ⋅                                       x                               i                                    +                            b                            ≤                            −                            ∥                            w                            ∥                            d                                  \mathbf{w} \cdot \mathbf{x}_i + b \leq -\|\mathbf{w}\| d                     w⋅xi​+b≤−∥w∥d,负类样本位于超平面的“负侧”且距离至少为                                       d                                  d                     d。
因此,这个约束确保了所有样本点不仅被准确分类,而且它们与超平面的距离不小于                                    d                              d                  d。
4. 间隔最大化的头脑

支持向量机的焦点头脑是最大化最小间隔,即找到一个超平面,使得最靠近超平面的样本点(即支持向量)到超平面的距离                                    d                              d                  d 尽大概大。在这个公式中,目标是直接最大化这个最小间隔                                    d                              d                  d,在包管分类约束条件的情况下。
5. 公式 9-4 的进一步简化

接下来的推导中,最大化几何间隔                                    d                              d                  d 的优化问题可以进一步简化。因为几何间隔的绝对值                                    d                              d                  d 实际上不会影响问题的求解,因此在后续公式中我们可以假设                                    d                         =                         1                              d = 1                  d=1,将问题简化为:
                                                                min                                  ⁡                                                      w                                  ,                                  b                                                                     1                               2                                    ∥                            w                                       ∥                               2                                          \min_{\mathbf{w}, b} \quad \frac{1}{2} \|\mathbf{w}\|^2                     w,bmin​21​∥w∥2
                                       subject to                                                y                               i                                    (                            w                            ⋅                                       x                               i                                    +                            b                            )                            ≥                            1                            ,                                     i                            =                            1                            ,                            2                            ,                            ⋯                             ,                            N                                  \text{subject to} \quad y_i (\mathbf{w} \cdot \mathbf{x}_i + b) \geq 1, \quad i = 1, 2, \cdots, N                     subject toyi​(w⋅xi​+b)≥1,i=1,2,⋯,N
这就是支持向量机优化问题的标准情势,即最小化法向量的范数                                    ∥                         w                         ∥                              \|\mathbf{w}\|                  ∥w∥ 的平方,同时确保所有样本点满意分类约束。
总结

公式 9-4 的目标是最大化几何间隔                                    d                              d                  d,确保每个样本点与超平面的距离至少为                                    d                              d                  d 且被准确分类。这是支持向量机的焦点头脑,后续通过固定                                    d                         =                         1                              d = 1                  d=1 来简化优化问题,从而得到最小化                                    w                              \mathbf{w}                  w 的范数的最终优化情势。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 线性可分支持向量机的原理推导 最大化几何间隔d 公式解析