分布式数据库【差分隐私相关概念】最大化似然函数就是最小化L1范数

伤心客 发表于 2025-3-25 06:35:31

【差分隐私相关概念】最大化似然函数就是最小化L1范数

1. 噪声分布与最大似然估计的关系

[*]噪声类型：矩阵机制中，噪声                                     η                         =                                     r                            ~                                  −                                     A                            x                                        \eta = \widetilde{\mathbf{r}} - \mathbf{Ax}                   η=r          −Ax 服从拉普拉斯分布                                     η                         ∼                         Lap                         (                                     Δ                            A                                  /                         ϵ                         )                               \eta \sim \text{Lap}(\Delta_\mathbf{A}/\epsilon)                   η∼Lap(ΔA/ϵ)。
[*]拉普拉斯分布的密度函数：
                                          f                            (                                        η                               i                                        )                            =                                        ϵ                                           2                                                 Δ                                     A                                                                            e                                           −                                  ϵ                                  ∣                                                 η                                     i                                              ∣                                  /                                                 Δ                                     A                                                                .                                  f(\eta_i) = \frac{\epsilon}{2\Delta_\mathbf{A}} e^{-\epsilon |\eta_i| / \Delta_\mathbf{A}}.                      f(ηi)=2ΔAϵe−ϵ∣ηi∣/ΔA.
其对数似然函数为：
                                          log                            ⁡                            f                            (                            η                            )                            =                            常数                            −                                        ϵ                                           Δ                                  A                                                    ∥                            η                                        ∥                               1                                        .                                  \log f(\eta) = \text{常数} - \frac{\epsilon}{\Delta_\mathbf{A}} \|\eta\|_1.                      logf(η)=常数−ΔAϵ∥η∥1.
最大化似然等价于最小化                                           ∥                            η                                        ∥                               1                                              \|\eta\|_1                      ∥η∥1，即最小化                                     ∥                                     r                            ~                                  −                                     A                            x                                              ∥                            1                                        \|\widetilde{\mathbf{r}} - \mathbf{Ax}\|_1                   ∥r          −Ax∥1。
2. 非负约束的必要性

[*]原始数据特性：数据库                                     x                               \mathbf{x}                   x 由非负整数构成（如人口计数）。
[*]伪逆解的缺陷：最小二乘解                                                 x                            ^                                  =                                     A                            †                                              r                            ~                                        \widehat{\mathbf{x}} = \mathbf{A}^\dagger \widetilde{\mathbf{r}}                   x          =A†r          可能包含负数，违背实际意义。
[*]后处理目的：找到非负且与噪声数据最接近的估计值                                                 x                            ‾                                  ≥                         0                               \overline{\mathbf{x}} \geq 0                   x≥0。
3. 优化问题的数学形式

终极的优化问题为：
                                                x                            ‾                                  =                         arg                         ⁡                                                 min                               ⁡                                                                x                                  ^                                           ≥                               0                                              ∥                                     r                            ~                                  −                         A                                     x                            ^                                              ∥                            1                                  .                               \overline{\mathbf{x}} = \arg \min_{\widehat{\mathbf{x}} \geq 0} \|\widetilde{\mathbf{r}} - \mathbf{A}\widehat{\mathbf{x}}\|_1.                   x=argx                ≥0min∥r          −Ax          ∥1.
其寄义如下：

[*]目的函数（                                     ∥                         ⋅                                     ∥                            1                                        \|\cdot\|_1                   ∥⋅∥1）：最大化拉普拉斯噪声下的似然概率。
[*]约束条件（                                                 x                            ^                                  ≥                         0                               \widehat{\mathbf{x}} \geq 0                   x          ≥0）：确保估计值符合现实意义。
4. 具体示例说明

场景：

[*]数据库                                     x                         =                         [                                     x                            1                                  ,                                     x                            2                                  ]                               \mathbf{x} =                   x= 体现城市和农村人口，真实值                                     x                         =                         [                         100                         ,                         200                         ]                               \mathbf{x} =                   x=。
[*]策略矩阵                                     A                         =                                     [                                                                                  1                                                                                           1                                                                                                                1                                                                                                          −                                           1                                                                                              ]                                        \mathbf{A} = \begin{bmatrix} 1 & 1 \\ 1 & -1 \end{bmatrix}                   A=，查询总人口和城乡差。
[*]噪声响应                                                 r                            ~                                  =                         [                         303                         ,                         −                         101                         ]                               \widetilde{\mathbf{r}} =                   r          =。
步骤：

[*] 最小二乘解：
                                                            x                                  ^                                           =                                           A                                  †                                                       r                                  ~                                           =                               [                               101                               ,                               202                               ]                               .                                        \widehat{\mathbf{x}} = \mathbf{A}^\dagger \widetilde{\mathbf{r}} = .                         x             =A†r             =.
效果非负，可直接接受。
[*] 若噪声导致负值：
假设                                                       r                               ~                                        =                            [                            300                            ,                            150                            ]                                  \widetilde{\mathbf{r}} =                      r          =，则：
                                                            x                                  ^                                           =                                           A                                  †                                                       r                                  ~                                           =                               [                               225                               ,                               75                               ]                               .                                        \widehat{\mathbf{x}} = \mathbf{A}^\dagger \widetilde{\mathbf{r}} = .                         x             =A†r             =.
仍为非负，无需优化。
[*] 需优化的环境：
若                                                       r                               ~                                        =                            [                            290                            ,                            90                            ]                                  \widetilde{\mathbf{r}} =                      r          =，则：
                                                            x                                  ^                                           =                                           A                                  †                                                       r                                  ~                                           =                               [                               190                               ,                               100                               ]                               .                                        \widehat{\mathbf{x}} = \mathbf{A}^\dagger \widetilde{\mathbf{r}} = .                         x             =A†r             =.
若出现负数（如                                                       x                               ^                                        =                            [                            150                            ,                            −                            50                            ]                                  \widehat{\mathbf{x}} =                      x          =），需通过优化问题修正。
5. 总结

[*]L1 范数 vs L2 范数：

[*]拉普拉斯噪声的最大似然估计对应 L1 范数最小化。
[*]高斯噪声的 MLE 对应 L2 范数最小化（如最小二乘）。

[*]非负约束：

[*]欺压估计值                                                             x                                  ‾                                                    \overline{\mathbf{x}}                         x 符合现实数据的非负性。

[*]优化问题意义：

[*]在满足实际约束（非负）的条件下，最大化观测到噪声数据的概率。

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

页: [1]

IT评测·应用市场-qidao123.com技术社区's Archiver

【差分隐私相关概念】最大化似然函数就是最小化L1范数