【漫话机器学习系列】152.ReLU激活函数（ReLU Activation Function） ...

梦应逍遥 · 2025-3-22 21:18:11

ReLU 激活函数详解

1. 引言

在深度学习中，激活函数（Activation Function） 是神经网络中的关键组成部分，它赋予了神经网络非线性能力，使得模型能够学习复杂的数据模式和特征。其中，修正线性单元（Rectified Linear Unit, ReLU） 是现在最流行的激活函数之一，广泛应用于深度神经网络（DNNs）、卷积神经网络（CNNs）等架构中。
本篇文章将详细介绍 ReLU 激活函数的定义、数学公式、性质、优缺点及其改进版本。

2. ReLU 的定义

ReLU 的数学定义如下：

从这个定义可以看出：

当输入 x 为负数 时，输出为 0；
当输入 x 为非负数 时，输出与输入相同，即
。

如图所示，ReLU 函数的图像出现**“分段线性”**的形态，在 x = 0 处发生拐折，负数地区恒为 0，正数地区是一条直线 y = x。

3. ReLU 的特点

ReLU 之所以受到广泛应用，重要是因为它具有以下特点：
(1) 计算简朴

ReLU 仅仅包罗了一个条件判定和简朴的线性函数，因此计算本钱比 Sigmoid 或 Tanh 更低，适用于大规模神经网络。
(2) 解决梯度消失问题

在 Sigmoid 和 Tanh 激活函数中，输入值较小时，其梯度会趋近于零，导致梯度消失（Vanishing Gradient Problem）。而 ReLU 在正区间梯度恒为 1，不会造成梯度消失问题，使得深度网络更轻易训练。
(3) 希罕激活（Sparsity）

由于负值部分恒为 0，因此神经元在某些环境下不会被激活（即输出为 0），从而使得网络具有肯定的希罕性，进步了计算效率。
(4) 非线性

虽然 ReLU 由两部分线性函数构成，但由于它是分段线性的，因此它仍然是非线性函数，可以使神经网络学习复杂的模式。

4. ReLU 的问题

尽管 ReLU 具有诸多优点，但它也存在一些问题：
(1) 死亡神经元（Dying ReLU）

当输入小于 0 时，ReLU 的梯度恒为 0，导致神经元永久不会更新，从而出现**“死亡神经元”**征象。这在训练过程中，尤其是较大的学习率下可能导致大量神经元失效，影响网络性能。
解决方案

Leaky ReLU（泄漏ReLU）：在负数地区添加一个小的斜率，使负数部分不再恒为 0，比方：
Parametric ReLU（PReLU）：与 Leaky ReLU 类似，但负数地区的斜率为可学习的参数。
Exponential Linear Unit（ELU）：在负区间利用指数函数，使其更加平滑。

(2) 输出值无上限

ReLU 的输出范围是 [0, +∞)，假如输入值很大，则输出值也会很大，可能导致梯度爆炸问题。
解决方案

利用 Batch Normalization（BN） 来对输入举行标准化，防止激活值过大。
利用 Clipped ReLU 限制最大输出值，防止梯度爆炸。

5. ReLU 的改进版本

针对 ReLU 的缺点，研究职员提出了多种改进版本：
名称公式特点Leaky ReLU

负数部分不会恒为 0，避免“死亡神经元”问题Parametric ReLU (PReLU)

，a 可学习负数部分的斜率为可学习参数，更具顺应性Exponential Linear Unit (ELU)

，

负数部分更平滑，可减少梯度消失问题Scaled Exponential Linear Unit (SELU)

，其中 f(x) 为 ELU具有自归一化（Self-Normalizing）特性

6. ReLU 在深度学习中的应用

ReLU 是现在神经网络中最常用的激活函数，特殊是在以下网络结构中：
(1) 卷积神经网络（CNN）

在 CNN 中，ReLU 通常用于卷积层（Convolutional Layer）和全连接层（Fully Connected Layer）之间，资助模型提取非线性特征。
(2) 前馈神经网络（Feedforward Neural Networks, FNN）

在全连接网络（FCN）中，ReLU 作为激活函数，资助网络举行深度训练。
(3) 生成对抗网络（GAN）

ReLU 也常用于 GAN 生成器或判别器的部分层中。

7. 结论

ReLU 激活函数在深度学习中的应用十分广泛，因其计算简朴、能有效缓解梯度消失问题，使得神经网络更轻易训练。然而，它也存在死亡神经元等问题，可以通过 Leaky ReLU、PReLU、ELU 等改进版本来优化。
总的来说，ReLU 仍然是当代神经网络的首选激活函数之一，特殊是在计算资源有限的环境下体现优越。

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

		自动登录	找回密码
密码			立即注册

【漫话机器学习系列】152.ReLU激活函数（ReLU Activation Function） ...

本帖子中包含更多资源

0 个回复

快速回复

楼主热帖

标签云

浏览过的版块

【漫话机器学习系列】152.ReLU激活函数（ReLU Activation Function） ...

本帖子中包含更多资源

0 个回复

快速回复

楼主热帖

标签云

浏览过的版块

登录参与点评抽奖加入IT实名职场社区