推荐|深入理解LSTM神经网络

深入理解LSTM神经网络

25-03-03 22:02

3524

7549

blog.csdn.net

本文内容及图片主要参考：Understanding LSTM Networks

LSTM核心思想

LSTM最早由 Hochreiter & Schmidhuber 在1997年提出，设计初衷是希望能够解决神经网络中的长期依赖问题，让记住长期信息成为神经网络的默认行为，而不是需要很大力气才能学会。

LSTM记忆单元

LSTM-RNN展开图

下面是对LSTM单元内各部分的理解：

LSTM的关键是单元状态（cell state），即图中LSTM单元上方从左贯穿到右的水平线，它像是传送带一样，将信息从上一个单元传递到下一个单元，和其他部分只有很少的线性的相互作用。
这里写图片描述

LSTM通过“门”（gate）来控制丢弃或者增加信息，从而实现遗忘或记忆的功能。“门”是一种使信息选择性通过的结构，由一个sigmoid函数和一个点乘操作组成。sigmoid函数的输出值在[0,1]区间，0代表完全丢弃，1代表完全通过。一个LSTM单元有三个这样的门，分别是遗忘门（forget gate）、输入门（input gate）、输出门（output gate）。

门（gate）

遗忘门（forget gate）：遗忘门是以上一单元的输出 $h_{t-1}$ 和本单元的输入 $x_t$ 为输入的sigmoid函数，为

LSTM核心思想

LSTM记忆单元

评论记录：