博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
LSTM神经网络
阅读量:7209 次
发布时间:2019-06-29

本文共 568 字,大约阅读时间需要 1 分钟。

LSTM是什么

LSTM即Long Short Memory Network,长短时记忆网络。它其实是属于RNN的一种变种,可以说它是为了克服RNN无法很好处理远距离依赖而提出的。

我们说RNN不能处理距离较远的序列是因为训练时很有可能会出现梯度消失,即通过下面的公式训练时很可能会发生指数缩小,让RNN失去了对较远时刻的感知能力。

4e8c76d36f1373319725db749001f0ca483943e0

解决思路

6725322e8d3f8655f6f7d45e6368f1bbd89edeb4

LSTM模型

回顾一下RNN的模型,如下图,展开后多个时刻隐层互相连接,而所有循环神经网络都有一个重复的网络模块,RNN的重复网络模块很简单,如下下图,比如只有一个tanh层。 

这里写图片描述

这里写图片描述

而LSTM的重复网络模块的结构则复杂很多,它实现了三个门计算,即遗忘门、输入门和输出门。每个门负责是事情不一样,遗忘门负责决定保留多少上一时刻的单元状态到当前时刻的单元状态;输入门负责决定保留多少当前时刻的输入到当前时刻的单元状态;输出门负责决定当前时刻的单元状态有多少输出。

这里写图片描述

每个LSTM包含了三个输入,即上时刻的单元状态、上时刻LSTM的输出和当前时刻输入。

LSTM的机制

这里写图片描述

9aaf6e67a7da653a29b800df2212153a863ecaf7

这里写图片描述

b64350136626e212b87b540bf7623f2e050e15e2

这里写图片描述

036a0336102fc99322278228c42c100e2e208aa9

这里写图片描述

66d510c2786f619a7a38984b14c7e5c6aadcfbff

这里写图片描述

LSTM的训练

3d3752800197c37db2b52de0d2b112090aace04d

f8c44490a173eddd15fe3eb02fc358dc943ce99a

d493d24ce97e6206a2f1b828cf419f8dc8874f5e

c0817b679b98a7b65571b82d9f5369a25bafccbe

dd07276878ca972a925ced605d0fb2b6d6cdda91

5bb87a5fdf4a4382a4056105a25ecc2e3bc1bd8a

相关阅读: 

 
 
 
 

========广告时间========

鄙人的新书《Tomcat内核设计剖析》已经在京东销售了,有需要的朋友可以到  进行预定。感谢各位朋友。

=========================

欢迎关注:

这里写图片描述

你可能感兴趣的文章
C#窗体控件-单选按钮控件RadioButton
查看>>
[C++]红色波浪线是什么意思
查看>>
tomcat之 JDK8.0安装、tomcat-8.5.15安装
查看>>
Android ADB命令
查看>>
Java调用Lua脚本(热载实现)
查看>>
排除“使用主题 css 文件要求页上有标头控件。(例如 <head runat="server" />)”错误...
查看>>
jdk1.7的新特性
查看>>
关注一下IBM工具
查看>>
JS 英文不截断单词截取
查看>>
Oracle 数据定义
查看>>
百度分享自定义内容和图片
查看>>
关于代码评审的微博讨论汇集
查看>>
PHP vs Java
查看>>
C# 连接SQL Server数据库的几种方式--server+data source等方式
查看>>
Qt控件中的属性sizePolicy说明
查看>>
针对Properties中实时性要求不高的配置参数,用Java缓存起来
查看>>
Flex读取txt文件里的内容(二)
查看>>
mysql 变量set
查看>>
Deep Learning(深度学习)学习笔记整理系列
查看>>
【C解毒】缘木求鱼
查看>>