TensorFlow中的递归神经网络(RNN)解释和用法

本文概述

递归神经网络(RNN)是一种主要用于语音识别和自然语言处理(NLP)的人工神经网络。 RNN用于深度学习和模拟人脑神经元活动的模型的开发。

循环网络旨在识别数据序列中的模式, 例如来自传感器, 股市和政府机构的文本, 基因组, 手写, 口语和数字时间序列数据。

递归神经网络看起来与传统神经网络相似, 不同之处在于将记忆状态添加到了神经元。该计算将包括一个简单的存储器。

递归神经网络是一种面向深度学习的算法, 它遵循顺序方法。在神经网络中, 我们始终假设每个输入和输出都依赖于所有其他层。这些类型的神经网络称为递归, 因为它们顺序执行数学计算。

RNN在预测未来方面有多种用途。在金融行业中, RNN可以帮助预测股票价格或股票市场方向的信号(即正面或负面)。

RNN用于自动驾驶汽车, 因为它可以通过预测车辆的路线来避免发生车祸。

RNN广泛用于图像字幕, 文本分析, 机器翻译和情感分析。例如, 应该使用电影评论来了解观众在看完电影后的感觉。当电影公司没有更多时间审查, 合并, 标记和分析评论时, 自动化此任务非常有用。机器可以更高的精度完成这项工作。

以下是RNN的应用：

我们在翻译引擎中利用递归神经网络将文本从一种语言翻译成另一种语言。他们通过结合其他模型(例如LSTM(长期短期记忆))来实现此目的。

递归神经网络已取代了使用隐马尔可夫模型的传统语音识别模型。这些递归神经网络与LSTM一起, 可以更好地对语音进行分类并将其转换为文本而不会丢失上下文。

我们利用情感分析来判断句子的阳性, 阴性或中性。因此, RNN最擅长顺序处理数据以查找句子的情感。

RNN与卷积神经网络结合, 可以检测图像并以标签形式提供其描述。例如, 使用RNN可以更好地解释狐狸越过篱笆的图片。

RNN应该及时携带信息。然而, 当时间步长太长时, 传播所有这些信息是非常具有挑战性的。当网络具有太多的深层时, 它将变得不可训练。这个问题称为：消失梯度问题。

如果我们还记得的话, 神经网络会更新梯度下降算法的权重。当网络下降到较低层时, 梯度会变小。

梯度保持恒定, 这意味着没有改进的空间。该模型从其梯度的变化中学习；此更改会影响网络的输出。如果梯度的差异太小(即权重变化不大), 则系统将无法学习任何内容, 因此输出也不会。因此, 面对消失的梯度问题的系统无法收敛到正确的解决方案。

循环网络首先执行独立激活到相关激活的转换。它还为所有层分配了相同的权重和偏差, 从而降低了参数RNN的复杂性。它通过提供先前的输出作为下一层的输入, 为记忆先前的输出提供了一个标准平台。

具有相同权重和偏差的这三个层合并为一个循环单元。

为了计算当前状态,

ht = f(ht-1, Xt)

ht =当前状态

HT-1 =先前状态

Xt =输入状态

要应用激活函数tanh, 我们有-

ht =可疑的(Whhht-1 + WxhXt)

其中

Whh =复发神经元的重量,

Wxh =输入神经元的权重

计算输出的公式：

Yt =为什么