LSTM的重要概念
2018年6月13日
19:57
1.LSTM中的一些概念
•
LSTM中timesteps怎么理解?
有100个句子,每句20个词,每个词汇由80维向量表示,那时间步就是20。
来自:https://www.cnblogs.com/hd-zg/p/6852178.html
还有:前端也要完了吗?实验表明深度学习的确适合Web开发_搜狐科技_搜狐网
Andrew Trask
换个实例的话:飞机的客运流量数据集
[[ 112.]
[ 118.]
[ 132.]
[ 129.]
[ 121.]
[ 135.]
[ 148.]
[ 148.]
[ 136.]
[ 119.]
[ 104.]
[ 118.]
[ 115.]
....
]
112 118 132 129 121 ……
148 136 119 104 118 115
112 118 132 129 121
118 132 129 121 135
…
…
…
…
…
148 136 119 104 115
136 119 104 118 115
Timesteps
第一列是时间,第二列是客流量,第二列相当于一维特征,上面是取出的第二列
把一维数据变成二维数据,现在的列数相当于timesteps
[[ 112. 118. 132. ..., 136. 119. 104.]
[ 118. 132. 129. ..., 119. 104. 118.]
[ 132. 129. 121. ..., 104. 118. 115.]
...,
[ 362. 405. 417. ..., 622. 606. 508.]
[ 405. 417. 391. ..., 606. 508. 461.]
[ 417. 391. 419. ..., 508. 461. 390.]]
LSTM的输入维度为
(samples,timesteps,input_dim)的3D张量
上面数据的格式就是(samples,timesteps)这个time_step是我们采用的时间窗口,把一个时间序列当成一条长链,我们固定一个一定长度的
窗口对这个长链进行采用,最终就得到上面的那个二维数据,那么我们缺少的是input_dim这个维度,实际上这个input_dim就是我们的那一列
数据的数据,我们现在处理的是一列也有可能是很多列,一系列与时间有关的数据需要我们去预测,或者文本处理中会遇到。
2.循环神经网络的类型
分区 LSTM 的第 1 页
2.循环神经网络的类型
•
上图一共有五个神经网络,每一个网络里红色矩形表示某个输入数据,由于一次送入网络的数据数据是由n个特征组
成,因此又可以以向量来称呼它;蓝色的则表示隐藏层的输出向量,输出向量的维度不一定是n,可以根据要解决的
问题本身确定大小;绿色的则表示隐藏层。箭头则表示向量的变换,例如矩阵乘法等。这五个网络各有特点,从左
到右依次看:第一个网络不是循环网络,它接受一次输入向量,给出一个输出向量。这类网络最典型的应用就是图
片分类,将一张图片数据送入网络,网络给出该图片包含猫、狗、人、汽车等图案的可能性。
•
第二个网络是一次输入多个输出,可以把他看成是输入一张图片,输出一句话,这句话中的每一个词是图中的一个
蓝色输出,由于输出是有序的,如果是一个训练好的网络,它给出的这些有序输出的词连起来形成一句话,而这句
话可以用来描述图片,例如送入网络一张狗正在啃骨头的照片,网络可以给出输入:“一只 正在 啃 骨头 的 狗”。
•
第三个网络则是多输入单输出,比较典型的例子是,送入网络一定数量有序的单词,网络输出这些有序的词能够组
成合乎语法和日常表达的一句话的可能性。比如我们送给网络的输入是如下三个词:”我”、“喜欢” 、“你”,
一个训练好的网络输出可以接近1,表明网络输入的是一个正确的句子。当然这只是这类网络的最简单的应用,你可
以根据任务的不同设置不同的输入输出。
•
第四个网络则是多输入多输出,但是输出与输入不同步。这一类比较典型的应用就是机器翻译了。比如说,我们送
入网络的由英语单词组成的句子 I like you. 通过额外设置一个句子终止标记(EOS,实际上人们也是用标点来表示
句子终止,对于网络需要用一次输入来表示句子终止)。当网络接收到句子终止的输入后,开始给出输出。一个训
练好会英汉翻译的网络应该在其输出层输出:“我 喜欢 你 EOS”。请不要认为这是对单个词的逐个翻译,这里只是
恰好词的次序相同罢了。如果网络实现的是英法翻译,那么其输出将是 “Je t'aime EOS”. 这里可以只有两次有意
义的输出。
•
最后一个网络同样也是多输入多输出,与前一个不同的是当第一个输入送入网络时,网络就给出了输出,这种应用
比较典型的例子是用来对一个视频的每一帧进行标签,对后续帧的标签一定程度上依赖于前面多帧的画面,或者是
对于一句话中出现的每一个词进行词性标注。
分区 LSTM 的第 2 页