logo资料库

LSTM中timesteps的理解.pdf

第1页 / 共2页
第2页 / 共2页
资料共2页,全文预览结束
LSTM的重要概念 2018年6月13日 19:57 1.LSTM中的一些概念 • LSTM中timesteps怎么理解? 有100个句子,每句20个词,每个词汇由80维向量表示,那时间步就是20。 来自:https://www.cnblogs.com/hd-zg/p/6852178.html 还有:前端也要完了吗?实验表明深度学习的确适合Web开发_搜狐科技_搜狐网 Andrew Trask 换个实例的话:飞机的客运流量数据集 [[ 112.] [ 118.] [ 132.] [ 129.] [ 121.] [ 135.] [ 148.] [ 148.] [ 136.] [ 119.] [ 104.] [ 118.] [ 115.] .... ] 112 118 132 129 121 …… 148 136 119 104 118 115 112 118 132 129 121 118 132 129 121 135 … … … … … 148 136 119 104 115 136 119 104 118 115 Timesteps 第一列是时间,第二列是客流量,第二列相当于一维特征,上面是取出的第二列 把一维数据变成二维数据,现在的列数相当于timesteps [[ 112. 118. 132. ..., 136. 119. 104.] [ 118. 132. 129. ..., 119. 104. 118.] [ 132. 129. 121. ..., 104. 118. 115.] ..., [ 362. 405. 417. ..., 622. 606. 508.] [ 405. 417. 391. ..., 606. 508. 461.] [ 417. 391. 419. ..., 508. 461. 390.]] LSTM的输入维度为 (samples,timesteps,input_dim)的3D张量 上面数据的格式就是(samples,timesteps)这个time_step是我们采用的时间窗口,把一个时间序列当成一条长链,我们固定一个一定长度的 窗口对这个长链进行采用,最终就得到上面的那个二维数据,那么我们缺少的是input_dim这个维度,实际上这个input_dim就是我们的那一列 数据的数据,我们现在处理的是一列也有可能是很多列,一系列与时间有关的数据需要我们去预测,或者文本处理中会遇到。 2.循环神经网络的类型 分区 LSTM 的第 1 页
2.循环神经网络的类型 • 上图一共有五个神经网络,每一个网络里红色矩形表示某个输入数据,由于一次送入网络的数据数据是由n个特征组 成,因此又可以以向量来称呼它;蓝色的则表示隐藏层的输出向量,输出向量的维度不一定是n,可以根据要解决的 问题本身确定大小;绿色的则表示隐藏层。箭头则表示向量的变换,例如矩阵乘法等。这五个网络各有特点,从左 到右依次看:第一个网络不是循环网络,它接受一次输入向量,给出一个输出向量。这类网络最典型的应用就是图 片分类,将一张图片数据送入网络,网络给出该图片包含猫、狗、人、汽车等图案的可能性。 • 第二个网络是一次输入多个输出,可以把他看成是输入一张图片,输出一句话,这句话中的每一个词是图中的一个 蓝色输出,由于输出是有序的,如果是一个训练好的网络,它给出的这些有序输出的词连起来形成一句话,而这句 话可以用来描述图片,例如送入网络一张狗正在啃骨头的照片,网络可以给出输入:“一只 正在 啃 骨头 的 狗”。 • 第三个网络则是多输入单输出,比较典型的例子是,送入网络一定数量有序的单词,网络输出这些有序的词能够组 成合乎语法和日常表达的一句话的可能性。比如我们送给网络的输入是如下三个词:”我”、“喜欢” 、“你”, 一个训练好的网络输出可以接近1,表明网络输入的是一个正确的句子。当然这只是这类网络的最简单的应用,你可 以根据任务的不同设置不同的输入输出。 • 第四个网络则是多输入多输出,但是输出与输入不同步。这一类比较典型的应用就是机器翻译了。比如说,我们送 入网络的由英语单词组成的句子 I like you. 通过额外设置一个句子终止标记(EOS,实际上人们也是用标点来表示 句子终止,对于网络需要用一次输入来表示句子终止)。当网络接收到句子终止的输入后,开始给出输出。一个训 练好会英汉翻译的网络应该在其输出层输出:“我 喜欢 你 EOS”。请不要认为这是对单个词的逐个翻译,这里只是 恰好词的次序相同罢了。如果网络实现的是英法翻译,那么其输出将是 “Je t'aime EOS”. 这里可以只有两次有意 义的输出。 • 最后一个网络同样也是多输入多输出,与前一个不同的是当第一个输入送入网络时,网络就给出了输出,这种应用 比较典型的例子是用来对一个视频的每一帧进行标签,对后续帧的标签一定程度上依赖于前面多帧的画面,或者是 对于一句话中出现的每一个词进行词性标注。 分区 LSTM 的第 2 页
分享到:
收藏