logo资料库

卷积神经网络CNN代码解析-matlab.doc

第1页 / 共11页
第2页 / 共11页
第3页 / 共11页
第4页 / 共11页
第5页 / 共11页
第6页 / 共11页
第7页 / 共11页
第8页 / 共11页
资料共11页,剩余部分请下载后查看
一、Test_example_CNN:
三、cnntrain.m
四、cnnff.m
五、cnnbp.m
五、cnnapplygrads.m
六、cnntest.m
卷积神经网络 CNN 代码解析 deepLearnToolbox-master 是一个深度学习 matlab 包,里面含有很多机器学习算法,如卷积神经网络 CNN,深 度信念网络 DBN,自动编码 AutoEncoder(堆栈 SAE,卷积 CAE)的作者是 Rasmus Berg Palm (rasmusbergpalm@gmail.com) 代码下载:https://github.com/rasmusbergpalm/DeepLearnToolbox 这里我们介绍 deepLearnToolbox-master 中的 CNN 部分。 DeepLearnToolbox-master 中 CNN 内的 函数: 调用关系为: 该模型使用了 mnist 的数字 mnist_uint8.mat 作为训练样本,作为 cnn 的一个使用样例, 每个样本特征为一个 28*28=的向量。 1 内蒙古大学 计算机学院 模式识别小组 小强 459125872@qq.com
网络结构为: 让我们来看看各个函数: 一、Test_example_CNN:.................................................................................................................................................... 2 三、cnntrain.m.....................................................................................................................................................................5 四、cnnff.m..........................................................................................................................................................................6 五、cnnbp.m........................................................................................................................................................................ 7 五、cnnapplygrads.m........................................................................................................................................................ 10 六、cnntest.m.....................................................................................................................................................................11 一、Test_example_CNN: Test_example_CNN: 1 设置 CNN 的基本参数规格,如卷积、降采样层的数量,卷积核的大小、降采样的降幅 2 cnnsetup 函数 初始化卷积核、偏置等 3 cnntrain 函数 训练 cnn,把训练数据分成 batch,然后调用 3.1 cnnff 完成训练的前向过程, 2 内蒙古大学 计算机学院 模式识别小组 小强 459125872@qq.com
3.2 3.3 cnnbp 计算并传递神经网络的 error,并计算梯度(权重的修改量) cnnapplygrads 把计算出来的梯度加到原始模型上去 4 cnntest 函数,测试当前模型的准确率 该模型采用的数据为 mnist_uint8.mat, 含有 70000 个手写数字样本其中 60000 作为训练样本,10000 作为测试样本。 把数据转成相应的格式,并归一化。 设置网络结构及训练参数 初始化网络,对数据进行批训练,验证模型准确率 绘制均方误差曲线 二、Cnnsetup.m 该函数你用于初始化 CNN 的参数。 设置各层的 mapsize 大小, 初始化卷积层的卷积核、bias 尾部单层感知机的参数设置 * bias 统一设置为 0 权重设置为:-1~1 之间的随机数/sqrt(6/(输入神经元数量+输出神经元数量)) 3 内蒙古大学 计算机学院 模式识别小组 小强 459125872@qq.com
对于卷积核权重,输入输出为 fan_in, fan_out fan_out = net.layers{l}.outputmaps * net.layers{l}.kernelsize ^ 2; %卷积核初始化,1 层卷积为 1*6 个卷积核,2 层卷积一共 6*12=72 个卷积核。对于每个卷积输出 featuremap, %fan_in = 表示该层的一个输出 map,所对应的所有卷积核,包含的神经元的总数。1*25,6*25 fan_in = numInputmaps * net.layers{l}.kernelsize ^ 2; fin =1*25 fout=1*6*25 6*25 6*12*25 or or net.layers{l}.k{i}{j} = (rand(net.layers{l}.kernelsize) - 0.5) * 2 * sqrt(6 / (fan_in + fan_out)); 1 卷积降采样的参数初始化 2 尾部单层感知机的参数(权重和偏量)设置: 4 内蒙古大学 计算机学院 模式识别小组 小强 459125872@qq.com
三、cnntrain.m 该函数用于训练 CNN。 生成随机序列,每次选取一个 batch(50)个样本进行训练。 批训练:计算 50 个随机样本的梯度,求和之后一次性更新到模型权重中。 在批训练过程中调用: Cnnff.m 完成前向过程 Cnnbp.m 完成误差传导和梯度计算过程 Cnnapplygrads.m 把计算出来的梯度加到原始模型上去 5 内蒙古大学 计算机学院 模式识别小组 小强 459125872@qq.com
四、cnnff.m 1、取得 CNN 的输入 2、两次卷积核降采样层处理 3、尾部单层感知机的数据处理,需要把 subFeatureMap2 连接成为一个(4*4)*12=192 的向量,但是由于采用了 50 样 本批训练的方法,subFeatureMap2 被拼合成为一个 192*50 的特征向量 fv; Fv 作为单层感知机的输入,全连接的方式得到输出层 6 内蒙古大学 计算机学院 模式识别小组 小强 459125872@qq.com
五、cnnbp.m 该函数实现 2 部分功能,计算并传递误差,计算梯度 1、计算误差和 LossFunction 2、计算尾部单层感知机的误差 3、把单层感知机的输入层 featureVector 的误差矩阵,恢复为 subFeatureMap2 的 4*4 二维矩阵形式 7 内蒙古大学 计算机学院 模式识别小组 小强 459125872@qq.com
插播一张图片: 4、误差在特征提取网络【卷积降采样层】的传播 如果本层是卷积层,它的误差是从后一层(降采样层)传过来,误差传播实际上是用降采样的反向过程,也就是降 采样层的误差复制为 2*2=4 份。卷积层的输入是经过 sigmoid 处理的,所以,从降采样层扩充来的误差要经过 sigmoid 求导处理。 如果本层是降采样层,他的误差是从后一层(卷积层)传过来,误差传播实际是用卷积的反向过程,也就是卷积层 的误差,反卷积(卷积核转 180 度)卷积层的误差,原理参看插图。 8 内蒙古大学 计算机学院 模式识别小组 小强 459125872@qq.com
分享到:
收藏