keras做CNN的训练误差loss的下降操作.pdf

发布时间：2022-05-30 发布人：admin 分类：说明书资料大小：0.08M 资料格式：pdf 举报版权申诉

weixin_38699757-12850527-jiaoben-python-322240.pdf-第1页.png

第1页 / 共2页

weixin_38699757-12850527-jiaoben-python-322240.pdf-第2页.png

第2页 / 共2页

文本预览

的训练误差loss的下降操作的下降操作 keras做做CNN的训练误差主要介绍了keras做CNN的训练误差loss的下降操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧采用二值判断如果确认是噪声，用该点上面一个灰度进行替换。噪声点处理：对原点周围的八个点进行扫描，比较。当该点像素值与周围8个点的值小于N时，此点为噪点。噪声点处理：处理后的文件大小只有原文件小的三分之一，前后的图片内容肉眼几乎无法察觉。但是这样处理后图片放入CNN中在其他条件不变的情况下，模型loss无法下降，二分类图片，loss一直在8-9之间。准确率维持在0.5,同时，测试集的训练误差持续下降，但是准确率也在0.5徘徊。大概真是需要误差，让优化方法从局部最优跳出来。使用的activation function是relu，full connection layer是softmax分类函数，优化方法为RMsprop 难到是需要加入噪音更好，CNN中加入高斯噪音不是让模型更稳健的吗？还有让模型跳出局部最优的好处，方便训练。原意：降噪的目的是因为这批数据是样本较少，用复印机扫面出来的图片，想着放入更干净的数据，模型更容易学习到本质特征。结果事与愿违，但是在keras中是可以加入noise的，比如加入高斯噪音 form keras.layers.noise import GaussianNoise 我在全连接层中加入 model.add(GaussianNoise(0.125)) 后来查看了BatchNormalization的作用，发现在这个大杀器之后，好像很少有人用到初始化和其他的tricks，就可以让模型表现的很好。在第一层的Maxpooling后面加上，model.add(BatchNormalization())，效果非常显著，第一次epoch的loss值只有0.63，acc也迅速上升，不会出现之前的卡在8.354一直不动，哪怕更换 leraning rate和使用Adagrad，都是一样的，如果前面的5个epoch 完，还是没有太大的变化，后面几乎不会收敛。 1，leraning rate的设置 #导入模块，以rmsprop为例 from keras.optimizers import rmsprop rmsprop=rmsprop(lr=0.1)#只是更改了学习率，其他的参数没有更改，默认学习率是0.001 2.BatchNormalization()的设置 from keras.layers.normalization import BatchNormalization #网上不少人说，批规范化加在输入层的激活函数（层）的前面 model.add(BatchNormalization()) 也有看到每一个隐藏层的激活函数前面全部加上BN的，但是我这个实验中，效果很差。 3.在输入数据的时候，依然加上train_x = data/255.0，对像素矩阵的取值放小到0-1之间，否则训练将很艰难。其实在我自己的实验中，后来调整成： train_x-= np.mean(train_x, axis = 0) 发现效果更好 4.如果第一次的epoch的loss在个位数，则很可能需要返回去重新构建模型，加入更多的trick，如果最后的loss值依然没有达到小数，则也可能是难于训练，也需要加入其他的技巧。或者模型搭建的有问题，需要慎重检查。 5. 建议使用网格搜索，从最重要的参数开始，搭建一个简单的模型，然后取合理的超参数，逐一进行。 6 .也可以在卷积层中加正则化，比如： C1 = Convolution2D(8 3, 3, border_mode='valid', init='he_uniform', activation='relu',W_regularizer=l2(regularizer_params)) 7.有看到在kaggle中使用集成cnn的，分类错误率确实有下降。 8 使用ReduceLROnPlateau 对学习率进行衰减，当下降很慢时，学习率自动调整，可以起到一部分作用，

我在模型中使用的是RMSprop ，RMSprop本身带有学习率的自动调整，但是，我加上ReduceLROnPlateau ，依然可以看到学习率变化很慢时，设置的这个ReduceLROnPlateau 有调整。 9 用数据增强的时候，也需要小心，图片调整的幅度等均会对模型的正确率有影响。 10，对3个颜色的图像转换为gray以后，分类准确率稳定在 0.5左右，几乎就是废掉了，说明图像的像素对于模型的影响巨大，后来了解到有“图像超分辨率重建Super-Resolution”其实是可以对图像做像素的分辨率更高。当然也是可以手工用PS进行插值等修图。查了下，像mnist这样的数据集都是经过处理后才放入模型中的，所以，不能完全指望着CNN卷积池化就把所有的问题都解决掉，尽管图像分类和识别正在像CNN转移。 keras遇到的坑（可能是水平的问题，总之有困惑）遇到的坑（可能是水平的问题，总之有困惑） (1) 多次运行会在上一次运行过的数据上起作用，比如， train_x , val_x , train_y, val_y = train_test_split(train_x, train_y, test_size=0.1, random_state=random_seed) 如果多次运行，则1000个数据，900个训练集的，下一次变成，900*0.9=810个数据，同时，还发现， train_y = to_categorical(label, num_classes =2)，这里也可能出现问题，比如，二分类，在第一次运行后是，2行第二次运行就变成4行 (2) 在做交叉验证时新版本epoch的写法是epochs= estimator = KerasClassifier(build_fn=baseline_model, epochs=20, batch_size=32, verbose=2) 如果用成下面老版本，则n_epoch无法读取，运行的时候，默认的是1所以我定义的 n_epoch=20是失效。 estimator = KerasClassifier(build_fn=baseline_model, n_epoch=20, batch_size=32, verbose=2) 补充知识：keras中中loss与与val_loss的关系的关系补充知识： loss是训练集的损失值，val_loss是测试集的损失值以下是以下是loss与与val_loss的变化反映出训练走向的规律总结：的变化反映出训练走向的规律总结： train loss 不断下降，test loss不断下降，说明网络仍在学习;（最好的） train loss 不断下降，test loss趋于不变，说明网络过拟合;（max pool或者正则化） train loss 趋于不变，test loss不断下降，说明数据集100%有问题;（检查dataset） train loss 趋于不变，test loss趋于不变，说明学习遇到瓶颈，需要减小学习率或批量数目;（减少学习率） train loss 不断上升，test loss不断上升，说明网络结构设计不当，训练超参数设置不当，数据集经过清洗等问题。（最不好的情况）以上这篇keras做CNN的训练误差loss的下降操作就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持我们。

分享到：

赞收藏

资料库

keras做CNN的训练误差loss的下降操作.pdf

相关推荐

开发技术

热门标签

最新资料