文本分类竞赛调优分享
找规律
已知数字:2 4 8
请说出同样规律的三个数字
规律是?
目录
过拟合
欠拟合
数据的特点
预训练模型
过拟合
原因:
1.模型的参数太多,而训练样本又太少
2.训练集和测试集特征分布不一致
3.没有学到真正有代表性和区分度的特征
表现:
在训练数据上损失函数较小,预测准确率较高;但是在测试数据
上损失函数比较大,预测准确率较低
过拟合
解决办法:
1.正则化
2.dropout
3.模型集成(时间慢)
4.early stop
dropout
ResNet block
概念:
我们在前向传播的时
候,让某个神经元的
激活值以一定的概率p
停止工作,这样可以
使模型泛化性更强,
因为它不会太依赖某
些局部的特征。
Early Stop
设定验证集上多少轮
没有提高自动停止
目录
过拟合
欠拟合
数据的特点
预训练模型