深度学习调参技巧
1. 前言 我们在学习人工智能的时候,不管是机器学习还是深度学习都需要经历一个调参的过程,参数的好坏直接影响这模型效果的好坏。今天我们介绍下在深度学习中,调参的技巧主要分为哪些。 2. 深度学习中的主要参数 学习率(learning rate):学习率的取值一般是1、0.1、0.01、0.001等,我的建议是学习率从大到小,因为大的学习率运算的快,验证错误的速度快。并且我们的学习的过程一般通过Adam进行动态调整,基本问题不大。 网络层数:先从1层开始。 每层结点数:16,32,128,超过1000的情况比较少见。 batch size: 128左右开始 。batch取太大会陷入局部最小值,batch取太小会抖动厉害,因此要选择一个合适的batch size。 梯度裁剪: 限制最大梯度,如果梯度超过了阈值就进行截断。 dropout:在训练的时候可以设置一定的dropout,提升网络的健壮性,也能提升网络的计算速度。 词向量embedding大小:embedding的大小一般是128和256。 正负样本比例: 这个是非常忽视,但是在很多分类问题上,又非常重要的参数。很多人往往习惯使用训练数据中默认的正负类别比例,当训练数据非常不平衡的时候,模型很有可能会偏向数目较大的类别,从而影响最终训练结果。除了尝试训练数据默认的正负类别比例之外,建议对数目较小的样本做过采样,例如进行复制