卷积神经网络提高准确率（shuffle,优化器，batchsize,权重初始化）通过某次实际CNN调参过程

您所在的位置：网站首页 › 卷积核初始化 › 卷积神经网络提高准确率（shuffle,优化器，batchsize,权重初始化）通过某次实际CNN调参过程

卷积神经网络提高准确率（shuffle,优化器，batchsize,权重初始化）通过某次实际CNN调参过程

2024-05-29 16:14| 来源: 网络整理| 查看: 265

最近做一个CNN，从0开始调节，终于让准确率提高到了95%。

网络结构为，两层卷积，池化，两层卷积，池化，两层全连接：

打乱

优化器

BATCHSIZE（重要！)

权重初始化

其他方法

打乱

1.千万要对数据进行shuffle，不然准确率低的令人发指。发现某一类别正确率极高，但是数据是平均分布的，怀疑shuffle出错，但是没有。。。

优化器

2.由于准确率一直很低，怀疑陷入局部最优，也可能是鞍点，所以采用各种优化器尝试了下，

adam结果:

理解：adam采用自适应优化，所以它的优势是训练快，但是问题在于更容易陷入局部最优、鞍点等！虽然SDG慢了点，但是真好用（所以那么多研究中都采用SDG）

SDG对应tensorflow:tf.train.GradientDescentOptimizer

ADAM对应tensorflow:tf.train.AdamOptimizer

采用SDG方法损失函数突破1.5，（ADAM为1.9）

BATCHSIZE（重要！)

（我这个网络的问题主要与batchsize有关，由于此参数的不合适，学习到内容过于偏离预期！）

3.batchsize，主要三个作用：

内存利用率（只要能跑就行）跑完一次 epoch（全数据集）所需的迭代次数减少，对于相同数据量的处理速度进一步加快。但是盲目加大导致达到相同的精度，其所花费的时间大大增加了，从而对参数的修正也就显得更加缓慢。一般来说 Batch_Size 越大，其确定的下降方向越准，引起训练震荡越小。但是Batch_Size 增大到一定程度，其确定的下降方向已经基本不再变化。也就说容易陷入局部最优（也可以理解为如果batch_size很大会导致学习到的特征偏向于整体特征，学习到的内容不够）

忽略异常的波动：发现合理减少batch-size后准确率提升了，损失函数值下降到新高度（batch-size=700时准确率不足40%，损失最低达到1.5）

橙色为训练集，蓝色为验证集

batch-size=128batch-size=32batch-size=8