卷积神经网络

柔情痞子 提交于 2020-02-06 04:13:43

卷积神经网络能很好地适用于图像处理、语音识别等复杂感知任务。
卷积神经网络的强大之处在于它的多层网络结构能自动学习输入数据的深层特征,不同层次的网络可以学习到不同层次的特征。

浅层网络层感知区域较小,可以学习到输入数据的局部域特征(如图像的颜色、几何形状等);深层网络层具有较大的感知域,能够学到输入数据中更加抽象的一些特征(如图像物体的属性、轮廓特点、位置信息等高维性质)。深层次的抽象特征对图像中物体的大小、位置和方向等敏感度较低,从而大大提高了物体的识别率,因此卷积神经网络常用于图像处理领域。

卷积神经网络可以用来识别位移、缩放及物体形态扭曲的二维图形。由于网络模型中的特征是通过训练数据集进行图像特征学习,从而避免了显示地特征抽取。由于图像上同一特征映射面上的神经元权值相同,所以卷积神经网络模型可以并行训练,极大地提高神经网络的训练时长。
传统的图像检测方法:边缘检测、轮廓检测、局部二值检测、方向梯度直方图、Haar特征检测。

卷积神经网络的结构:

卷积神经网络主要由卷积层、下采样层、全连接层3中网络层构成(这里没有包括输入层和输出层)

卷积神经网络参数设计规律

1.输入层矩阵的大小应该可以被2整除多次
2.卷积层尽量使用小尺寸卷积核
3.卷积步长尽量不要过大(如设置步长为1可以让空间维度的下采样操作由Pooling层负责,卷积层只负责对输入数据进行特征提取)
4.卷积层中应使用Same Padding零填充矩阵边界
5.Padding的设置与卷积核大小有关:当卷积核大小K=3(即卷积矩阵大小为33),则设置padding=1来保持卷积操作中的输出尺寸不变性;当K=5,设置Padding=2.对于任意卷积核大小K,padding=(K-1)/2能保持尺寸不变性。
6.Pooling层一般使用2
2窗口,步长为2的Max Pooling操作。
7.全连接层不宜超过3层(FC<=3)

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!