2012到2020主要的CNN架构总结
来源:DeepHub IMBA 本文约1600字,建议阅读5分钟本文与你讨论每个机器学习工程师都应该知道的十大CNN架构。 卷积神经网络(CNN或ConvNet)是理解图像内容的最佳学习算法之一,并且在图像分割,分类,检测和检索相关任务中表现出出色。有许多公司,例如Google,Microsoft,AT&T,NEC和Facebook,已经建立了活跃的研究小组来探索CNN的新架构。 什么是CNN? CNN被设计用于图像识别任务,最初是用于手写数字识别的挑战(Fukushima 1980,LeCun 1989)。CNN的基本设计目标是创建一个网络,其中网络早期层的神经元将提取局部视觉特征,而后期层的神经元将这些特征组合起来以形成高阶特征。 在几乎每个CNN中,您都会看到三种主要的图层类型。 卷积层 卷积层由一组过滤器(也称为内核)组成,这些过滤器在输入数据上滑动。每个内核都有一个宽度,一个高度和一个宽度×高度权重,用于从输入数据中提取特征。在训练时,内核中的权重使用随机值进行初始化,并将根据训练集进行学习。 池化层 池化层(或下采样层)用于减少特征图的维数,从而从特征图中保存最相关的信息。在池化层中,过滤器会在输入数据上滑动并应用池化操作(最大,最小,平均)。最大池是文献中使用最多的。 全连接层 是由三种类型的层组成的多层感知器:输入层,隐藏层和输出层。输入层接收CNN生成的要素