深度学习之⽹络中的⽹络(NIN)
LeNet、AlexNet和VGG在设计上的共同之处是:先以由卷积层构成的模块充分抽取空间特征,再以由全连接层构成的模块来输出分类结果。 其中,AlexNet和VGG对LeNet的改进主要在于如何对这两个模块加宽(增加通道数)和加深。本节我们介绍⽹络中的⽹络(NiN)—— 它提出了另外⼀个思路,即串联多个由卷积层和“全连接”层构成的⼩⽹络来构建⼀个深层⽹络。 一、NIN 块 卷积层的输⼊和输出通常是四维数组(样本,通道,⾼,宽),⽽全连接层的输⼊和输出则通常是⼆维数组(样本,特征)。如果想在全连接层后再接上卷积层,则需要将全连接层的输出变换为四维。 左图是AlexNet和VGG的⽹络结构局部,右图是NiN的⽹络结构局部 二、NIN模型 NiN是在AlexNet问世不久后提出的。它们的卷积层设定有类似之处。NiN使⽤卷积窗⼝形状分别为 \(11 \times 11\) 、 \(5 \times 5\) 和 \(3 \times 3\) 的卷积层,相应的输出通道数也与AlexNet中的⼀致。每个NiN块后接⼀个步幅为2、窗⼝形状为 \(3 \times 3\) 的最⼤池化层。 NIN 与 ALexNet 区别: NiN去掉了AlexNet最后的3个全连接层,取⽽代之地,NiN使⽤了输出通道数等于标签类别数的NiN块,然后使⽤全局平均池化层对每个通道中所有元素求平均并直接⽤于分类。 来源