Deeplab
Deeplab系列是谷歌团队的分割网络. DeepLab V1 CNN处理图像分割的两个问题 下采样导致信息丢失 maxpool造成feature map尺寸减小,细节信息丢失. 空间不变性 所谓空间不变性,就是说比如一张狗的图,狗位于图片正中还是某一个角,都不影响模型识别出这是一个狗. 即模型对于输入图像的空间位置不敏感,不管这个图片旋转,平移等,都能够识别. 对分类来说,这是ok的.但是对于分割来说,这就不OK了,图片旋转以后,每一个像素所属的分类当然就改变了. 究其原因,分类处理的是更"高级"的特征,而分割是对每一个像素做分类,需要更多的细节. deeplab v1采用2个方法解决这两个问题 空洞卷积 条件随机场CRF 空洞卷积 为什么要有maxpool? 一方面是为了减小feature map尺寸.一方面也是为了增大feature map中的每一个元素的感受野. FCN是怎么做的? 得到特征图后,用deconv的方式上采样将feature map恢复到原始图像尺寸.但是这种 先max pool下采样再deconv上采样的过程势必会损失掉一部分信息. deeplab如何解决这个问题? deeplab提出了一种dilated conv(空洞卷积)的卷积方式,去替代max pool,但同时感受野不丢失. dilated的好处是不做pooling损失信息的情况下,加大了感受野