[转载]dilated conv带孔卷积、pooling层提高感受野 反卷积 的理解
首先放链接:https://www.zhihu.com/question/54149221 首先,初次接触dilated conv带孔卷积是在deeplab网络结构里,做图像分割。 本科毕设首次接触图像分割,当时用的是caffe框架,fcn-8s实现。但是,它会把图像pooling5次,最终的特征图尺寸缩小了32倍,然后结合倒数后两层的信息(相当于尺寸扩大4倍了),然后再反卷积一下子扩大8倍至原始尺寸,这会导致信息损失的。。。(还有的是,防止缩小32倍后的特征图太小,会首先对输入图像padding很多0,扩大尺寸。这显然加进去了很多噪声啊。。。)所以为了避免以上损失,deeplab的结构是:pooling3次而已,尺寸缩小了8倍。但是接着问题又来了,pooling少了,感受野变小了(这个下面就有解释说啦~),所以,deeplab通过使用带孔卷积来保证感受野。具体原理,往下看: pooling为什么可以提高感受野? 得这样理解:首先它第一个作用是降低feature map的尺寸,减少需要训练的参数;其次,因为有缩小的作用,所以之前的4个像素点,现在压缩成1个。那么,相当于我透过这1个点,就可以看到前面的4个点,这不就是把当前map的感受野一下子放大了嘛(我是这样理解的a。。。)。 所以就有以下结论:pooling降维减少参数量,并且增大感受野。 但是,在图像分割问题中,如fcn8s