扩张卷积（dilated convolution）

最早出现在DeeplLab系列中，作用：可以在不改变特征图尺寸的同时增大感受野，摈弃了pool的做法（丢失信息）；

我们设: kernel size = k, dilation rate = d, input size = W1, output size = W2, stride=s, padding=p;

Dilation convolution(扩张卷积)的原理其实也比较简单，就是在kernel各个像素点之间加入0值像素点，变向的增大核的尺寸从而增大感受野。

结构如下：

如上图所示，(a)是我们常见的卷积核，可以看成d=1的扩张卷积，核的尺寸为3，感受野为3；(b)是d=2的扩张卷积，核的尺寸上升为5=2*(3-1)+1，如果与（a）叠加使用的话感受野则为7；（c）是d=4的扩张卷积，核的尺寸上升为9=4*(k-1)+1，若与（a）(b)叠加则感受野区域为15；

（1）经过dilation rate放大后，fliter大小上升为：k*(d-1)+1；

（2）扩张卷积的输入和输出特征图的尺寸关系如下：

${\color{Purple}W_{2} = \frac{ W_{1} + 2p -d(k-1)-1}{s} + 1 }$

ps：在s=1,k=3时，令d = p，则输出特征图尺寸不变；

扩张卷积可用于图像分割、文本分析、语音识别等领域；

存在的问题：棋盘效应（特征图不是处处可导！）

解决方法：使用锯齿状的卷积核

来源：oschina

链接：https://my.oschina.net/u/4410077/blog/3323327

标签

易学教程内所有资源均来自网络或用户发布的内容，如有违反法律规定的内容欢迎反馈！
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!