一、1d/2d/3d卷积
- 卷积运算:卷积核在输入信号(图像)上滑动,相应位置上进行乘加
- 卷积核:又称为滤波器,过滤器,可认为是某种模式,某种特征。
卷积过程类似于用一个模板去图像上寻找与他相似的区域,与卷积核模式越相似,激活值越高,从而实现特征提取
AlexNet卷积核可视化,发现卷积核学习到的是边缘,条纹,色彩这一些细节模式
- 卷积维度:一般情况下,卷积核在几个维度上滑动,就是几维卷积
二、卷积-nn.Conv2d
- nn.Conv2d 功能:对多个二维信号进行二维卷积
- 主要参数:
- in_channels:输入通道数
- out_channels:输出通道数,等价于卷积核个数
- kernel_size:卷积核尺寸
- stride:步长
- padding:填充个数
- dilation:空调卷积大小
- groups:分组卷积设置
- bias:偏置
- 尺寸计算:
- 简化版:
- 完整版:
三、转置卷积-nn.ConvTranspose
转置卷积又称反卷积和部分跨越卷积,用于对图像进行上采样。
- 为什么成为转置卷积?
- 正常卷积:假设图像尺寸为4*4,卷积核为3*3,padding=0,stride=1
图像:I16*1,卷积核:K16*4,输出:O16*1 = K16*4 * I4*1
-
- 转置卷积:假设图像尺寸为2*2,卷积核为3*3,padding=0,stride=1
图像:I4*1 卷积核:K16*4 输出:O16*1 = K16*4 * I4*1