1.ROI Pooling
https://blog.csdn.net/auto1993/article/details/78514071
1⃣️ROI:
regions of interest
2⃣️目标检测的典型框架结构:
region proposal+classifition+regression
缺点:proposal阶段计算量大,速度慢;不是end-to-end training
3⃣️使用ROI Pooling的好处
加速training和testing过程;提高accuracy
4⃣️ROI Pooling 操作
输入:卷积层输出的feature maps +
region proposal方法(如RPN)提出的候选框(或者说ROI)(每个用5个值表示,index,坐标,长宽?)
(1)根据输入image,将ROI映射到feature map对应位置;
(2)将映射后的区域划分为相同大小(细节问题:无法恰好分好,舍弃还是重叠?)的sections(sections数量与输出的维度相同);怎么划分取决于输出维度
(3)对每个sections进行max pooling操作;
ROI pooling总结:
(1)用于目标检测任务;(2)允许我们对CNN中的feature map进行reuse;(3)可以显著加速training和testing速度;(4)允许end-to-end的形式训练目标检测系统。
在pytorch中的使用:
- torch.nn.functional.adaptive_max_pool2d(input, output_size, return_indices=False)
- torch.nn.AdaptiveMaxPool2d(output_size, return_indices=False)
torchvision.ops.
roi_pool
(input, boxes, output_size, spatial_scale=1.0) Performs Region of Interest (RoI) Pool operator described in Fast R-CNN
2.ROI Pooling的反向传播https://zhuanlan.zhihu.com/p/59692298
两次量化过程:
-
(1)、在原图上生成的region proposal 映射到feature map需要除以16或者32的时候,边界出现小数,这是第一次量化。
(2)、在每个roi里划分成k×k(7×7)的bins,对每个bin中均匀选取多少个采样点,然后进行max pooling,也会出现小数,这是第二次量化。
来源:CSDN
作者:Goldfish~
链接:https://blog.csdn.net/meizhuxun7340/article/details/103581881