Daily 学习笔记(三)

流过昼夜 提交于 2019-12-24 09:17:18

1.ROI Pooling

https://blog.csdn.net/auto1993/article/details/78514071

1⃣️ROI:

          regions of interest

2⃣️目标检测的典型框架结构:

          region proposal+classifition+regression

         缺点:proposal阶段计算量大,速度慢;不是end-to-end training

3⃣️使用ROI Pooling的好处

          加速training和testing过程;提高accuracy

4⃣️ROI Pooling 操作

        输入:卷积层输出的feature maps   +

                   region proposal方法(如RPN)提出的候选框(或者说ROI)(每个用5个值表示,index,坐标,长宽?

(1)根据输入image,将ROI映射到feature map对应位置;

(2)将映射后的区域划分为相同大小(细节问题:无法恰好分好,舍弃还是重叠?)的sections(sections数量与输出的维度相同);怎么划分取决于输出维度

(3)对每个sections进行max pooling操作;

ROI pooling总结:

(1)用于目标检测任务;(2)允许我们对CNN中的feature map进行reuse;(3)可以显著加速training和testing速度;(4)允许end-to-end的形式训练目标检测系统。

在pytorch中的使用:

  1. torch.nn.functional.adaptive_max_pool2d(input, output_size, return_indices=False)
  2. torch.nn.AdaptiveMaxPool2d(output_size, return_indices=False)
  3. torchvision.ops.roi_pool(inputboxesoutput_sizespatial_scale=1.0)                                                                  Performs Region of Interest (RoI) Pool operator described in Fast R-CNN

2.ROI Pooling的反向传播https://zhuanlan.zhihu.com/p/59692298

preview

两次量化过程:

  1. (1)、在原图上生成的region proposal 映射到feature map需要除以16或者32的时候,边界出现小数,这是第一次量化。

    (2)、在每个roi里划分成k×k(7×7)的bins,对每个bin中均匀选取多少个采样点,然后进行max pooling,也会出现小数,这是第二次量化。

 

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!