欢迎访问我的个人主页 刚接触物体检测领域,学习了Faster RCNN的论文及Tensorflow版本的源码,不得不说,读源码真的过瘾…不过确实能够帮助理解框架,下面按照Faster RCNN的预测过程介绍其整体流程 整体框架 转载:https://blog.csdn.net/littlehaes/article/details/83344007 Faster RCNN整体框架包括4部分: 一. 使用VGG16或者其他成熟的图片分类模型提取 图片特征(feature map) 二. 将 图片特征 喂入RPN(Region Proposal Network)网络得到 proposals (包含第一次回归) 三. 将上两步的结果: 图片特征 和 proposals 喂入RoI Pooling层得到综合的 proposals特征 四. 根据 poposals特征 预测 物体的bounding box 和 物体的类别 (包含第二次回归) 对应下图: 图中conv(3,3,512,1,1)对应conv(filter_height,filter_width,output_channels,stride_height,stride_width) 接下来分别介绍这四部分对应的网络结构,以预测过程为例(训练过程涉及ground truth的构建,会在之后的博客中具体介绍) 一.获取图片特征