R-CNN , Fast R-CNN , Faster R-CNN原理及区别
github博客传送门 csdn博客传送门 ==RCNN== 1、生成候选区域 使用Selective Search(选择性搜索)方法对一张图像生成约2000-3000个候选区域,基本思路如下: (1)使用一种过分割手段,将图像分割成小区域 (2)查看现有小区域,合并可能性最高的两个区域,重复直到整张图像合并成一个区域位置。优先合并以下区域: 颜色(颜色直方图)相近的 纹理(梯度直方图)相近的 合并后总面积小的 合并后,总面积在其BBOX中所占比例大的 在合并时须保证合并操作的尺度较为均匀,避免一个大区域陆续“吃掉”其它小区域,保证合并后形状规则。 (3)输出所有曾经存在过的区域,即所谓候选区域 2、特征提取 使用深度网络提取特征之前,首先把候选区域归一化成同一尺寸227×227。 使用CNN模型进行训练,例如AlexNet,一般会略作简化。 3、类别判断 对每一类目标,使用一个线性SVM二类分类器进行判别。 输入为深度网络(如上图的AlexNet)输出的4096维特征,输出是否属于此类。 4、位置精修 目标检测的衡量标准是重叠面积:许多看似准确的检测结果,往往因为候选框不够准确, 重叠面积很小,故需要一个位置精修步骤,对于每一个类,训练一个线性回归模型去判定这个框是否框得完美。 ==Fast R-CNN== Fast R-CNN主要解决R-CNN的以下问题: 1、训练