Fast R-CNN
论文链接 Abstract 作者提出的模型叫做 Fast RCNN ,与RCNN相比,主要是在训练的速度和精度上做了提升。 1. Introduction 已经有结论证明,深度的卷积网络可以明显的提升图像分类和目标检测的效果。在目标检测中,主要优化以下两个问题: 需要处理大量的候选框 这些候选框仅仅提供了大致的位置,需要对每个候选框进行精确的调整。 在这篇文章中,作者把目标检测的过程流程化了,提出了一种 single-stage 的训练算法,这种算法把 分类 和 锚框定位 结合在一起了。 1.1 R-CNN and SPPnet RCNN的不足: Training is a multi-stage pipeline:训练步骤繁琐: 首先要使用log loss损失函数对ConvNet网络进行fine-tuning 未选择softmax而是使用SVM拟合ConvNet的特征 拟合bounding-box的位置 训练时花费大量的时间和空间。 For SVM and bounding-box regressor training, features are extracted from each object proposal in each image and written to disk. Object detection is slow. 因为它在执行ConvNet的过程中