图片中可能含有多个物体需要分类和定位,数量不确定
方案一 sliding windows
计算量太大,不被使用
方案二 region proposals
regions是固定算法选择的,不经过学习。而且计算量还是大
fast R-CNN
选取region之后再投影到卷积层
fast R-CNN已经很快了,但是,对于test time,region proposals的时间限制了模型速度。
faster R-CNN
自己用网络去选取region(在卷积后的层上)
----------------------------------------------------------------------------------------------------------------------------------
YOLO/SSD(single shot detection)
##下图的对比已经不再绝对,YOLO已经很准确了##
Dense Captioning 对每个bounding box进行image captioning
---------------------------------------------------------------------------------------------------------------------------------
Instance segmentation(semantic segmentation 和object detection的混合)
Mask R-CNN
两个分支,一个做object detection,一个做semantic segmentation
来源:CSDN
作者:i_chase
链接:https://blog.csdn.net/qq_39638957/article/details/80298233