目标检测
rcnn:根据颜色等特征,将图像分为许多小区域(一般情况下颜色相同的都是一类物体)
合并区域,然后进行区域内的物体检测 即到卷积中进行预测(每个框一个卷积网络)
缺点:找到的框太多
fast-rcnn:整张图片卷积得到特征图
图片映射到特征图,
faster-rcnn:RPN 层,根据标注中框的位置,让卷积网络自己学习框应该在哪 (在特征图上提取框)
怎么学习?
有基数128,256,512,3种方式
对于一个像素点生成9个框,以他为中心
128256,256128,128128
256512,512256,256256
512512,5121024,1024*512
来源:https://www.cnblogs.com/Dean0731/p/11961902.html