实现卷积神经网络
迁移学习
(1)下载神经网络开源的实现(代码和权重)
(2)训练集少的情况下,冻结层,保留一个层来训练,在此之上再训练softmax层,改变softmax层的预测
(3)训练集多的情况下,冻结前面较少的层,训练后面的层,构建自己的输出单元。
(4)利用大量数据,重新训练每一层,更新每层的权重。
———————————————————————————————————————
计算机视觉现状
深度学习已经成功地应用于计算机视觉,自然语言处理,语音识别,在线广告等
1.手工工程 2.标签数据
——————————————————————————————————————
目标检测-目标定位
1.训练集不仅包含神经网络需要预测的对象分类标签,还包含表示边界框(Bounding Box)的四个数字(边界框的中心点,框长和框宽)
Example:
1.pedestrian 2.car 3.motorcycle 4.background
Need to output:(Bx,By),Bh,Bw,class label(1-4)
窗口滑动目标检测
以某个步幅在图像中滑动窗口,遍历整张图片,判断目标是否在窗口中。每一个窗口利用卷积网络进行处理。计算成本较高,速度慢
通过卷积实现滑动窗口对象检测
输出精准的边界框——YOLO
主题思想:将图像进行网格划分,将检测对象的中点分配到其中点所在的格子,即使对象可以横跨多个格子,也只会被分配到其中的一个格子当中。
运行速度快,通过单次卷积处理图像。
交并比(loU)函数
计算两个边界框交集部分和并集部分之比。
一般约定,计算机视觉中,如果loU大于或等于0.5,说明检测正确。0.5阈值来判断预测的边界框是否正确。衡量定位精确度的一种方式。
非极大值抑制
清除重复的检测对象,对目标对象只检测一次。只输出检测概率最大的分类结果,利用概率最大的结果来抑制其他检测概率较小的检测结果。
1.设置某个阈值大小,当检测结果是目标物的概率小于该阈值时,则抑制输出;如果大于该阈值,则输出检测结果。
2.经过第一步筛选后,还存在与检测概率最大的输出边界框面积重合较高的边界框时,设置交并比的阈值大小,清除这些占比较高的边界框,只留下最终的输出结果。
来源:CSDN
作者:科研鬼才
链接:https://blog.csdn.net/weixin_42447868/article/details/103915176