深度学习实现安全帽佩戴的检测

向AI转型的程序员都关注了这个号👇👇👇

机器学习AI算法工程公众号：datayx

01. 概述

对于图像识别，采用传统的算法（opencv的一些算法），判断形状、颜色等等，我们在实验室和办公场所做测试，效果还不错，和容易识别出来。一旦到了工业现场，图像完全不行，连人和车都识别不出来。在不同光线下不论采用什么颜色空间（RGB、HSV什么）都无法分离出合理的色彩，更不要提判断和检测了。有感于实际的现场环境，决定放弃传统的算法，拿起深度学习的工具，来搞定这个项目。

02. 数据准备

高大上的人工智能背后，一定是苦逼的数据准备，深度学习的模型，需要成千上万的训练和测试数据，这些数据的采集和整理，还有数据的清洗都是体力活啊。

当然，我还是没傻到一张张去拍照片。我通过现场的摄像头做了视频采集，然后拿到录像，做了一个代码从录像中找到人，再把人的上半部分处理一下，变成标准格式的图片。这样子，2-3天的录像就可以产生几十万张图片了，看来训练集的问题解决了。

采用SSD的算法（用于物体检测的深度学习主流算法之一）检测出图片中的人。

这样就可以建立自己的训练集：
train和test （带不带帽子的标注需要人工去做... 这个还是很苦逼）

03. 搭建模型

考虑到标准的图片只有128*128，特征不是很多，就动手搭建一个不算深的深度学习模型，采用卷积神经网络处理图形特征，搞过cnn的同学会觉得so easy。

这是个只有三层的卷积神经网络，我们就拿这个模型进行训练和学习吧。

04. 训练神经网络

深度学习的训练是极其需要强大的算力的，多亏我们的模型较小，另外我们还DIY了一台深度学习服务器，有了强大的GPU做运算。
经过了一晚上的训练，终于出了结果，数据上还不错，识别率竟然到了95%以上。

具体代码如下：

05. 结论

通过简单的cnn模型和一个小规模的数据集的训练，基本上达到了目标。
不过在实际测试用的识别率还是比较低，感觉还是无法直接用于生产环境。
没关系，下一步我们会采用成熟的模型vgg或resnet，在这个模型后端做修改，进行调优和训练，另外提高训练集的数量和进一步做数据清洗，已达到可以直接在生产环境上使用的目标。

原文地址 https://www.jianshu.com/p/2101f5e5e577

阿里云双11大促服务器ECS 数据库全场1折

活动地址