PyramidBox
https://github.com/aspxcor/Pyramidbox-Based-Head-Recognition/tree/master/PyramidBox-master
首先简单介绍了人脸检测的发展,SSH、S3FD通过设计具有尺度不变性的网络结构,在单个网络的各个特征金字塔上检测不同尺度的人脸。如何通过人脸的上下文信息(contextual information)来辅助人脸检测,一直是被忽略的方向,因为人脸一般都不会单独的存在与图像中,一般都会包含头、肩、身体等部位,当人脸由于遮挡、低分辨率、模糊等情形不容易被检测时,这些上下文的信息其实是可以辅助人脸检测的。本文的PyramidBox通过结合上下文信息,以辅助人脸检测。
1,提出PyramidAnchors,设计 contextual anchor 通过半监督的方法,来说学习高层特征的上下文信息,具体的,结合了人头,身体等信息,以检测出小尺度,模糊,遮挡的人脸。
2,设计了Low-Level Feature Pyramid Network(LFPN),联合合适的高层语义信息(不使用高层,而是中间feature map层)+低层feature map 特征。以检测所有尺度的人脸。这么做的出发点是作者认为大小尺度人脸所包含的信息量是不一样的,并非所有高层feature map上的信息对小尺度检测都有帮助。
3,提出了Context-sensitive prediction module(CPM),借鉴了SSH,使用wider + deeper的网络结构,融合人脸附近的contextual information,并提出max-in-out提升分支中人脸检测和分类的准确率。
最后,文章还提出了全新的训练策略Data-anchor-sampling(DAS)来调整数据分布,通过数据增强的方式提升小尺度人脸的多样性。
来源:oschina
链接:https://my.oschina.net/u/4381796/blog/3300364