Deep face recognition using imperfect facial data

假装没事ソ 提交于 2019-12-13 09:27:55

https://www.sciencedirect.com/science/article/pii/S0167739X18331133#b42

1.Abstract

该论文主要研究人脸各个部分对于人脸识别的影响力,以及对人脸图案进行旋转、缩放等操作后人脸识别性能的大小。

2. Related work

在我们的实验中,我们使用一个基于CNN的架构和预先训练好的VGG-Face模型来提取特征。然后我们使用余弦相似度和线性支持向量机两个分类器来测试识别率。
在第3节中,我们解释了我们使用的CNN架构,并简要描述了VGG-Face模型和CS以及基于SVM的分类。
在第4节中,我们讨论了利用部分人脸数据进行的人脸识别实验,并报告了一些有趣的实验结果。
第五部分是对研究结果的反思,
第六部分是对本文的总结。

3. Proposed methodology

对于人脸感知工作,使用CNN,有几个预先训练好的模型可以很容易地用于特征提取,例如VGGF, VGG16, VGG19, OverFeat[23]。在我们的例子中,为了提取特征,我们使用了VGGF的预训练模型,我们将在下面进行讨论。因此,我们采用的方法是使用预先训练好的VGGF模型进行特征提取,然后使用CS[41]或线性SVM进行分类。图5展示了我们的特征提取步骤的概述。

了确定VGGF模型中用于面部特征提取的最佳层,通常必须进行大量的试错实验。在这个特殊的例子中,我们测试了34到37层。在我们的实验中,我们尝试了其他层,但最好的结果来自第34层。值得注意的是,该层是全连通层,位于神经网络的末端,即提取的特征代表整个人脸。第34层的特征是应用了ReLU6后的全连接层FC7的结果,它给出了4096维的向量。第34层是最佳的建议是通过进行一系列的人脸识别测试来推断的,我们使用整个正面的人脸进行训练和测试,从而获得了100%的识别率。算法1进一步描述了通过特征提取进行训练和测试的整个过程。

我们发现,一般情况下,线性支持向量机工作得很好,当小部分的脸作为探针。
例如,在一项涉及60名受试者的面孔的实验中,我们发现对于右脸颊,线性支持向量机的识别率为24.44%,而径向基函数的核支持向量机的识别率仅为2.77%。此外,一般而言,线性支持向量机在我们所进行的所有实验中,在计算上更有效率。因此,我们的结论是,核支持向量机的边际收益(仅在较大的部分,如半面或3/4面)不提供全面的额外优势。

4. Experiments and results

1.遮挡

从图中可以看出,使用两种分类器,全人脸的识别率最高,四分之三的人脸识别率为100%。然而,在SVM-Wo模式下,人脸的右半部分和上半部分的识别率分别开始略有下降,但在CS-Wo模式下,识别率仍然保持在100%。当我们接近下半部时,SVM-Wo的发生率进一步下降到50%左右,CS-Wo下降到60%左右。这种下降一直持续到右脸颊近0.5%。

2.旋转
在大多数测试中,CS-W的识别率最高。随着旋转程度的增加,SVM-W和CS-W的识别率变得非常低,而SVM-W的识别率从0%左右急剧上升到82% ~ 84%,CS-W的识别率从近0%上升到92%左右,再次说明了CS-W优于SVM-W。

3.缩放

当我们将缩小后的图像添加到训练集时,我们发现在40%和50%的缩放水平下,使用SVM-W的识别率略有提高,而70%、80%和90%仍然保持稳定,如图15所示。在10%到60%的范围内,CS-W达到了较高的识别率,识别率达到了100%。此外,通过缩小70%和80%的水平,我们可以注意到识别率的逐渐增加,例如,从大约45%到大约52%。然而,当缩小到90%时,识别率下降

5. Discussions

此外,根据面部比例较小的结果,观察到的最差情况是脸颊、嘴、前额和鼻子,但就识别而言,眼睛似乎包含更多的信息。
而在受控的FEI数据集中,眼睛和鼻子的结合记录了大约90%的识别率,而在非受控的LFW数据集中,这一比例略有下降。此外,我们注意到使用CS测量可以获得更好的整体识别结果。
此外,对于没有眼睛和鼻子的部分,所有分类器的识别率几乎下降了一半,在这种情况下,k-SVM表现最差。就识别而言,在本实验中,对于其他部分,总体而言,SVM的识别率略有下降,而CS似乎保持了识别率。

6 。结论

在本文中,我们讨论了一套使用不完善的面部数据进行面部识别的相当全面的实验。我们的结果表明,随着脸部比例的减小,无论脸部特征(如眼睛,鼻子或嘴巴)的突出性质如何,识别率似乎都表现不佳。但是,我们注意到,即使在基于机器的面部识别的情况下,与其他单个面部特征相比,眼睛似乎也具有更多的识别线索。此外,对于旋转的脸部,我们注意到最好避免高度旋转的脸部,例如在110° 和 120°,因为它们似乎在识别任务中的执行情况非常差,而与将旋转的面部作为训练数据的一部分无关。同样,对于缩小的脸部,建议不要使用高度缩小的脸部,例如,将脸部缩小为70% 至 90%作为探针。最后,我们注意到与线性和内核SVM相比,CS度量极大地提高了分类的性能。

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!