基于深度学习的人脸身份保持

时间:2022-10-28 09:11:33

基于深度学习的人脸身份保持

摘要:人脸识别的应用范围越来越广,而在实际生活中采集到的人脸往往具有多种姿态变化,不同姿态下的人脸识别在计算机领域是一个富有挑战的问题。人脸识别的主要研究方向在于对人脸特征的选取,其好坏直接影响到实际应用。文章将介绍基于深度学习的FIP特征学习方法,用于实现正脸重构进而解决人脸姿态出现巨大变化时的识别问题,并基于MULTIPIE人脸数据库进行一系列实,验证正脸重构的可靠性。

关键词:深度学习;人脸识别;深度信念网络

中图分类号:TP391.41 文献标识码:A 文章编号:1009-3044(2016)35-0184-03

在实际应用中,采集到的人脸图像往往是具有多种姿态变化的,受姿态变化影响,人脸图像识别性能迅速下降,这是人脸识别中一个最为突出的难题。姿态变化将非线性因素引入了人脸识别,而现有的一些机器学习方法大多使用浅层结构,难以有效表示复杂函数。而深度学习可通过一种深层非线性网络结构实现复杂函数逼近,表征输入数据分布式表示,体现出它对于输入样本数据的强大的本质特征的抽取能力。因此本文将运用深度神经网络的方法克服姿态变量的影响,并在实验数据集上进行一系列验证试验从而得出结论。

1 简介

在实际应用中,姿态变化成为人脸识别的瓶颈问题。跨姿态人脸识别方法通常分为三类:通用型算法,二维算法和三维算法,在此仅介绍通用型算法。通用型算法是为解决一般的人脸识别而设计的,本身即包括处理图像中姿态变化等因素。通用型算法主要有以主成分分析(Prinxipal Componet Analysis,PCA,也称为特征脸)[[1]],Fisher判别分析(Fisher Discriminant Analysis,FDA,也称为线性判别分析,简称LDA)[2],局部二值模式(LBP)[3],自组织映射和卷积网络,模板匹配,模块化PCA等,这些方法都基于二维面部图像中提取的分类模式,从现有库已知的图像中识别输入的人脸图像。我们选取LDA方法作为研究基础,同时引入深度学习,通过构建具有多层隐层的机器学习模型和海量训练数据,来学习更有用的特征。

3.2 参数更新

采用自顶向下的监督学习,通过最小化的损失函数重建误差。基于第一步得到的各层参数进一步调节整个多层模型的参数,利用梯度下降法微调整个网络参数,对DBN进行优化。这一步是一个有监督训练过程。由于深度学习的第一步不是随机初始化,而是通过学习输入数据的结构得到的,因而这个初值更接近全局最优,从而能够取得更好的效果。

4 实验

4.1 实验数据

为了能够在较大范围不同姿态下评估该方法,我们选择了MultiPIE人脸数据库。它是由CMU采集的一组包含用姿态、光照和表情三个因素变化构成的人脸库。库中包含68个人,每个人有13种不同的姿态,3-4种不同的表情和多组不同光照。相较于其他数据库,MultiPIE人脸库包含因素最为丰富,采集条件最为真实,且包含较大的姿态变化和垂直深度上的旋转,便于我们对该方法进行充分评估。

4.2 实验结果

我们采用MATLAB2012B编写重构Demo,由此获得了重构后的人脸图像,图3截取了一部分实验结果。由此可以清晰看到,我们重构人脸的方法可以去除不同姿态的影响,并且保持了人脸轮廓和结构。

基于LDA算法,我们计算出了人脸重构前后的识别率,如表格1所示。显然,重构后人脸的识别率远高于重构前。经统计,旋转角度为+15°和-15°的人脸图像识别率平均上升7.75%,+30°和-30°的人脸图像识别率平均上升8.67%,而+45°和-45°的人脸图像识别率平均上升了13%,由此可见,我们的算法对于旋转角度大的姿态优势更加明显。

另外,我们将试验结果与其他关于姿态变化的研究结果进行了比较。如表格2所示,LGBP[11]属于二维方法,而VAAM,FA-EGFC[12]和SA-EGFC均为三维方法,且除FA-EGFC外,其他方法都需要知道探测器的角度。结果显示,我们所用的方法识别率在各个角度均为最高,且忽略角度的影响。显然,相较于这几种方法,我们的方法更具有优越性和稳定性。

5 结语

从结果分析中可以看出经过深度学习网络转换后的人脸识别率明显高于未经过转换的,且部分识别率达到了100%,显然本文的方法在姿态因素问题的处理上表现出明显的优势,尤其在旋转角度较大的情况下有较大提升。实验说明FIP特征不仅仅对姿态变化具有健壮性,而且可以用来重建人脸图像。

在未来的工作中,我们将扩展框架以便于在其他困难条件下进行人脸识别,同时会将FIP方法进行进一步的提高。

参考文献:

[1] TURK M A,PENTLAND A P. Face recognition using eigenfaces [C]. Computer Vision and Pattern Recognition,San Diego,1991:22-28.

[2] ZHAO W,KRISHNASWAMY A,CHELLAPPA R,et al. Discriminant analysis of principal components for face recognition [M]. Face Recognition. Berlin Heidelberg :Springer.1998

[3] S. Li, X. Liu, X. Chai, H. Zhang, S. Lao, and S. Shan. Morphable displacement field based image matching for face recognition across pose. In ECCV. 2012.

[4] C. D. Castillo and D. W. Jacobs. Wide-baseline stereo for face recognition with large pose variation. In CVPR, 2011.

[5] A. Asthana, T. K. Marks, M. J. Jones, K. H. Tieu, and M. Rohith. Fully automatic pose-invariant face recognition via 3d pose normalization. In ICCV, 2011.

[6] Zhenyao Zhu1,? Ping Luo1,3,? Xiaogang Wang2 Xiaoou Tang1,3,Department of Information Engineering, The Chinese University of Hong Kong,Department of Electronic Engineering, The Chinese University of Hong Kong,Shenzhen Institutes of Advanced Technology, Chinese Academy of Sciences

[7] Q. V. Le, J. Ngiam, Z. Chen, D. Chia, P. W. Koh, and A. Y. Ng. Tiled convolutional neural networks. In NIPS, 2010.

[8] G. E. Hinton, S. Osindero, and Y.-W. Teh. A fast learning algorithm for deep belief nets. Neural Computation, 18(7):1527C1554, 2006.

[9] N. Qian. On the momentum term in gradient descent learning algorithms. Neural Networks, 1999

[10] V. Nair and G. E. Hinton. Rectified linear units improve restricted Boltzmann machines. In Proc. 27th International Conference on Machine Learning, 2010.

[11] W. Zhang, S. Shan, W. Gao, X. Chen, and H. Zhang. Local gabor binary pattern histogram sequence (lgbphs): A novel non-statistical model for face representation and recognition. In ICCV, 2005.

[12] S. Li, X. Liu, X. Chai, H. Zhang, S. Lao, and S. Shan. Morphable displacement field based image matching for face recognition across pose. In ECCV. 2012.

上一篇:你在哪儿,家就在哪儿 下一篇:甘泉后学洪垣儒学思想探析