基于隐马尔可夫模型的人脸识别研究与实现

时间:2022-07-19 01:42:04

基于隐马尔可夫模型的人脸识别研究与实现

摘要:人脸识别是图像识别中受人关注较多的领域之一,人们希望计算机能有像人类一样有强大的视觉能力。人脸识别属于生物特征是识别一种,虽然准确性不如虹膜、指纹的识别,但由于它的简单、直观、易于采集特征且对用户无害,使它成为容易被用户接受的一种生物特征识别。该文介绍了基于隐马尔科夫模型进行人脸识别的算法和具体系统的实现。首先介绍识别所需的图像特征提取算法“二维离散余弦变换”和匹配算法“高斯混合模型和隐马尔可夫模型”,其次介绍依据算法实现系统的过程。

关键词:人脸识别;隐马尔可夫模型

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2014)08-1781-02

The Research and Implement of Face Recognition Base on the Hidden Markov Model

FEI Xun, ZHUANG Ji-jun, CHEN Wei,CHU Zheng-yang

(Department of Computer Science and Technology, Hefei University, Hefei 230601,China)

Abstract: Face recognition is one of the image areas of concern more people want to have a computer as powerful as the human visual capabilities. Biometric face recognition is to identify a part, though not as good as the accuracy of iris, fingerprint recognition, but because it is simple, intuitive, easy-to-capture features and user-friendly, making it easy to accept a biometric user identified. This thesis focus on the way base on Hidden Markov Model. At first Thesis introduces the core algorithms required for recognition, including image feature extraction algorithm "Two-dimensional discrete cosine transform"; matching algorithm "Gaussian mixture model and Hidden Markov models". Then the tell the how to use the algorithm develop a face recognition system.

Key words: face recognition; hidden markov model

计算机图像处理在现代的计算机图形学中仍然是一个富有挑战的研究方向,一个图像中所能传达的信息,往往是无法用文字表达的。人的眼睛表现出的图像识别能力是令人震惊的。如果能让计算机像人的眼睛[1]一样能识别出不同的人物和物体,这将会带来很多的快捷,而且让计算机能够更智能的工作。

人脸是人体的一项重要生物特征,对人脸识别属于图像处理领域的一种,在很多行业都有应用的价值。人脸识别如果有很好的鲁棒性[2],达到很好的识别效果,相当于给机器装上了眼睛,将会推动信息智能化更进一步的发展,给人们的生活带来很多的便利。

1 人脸识别的工作原理

人脸包含着一个人的很多信息,很大程度上从一个人的人脸图像就能判断一个人。简单、直观、易于采集特征且对用户无害,使它成为容易被用户接受的一种生物特征识别。人脸的图像信息属于数字信号信息,整个对人脸图像的处理属于数字信号处理领域,其重要的功能是实现人脸数据库的建立(即训练过程)和人脸鉴别过程。这些过程属于模型识别领域内容,根据前期调查评估,隐马尔可夫模型和混合高斯模型配合使用能达到理想的识别效果。

人脸定位属于一个很大的领域,为了保证系统方向的专一性,系统默认送入引擎的就是纯人脸数据。因此,还应考虑人脸位置定位、特征提取、核心匹配算法三个重要因素。

2 核心算法与关键技术

2.1 隐马尔可夫模型

2.1.1隐马尔可夫模型简介

对于一种已知系统,知道当前时刻所处的状态,而之后的时刻和之前的时刻无关,这种过程称为无记忆的单随机过程。如果这种随机过程的状态是离散的,可以将它称作无记忆的离散随机过程。

假设一个系统,它所处的状态是有限的,某一个时刻会对应其中的一个状态;如果将这些状态均匀的分布在时间轴上,则会有一组停留在原状态,跳转到另一状态的概率。如果状态可以通过一个事件表现出来,能够被观测到则成为可观测的隐马尔科夫过程。如果状态为不可测的,需要通过另一组随机过程产生观测序列,这种双随机过程成为隐马尔科夫模型。

2.1.2隐马尔可夫模型的参数

1) N―模型的状态数

状态的集合表示[S=S1,S2,...SN] (1)

2) M―观测符号数。

每个状态可能输出的观测符号的数。

观测符号集合[O=O1,O2,...OM] (2)

3) A―状态转移概率。

状态转移概率构成的矩阵为

[A=aij,aij=P[qt+1=Sj|qt=Si],1≤i,j≤N] (3)

4) B―状态的观测符号概率分布。

(4)

5) π―初始状态分布。

[π={πi},πi=P[q1=Si],1≤i≤N] (5)

要完整地描述一个隐马尔可夫模型,需要有确定的状态数N,观测符号数M,以及状态转移概率,观测符号表现概率,初始分布概率。为了方便,常用[λ=(A,B,π)]来简记。

2.1.3隐马尔可夫模型的三个基本问题

实际应用中,确定HMM形式后,根据不同的场景需要解决不同的问题,关键有三类:

1) 已知观测序列[O=O1,O2,...OT]和模型[λ=(A,B,π)],如何有效的计算在给定模型条件下产生观测序列O的概率[POλ],即是计算一个观察序列和模型的匹配程度。

2) 已知观测序列[O={O1,O2,...OT}]和模型[λ=(A,B,π)],找出最佳的状态序列,即是通过观测到的量,来找出最优的隐含序列。

3)观测序列已知的情况下,如何调整HMM的参数[(A,B,π)] 使条件概率[POλ]最大 ,即是模型的训练问题。

2.1.4 实现方法

对于一个人脸图像来说,人的额头、眼睛、鼻子、嘴和下巴,可以对应为不同的状态。不同状态间的转换概率即构成了转换矩阵A,通过每个状态的样本数可以构造每个状态的高斯混合模型;根据高斯混合模型可以实时算出一个特征序列的表现概率及B矩阵,由于默认从第一个状态开始,则初始概率也固定。这样系统要解决的问题即变为HMM的可以解决的问题,而HMM的这三个问题都已有对应的算法来解决,系统只需按照算法流程来实现即可。

3 基于隐马尔可夫模型的系统设计

3.1.1 特征提取

系统使用二维离散余弦(2D-DCT)变换完成图像的特征提取。离散余弦变换(Discrete Cosine Transform)是与傅里叶变换相关的一种变换,它类似于离散傅里叶变换(Discrete Fourier Transform),但是只使用实数。离散余弦变换相当于一个长度大概是它两倍的离散傅里叶变换,这个离散傅里叶变换是对一个实偶函数进行的(因为一个实偶函数的傅里叶变换仍然是一个实偶函数)。将人脸图像的灰度值及其坐标关系作为人脸描述及识别的依据,对于灰度人脸图像,采用图像灰度值与图像空间距离相结合用于表征人脸图像[4],具有很好的分类效果。

对于一个样品来说,必须确定一些与识别相关的因素作为研究根据,每一个因素称为一个特征。模式就是样品所具有的特征描述。模式的特征集由处于同一个特征空间的特征向量表示,特征向量的每个元素成为特征,该向量也因此称为特征向量[5]。

而DCT变换获取频域信息后,对信息进行了压缩,通过提取特征向量,可以得到更丰富的人脸特征。

3.1.2 后端

后端利用HMM和GMM来实现人脸模型的建立和模型的匹配。隐马尔可夫模型(Hidden Markov models,HMM)是马尔可夫链的一种,当前所处的状态不能直接观察到,就像在一幅图片中,计算机不能直接知道当前区域是人脸的那部分;但观测向量(即图像特征数据)计算机已知的;状态转移矩阵有人脸图像的结构可以计算出来;观测向量和状态之间的关系,通过GMM来计算得到,HMM的每个状态由高斯混合模型(Gauss Mix Model)构成,即由多个高斯分布构成,高斯分布是由方差和均值两个要素决定,在知道方差和均值的情况下即固定了一个状态,即可通过观测向量算出当前出现在每个状态的概率。

通过给定图像通过提取到的特征确定HMM的转换矩阵、表现矩阵和高斯分布的方差、均值的过程即时模型建立的过程。

一个人脸图像在给定模型的情况下,可以通过高斯分布算出一个状态的表现概率,利用viterbi解码可以算图像在对应模型下的得分情况。

4 结束语

通过对算法进行一定优化和调整,以C语言工具完成了在系统的设计和开发;系统测试和训练集合采用,orl人脸数据库(由剑桥大学AT&T实验室创建,包含40人共400张面部图像),初步测试结果隐马尔可夫模型在人脸识别领域表现出较强的鲁棒性。

参考文献:

[1] 张铮,王艳平,薛桂香. 数字图像处理与机器视觉[M]. 北京:人民邮电出版社,2010.

[2] 冈萨雷斯,伍兹,阮秋琦,等. 数字图像处理 [M]. 3版.北京:电子工业出版社,2010.

[3] 陈胜勇,刘盛.基于OpenCv的计算机视觉技术实现[M]. 北京:科学出版社,2008.

[4] 戴欢,吴小俊.基于图像欧氏距离的人脸描述和识别方法[J].江南大学学报,2009,8(1)20-23.

[5] 许凤.基于嵌入式隐马尔可夫模型(EHMM)的人脸表情识别[D].大连:大连理工大学,2006.

上一篇:初中英语作业设计之我见 下一篇:乐视:基于互联网思维的战略迭代