视频监控中人脸识别定位方法研究

时间：2022-06-23 09:54:46

视频监控中人脸识别定位方法研究

【摘要】现有的人脸识别定位方法由于其局限先不能适用于视频监控中的人脸定位，针对智能视频监控中的运动目标的检测的特点，结合视频图像的连续性和人脸肤色的特征，提出了一种快速视频监控人脸定位的有效方法。该方法首先通过差分算法提取前景区域，然后通过BP（误差反传）神经网络的肤色分割算法，对运动区域进行检测，最后对人脸候选区域进行验证并定位。实验证明，该方法不仅能够减小检测误差，而且提高系统运行速度，实现复杂环境下的视频监控中的人脸定位。

【关键词】视频监控;人脸识别;人脸定位;神经网络;差分算法

1.引言

随着社会的不断进步，人们的活动范围越来越大，因此突发事件也越来越多，利用智能视频监控对其进行监控已经成为很多国家关注的问题。但是，目前大多数智能视频监控只是单纯的对行为进行监控，对于监控对象的外形、衣帽、身高等特征，可以在模糊的图像中获取，需要比较清晰的图像才能进行人脸识别。

对人脸进行监控和识别，然后记录出视频内所有出现的人脸信息就能获取被监控对象的人脸信息。因此，将传统的视频监控技术和人脸定位技术结合在一起便成为了当前视频监控中人脸识别定位方法的关键。对于监控结果，人脸识别定位算法的好坏将直接影响其结果。

常用人脸定位的方法有三种：基于模板匹配的算法、基于神经网络的算法、基于肤色的算法。上述三种算法在某种意义上实现了人脸定位功能，但是却存在一些问题，比如运算量太大、实现较为复杂和错误率较高，由于视频监控具有实时性的特点，因此上述方法不适合应用在视频监控系统中。本文根据人脸定位方法的不足以及视频监控人脸识别定位的特点，提出了一种新型算法，该算法能够将视频图像运动的时序性和肤色特征相结合，通过相结合后的算法能够有效减少误差，通过运动检测缩小检测范围，并将神经网络的分类特征用于检测肤色区域。该方法检测速度快，降低检测错误率。

2.算法步骤

优化改进后的算法结合区域提取和肤色检测，并使用从粗到细的检测模式。此算法由三部分构成。首先，利用图像的运动信息提取人脸范围，删除掉非人脸的活动区域，通过此步骤，可以很大程度上缩小搜索区域，因此充分提高了运算速度。其次，将BP神经网络的肤色分割算法利用在提取的人脸搜索区域，由此可以提取出肤色区域，然后对肤色区域进行合并和分割，该步骤使用区域增长算法进行实现，便得到人脸识别候选区域。最后，利用人脸的基本信息对人脸候选区域进行验证，得到人脸定位的信息。该算法如图1所示。

图1 人脸定位算法步骤

3.算法描述

3.1 运动区域提取

本算法将采用帧间差分算法进行视频图像运动区域的提取。帧间差分算法可以将图像中运动的目标提取出来，即将动态图像和静态图像（背景图像）进行分割，该算法不仅简单，而且效率高。通过计算连续两帧图像汇总没一点的灰度差值并设定一个阀值来判定哪些点是运动的，哪些点是静止的。

如公式（1）所示，t是处理连续两帧图像的时间间隔，f（x，y，t）表示一帧图像，f（x，y，t）表示下一帧图像，这两帧图像是连续的，Td是设定的阀值。假若这两帧图像的差值绝对值要大于阀值，那么说明该像素点是运动的（前景区域），否则该像素点则为静止的（背景区域）。

（1）

3.2 肤色分割

对视频流中的连续两帧图像进行对比，根据分析可知，每帧图像是由背景图像和前景图像组成的，背景图像即静态图像，前景图像即动态图像。背景图像区域的像素点灰度值变化较小，前景图像区域的像素点灰度值变化较大，运动目标当前和原来所在的区域都包括在内。

肤色是人脸特征中一个非常重要的特征，目前广泛利用的人脸识别定位方法就是利用肤色对人脸进行识别定位，利用肤色检测方法不仅效率高，而且稳定性好，实现起来较为容易，运算速度也快，有利于实时性的特性。但是对于背景图像非常复杂的环境，肤色检测方法较为不适用，因为负责的背景图像会对该方法产生强烈的干扰，该干扰会降低检测结果的准确性。为了改善干扰造成的问题，本文结合帧间差分算法将背景图像和前景图像进行分离，使用肤色检测方法直接对前景图像进行检测，从而避免了复杂的背景环境产生的干扰。改进的算法不仅能很大程度上提高检测的准确性，而且还提高算法的运算效率，保证了在视频监控中人脸识别的及时性。色彩空间和肤色分割算法是进行人脸检测的关键问题，为了提高肤色分割对光照条件改变的鲁棒性，本文将像素点的RGB颜色空间变换到YCrCb空间中，不使用RGB三种颜色信息进行判断，而是用色度和饱和度进行判断。其中，Y表示亮度信息，Cr表示红色分量的信息，Cb表示蓝色分量的信息。该像素点的空间转换举证如公式（2）所示。

（2）

为了提高肤色分割对复杂环境下的肤色检测的可靠性，本文提出一种基于BP神经网络的肤色分割算法，该分割算法使用不同颜色分量作为神经网络的分类特征，从而获取高灵敏度的分类结果，降低检测的错误率。

3.2.1 用于肤色检测的BP神经网络结构

本算法所采用的神经BP网络结构为全连接前馈网络，该网络结构为三层，如图2所示。

图2 BP网络结构

3.2.2 网络训练样本集的选择和学习

网络训练样本集是非常重要的。在理论上，用什么样的样本集进行网络训练，则该网络就具有了识别该样本的能力。本文所创新的算法采用肤色区域的像素点样本集进行训练，并且包括了各种不同光照条件、不同背景、不同肤色的人脸图像进行训练，增加本算法的通用性和有效性。

本文训练样本集采用了L=800个不同类型的样本，分别为X1，X2，…，XL，由于BP神经网络的学习算法是一种有教师的学习算法，因此对应的教师分别为d1，d2，…，dL，则可以得到BP神经网络的每一层权值的迭代公式（3），其中n0为迭代次数。

该算法的学习过程如下：

（1）确定神经网络各层的权值和阀值;

（2）输入样本到神经网络中，根据式（2）计算神经元输出值和误差;

（3）根据式（3）修改各层的权值和阀值;

（4）重复（2）（3）（4）步骤直到样本总的输出神经元的误差小于给定的数值，则停止学习。

（3）

3.2.3 人脸候选区域分割

根据神经网络可以得到监控图像的二值图，但是二值图像不是一定100%准确的，或多或少都会存在出差和噪声，因此，本文通过下面2个步骤来对误差和噪声进行过滤盒分割，并得到最佳状态下的人脸候选区域。

（1）对每个像素点进行检测并对照二值图像，如果像素点的值为1，则检测像素点周围区域中的像素点，如果周围区域中的像素点值为1的个数小于所设定的阀值，那么该像素点为噪声像素点，将其值设为0，并伸出。否则保留该像素点。如果检测到该像素点的值为0，而周围区域中像素点为值1的个数大于所设定的另一个阀值，那么该像素点为有效像素点，将其数值改为1，并保留该店。

（2）使用区域增长方法分割联通的肤色区域，将不通的肤色区域分别用其最小邻接矩阵框出得到人脸候选区域。

图3 待检测图像图4 BP网络输出结果

图5 候选人脸区域分割结果图6 最终人脸检测结果

3.2.4 候选人脸验证

本步骤主要是将不可能为人脸的区域过滤掉。该验证方法分为3个步骤：

（1）如果目标区域面积太小，则认为不是人脸区域，比如小于整幅图像面积的1/2000。

（2）根据目标区域的邻接矩阵的长和宽的比例来排除。如果长/宽大于设定的阀值，则该区域不是人脸区域，删除该区域。

（3）由于人脸区域的形状类似椭圆，因此可以利用扫描的方式来确认。根据椭圆的特征，如果满足区域的宽度逐渐增加然后减少的特征，从上往下依次扫描目标区域进行，则为人脸区域。如果不满足该规律，则该区域不是人脸区域，如图6所示最终的人脸区域。

4.结语

本文针对智能视频监控中的人脸识别定位检测提出了一套完整的解决方案，充分利用视频图像的连续性和人脸肤色信息，实现了快速进行人脸识别定位，该算法错误率低，效率高，运算速度快，而且还可以适用于各种复杂环境下的人脸定位。本方法可以广泛运用到智能视频监控中人脸识别定位检测当中，具有高效的实用价值。

参考文献

[1]艾海舟.基于肤色和模板的人脸检测[J].软件学报， 2011，5（4）：12-14.

[2]黄冠华，洪景新，郑文侃.彩色序列图像中的人脸快速定位研究[J].信息技术，2012，3（2）：56-57.

[3]张永梅，韩焱，商细云.一种人脸的检测与定位方法[J].中北大学学报（自然科学版），2009（2）：32-34.

[4]刘俊晓，孟祥增.基于帧差与非相邻帧差的自适应镜头检测方法[J].计算机工程与应用，2012，2（4）：121-123.

[5]周敬利，王志强.基于肤色分割、区域分析和模板分布的人脸检测研究[J].计算机工程与应用，2012，6（3）：67-69.

作者简介：杨国典（1982―），男，广东潮州人，电子助理工程师，现供职于东莞理工学院保卫处。

视频监控中人脸识别定位方法研究

热门标签更多>

热门推荐更多>

精品范文更多>

视频监控中人脸识别定位方法研究

热门标签 更多>

热门推荐 更多>

精品范文更多>

热门标签更多>

热门推荐更多>