基于人脸转动的非接触式鼠标控制

时间:2022-03-04 09:27:17

基于人脸转动的非接触式鼠标控制

摘 要: 通过摄像头捕捉到图像,并同时检测人脸,沈辉先 李肖肖

(四川大学 四川 成都 610207)并识别出人的眼睛和嘴巴。根据人脸在偏转前后,人眼睛在二维图像上大小的变化判断出鼠标的水平移动方向,再根据人脸在偏转前后两个眼睛距离的差值计算出鼠标的水平偏移量。并根据屏幕的宽度增加相应的位移。根据人的嘴的上下移动来判断鼠标的垂直移动方向,并根据嘴的原始位置与移动后的位置的距离差,计算出鼠标的垂直偏移量。如果左眼闭合超过0.8秒表示左击,右眼闭合超过0.8秒表示右击。

关键词: 人脸识别;人脸检测;人机交互;图像识别;C语言

1 研究内容

1.1 人眼检测。双眼是人脸的突出特征,在人脸中占据比较固定的位置,它是人脸中的极其重要的一个特征,现代的人脸识别技术很多都是建立在人眼精确检测的基础之上的,因此研究的首要内容就是如何进行人眼的精确检测。人脸识别:本论文中,需要用嘴巴的移动来控制鼠标的垂直移动,因此需要识别人脸,在识别人脸后,则嘴的特征可以由潜在的分布关系比较准确的定位,也可以较有效的计算嘴的垂直偏移量。

1.2 二维图像中的人眼测距。本论文中,鼠标水平的位移量是通过两眼间距离的变化来计算的。因此,需要研究如何计算两眼的距离,以及不同图像中两眼间距离的差值。

二维图像中的嘴的运动:在人脸识别中可以较准确的识别出人的嘴,但是还需要计算在不同图像中人的嘴的位置,进而求出两者的差值,通过放大相应的比例计算出鼠标的垂直位移量。

人眼状态检测:我们需要研究在一个小范围的连续时间内的人眼状态,以此来表示鼠标的点击。由于眼睛的对称性,我们只需要重点研究一个眼睛的状态。

2 国内外研究现状

2.1 国外研究现状。目前,在国外,美国,欧洲国家,日本等各国都展开了有关人脸识别的研究,目前国外的研究方法主要集中在以下几个方面:

1)模板匹配:主要为固定模板匹配和变形模板匹配。固定模板匹配首先需要一些固定的人脸模板,然后通过计算测定样本与这些参考模板之间的度量,以此来确定是不是人脸这种方法的实现比较简单,但是人脸由于存在很多的不确定性,而且参考模板较少,所以准确率不高。变形模板弥补了固定模板的一些缺陷,使得准确率大大提高。2)神经网络方法:神经网络方法从本质上说是一种基于样本的学习方法。将人脸与非人脸作为样本聚类,以测试样本与人脸样本集和非人脸样本集的子类之间的关系用于人脸检测,眼睛定位和人脸识别。3)示例学习方法:它的工作原理是将人脸样本和非人脸样本送入学习机中,然后产生出判别规则,以此作为判断输入的是否是人脸。但是这种方式需要学量的模型,才能产生有效的判别规则,所以算法需要精确的区分性。4)基于隐马尔可夫模型的方法:马尔可夫模型是一个离散时序有限状态机。而隐马尔可夫模型是指这一马尔可夫模型的内部状态外界不可见,只能看到各个时刻的输出值,对于人脸来说,我们就可以将脸上的器官作为一个序列,然后通过对这些区域的有序识别来检测。

2.2 国内研究现状。国内对于人脸识起步于80年代,主要提出的研究成果包括:

1)基于分形和遗传算法的人脸识别方法:这种方法就是将图像分成许多小区域,分别计算每个小区域的分形特征,通过遗传算法进行聚类得到最优解以实现不变型识别。这种方法最大的好处是可以充分利用图像的二维特征。2)基于相关性和有效互补性分析的多分类器组合方法,对人脸图像做正交小波变换,得到不同频带上的四个子图像,然后再分别提特征值。3)基于奇异值分解和数据融合的识别方法,对识别的结果用LOGISTIC回归方法进行融合,得到更加精确的识别结果。4)利用反对称双正交小波变换的微分子功能,用两幅人脸图像的小波变换系数差作为模式矢量的贝叶斯人脸识别方法。

3 研究技术路线及可行性

3.1 完成对快速人眼检测算法的选择和优化。到目前为止,人们已经提出了很多有效的人眼定位及检测的方法,大致可以分为三大类:

1)基于模板匹配的方法。模板匹配基本原理是在图像的搜索区内逐点平移参考模板图像,遍历搜索区内的每一个位置点,同时根据某个相似性测度原则,计算搜索区内该位置点的图像区域和参考模板的相关值,然后根据相关值的大小来判定跟踪点的位置。2)基于灰度投影的方法。灰度投影是通过水平和垂直方向将人脸的灰度图像的进行投影,并分别对水平和垂直方向上的灰度值及其函数进行统计,结合人脸的先验知识及与人眼的几何分布,找出各个变化点与之相对应的人脸及人眼位置;也有人利用水平和竖直两个方向上的梯度信息来代替原始灰度值,以减小光照条件的影响。3)基于统计的方法。基于统计理论的检测方法是利用统计分析并进行大量目标训练学习的方法得到权重参数,来寻找出目标样本与非目标本样本的各自的统计特征, 再使用各自的特征构建分类器,使最后用分类器完成目标定位检测。

3.2 完成对人脸和嘴巴的检测。人脸识别的具体方法包括:1)基于特征脸(PCA)的人脸识别方法;2)神经网络的人脸识别方法;3)弹性图匹配的人脸识别方法;4)线段Hausdorff距离(LHD)的人脸识别方法;5)支持向量机(SVM)的人脸识别方法。

人脸识别的技术发展了三十年,因此技术已经比较成熟,但是人脸识别仍然存在一些问题,其主要原因在于人脸的相似性和易变性。但是在本论文中,只需要摄像头捕捉到人脸,而不需要进行人脸的分辨和判断,因此在实现上比较简单,也能做到算法的优化处理。

3.3 完成对提取的信息处理。在本论文中,我们使用Microsoft Visual C++6.0来进行图像的处理。我们主要分为以下几个步骤:1)图像格式变换。2)描绘灰度直方图。3)中值滤波。4)图像增强。5)边缘检测。6)瞳孔位置计算。

4 可行性分析

本论文主要是完成一个以人脸转动来控制鼠标移动的系统的研制。其中软件部分为本论文研究的重点。硬件部分包括普通电脑摄像头,可以直接在市场上购买。实际应用中,首先将人脸转动来控制鼠标移动的系统应用于手活动不方便的残疾人身上。方便手活动不便的残疾人能够实现鼠标的操控。

5 具体应用

本论文研究了一种鼠标的操作模式。在这种操作模式下,人可以通过眼睛的移动或者脸的转动来控制鼠标。这种方式改变了鼠标的传统操作模式。对于身体残障人士,特别是手臂有残障的人士,应用这种鼠标方式来操作鼠标,可以大大的减少他们的操作负担。而且对于普通人来说,通过这种方式,能够缓解手臂手腕的压力。

参考文献:

[1]邓加琼,“复杂背景下的彩色人脸检测算法与实现”,电子科技大学硕士学位论文,2005.

[2]唐进、许海柱、王力,“图像中人眼检测技术综述”,计算机应用研究,2000,4(25).

[3]王志良、孟秀艳,《人脸工程学》,机器工业出版社,2008.

上一篇:自主研发才能创一流 下一篇:自动称量系统称量误差分析