图像识别中的智能算法应用综述

时间:2022-07-06 07:25:53

图像识别中的智能算法应用综述

【摘 要】本文从图像识别中的数学问题建模,图像识别算法,以及深度学习在图像识别中的应用几个方面进行了综述,分析了目前图像识别中的较为典型的技术手段和应用领域。

【关键词】图像识别;数学建模;分类算法;深度学习

引言

随着微电子技术及计算机技术的蓬勃发展,图像识别应运而生,图像识别是研究用计算机代替人们自动地去处理大量的物理信息,从而代替人的脑力劳动。随着计算机处理能力的不断强大,图像识别从最早的文字识别、数字识别逐渐发展到人脸识别、物体识别、场景识别、精细目标识别等,所采用的技术也从最早的模板匹配、线性分类到广泛使用的深层神经网络与支持向量机分类等方法。

1.图像识别中的数学问题建模

1.1飞行器降落图像智能识别建模

在复杂地形环境下,飞行器进行下降过程,需要采集图像并且判断是否符合降落要求。在对飞行器进行最终落地点的选择时,如果降落点复杂程度较高,采集的图像中将会产生大量的训练样本数目,图像配准过程中,极大地增加了运算量,造成最佳降落点选择的准确率降低。提出了利用图像智能识别进行最佳降落点的建模。利用伪Zemike矩能够对降落点的图像形状进行准确的描述,利用Procrustes形状分析法提取最佳降落点的特征,利用Rank的融合决策法最终实现最佳降落点选择的目的。

1.2人脸面部表情图像识别的隐马尔科夫建模

人有喜怒哀乐,目前有一种利用隐马尔科夫模型的建模方法,可以实现对人脸表情中的情感进行识别。具体的是:首先,采用子窗口对人脸面部表情图像进行采样,然后利用离散余弦变换提取所需要的特征向量,通过对人脸面部图像进行隐马尔科夫建模,使用获得的特征向量作为观测向量对人脸面部图像的隐马尔科夫模型进行训练,再使用训练后的隐马尔科夫模型对JAFFE人脸图像测试集中地人脸表情图像进行情感识别。

2.典型的图像识别算法

2.1 基于Gabor变换和极限学习机的贝类图像种类识别

对贝类图像进行Gabor变换,提取其图像特征,确定了图像特征维数;采用2DPCA方法,对变换后的特征进行降维,并利用极限学习机(ELM)进行贝类图像的分类识别。与BP神经网络和支持向量机(SVM)实验对比发现,极限学习机分类器用于贝类识别不仅速度极快而且泛化性良好,算法具有较高的精度。其特点对高维图像识别精确度高,但算法的复杂度和设计一个精确的分类器都显得难以把握。因此该类图像识别算法很难普遍推广使用,识别对象必须是贝类图像。

2.2 利用公开的全极化SAR数据,研究基于SAR图像的检测、极化分解和识别算法

首先根据四个线极化通道合成伪彩色图像,从而对场景进行初步认知。利用一维距离像分析全极化各通道的信噪比强度,通过对目标进行Pauli分解得到目标的奇次散射分量和偶次散射分量,从而完成对海杂波、建筑物和舰船的相干分量的研究。其特点过程简单易掌握,但识别对象有限。

2.3 基于SVM的离线图像目标分类算法

基于SVM的离线图像目标分类算法,先对训练集预处理,然后将处理后的图像进行梯度直方图提取最后对图像目标的分离器进行检测,但是这种图像识别算法只是有效,实用性不强。

3.深度学习在图像识别的应用

3.1 Deep learning的原理

深度学习是一种模拟人脑的思考方式,通过建立类似人脑的神经网络,实现对数据的分析,即按照人类的思维做出先关解释,形成方便人们理解的图像、文字或者声音。深度学习的重点是对模型的运用,模型中需要的参数是通过对大量数据的学习和分析中得到的。

深度学习有两种类型:有监督学习和无监督学习。学习模型根据学习框架的类型来确定。比如,卷积神经网络就是一种深度的监督学习下的机器学习模型,而深度置信网就是一种无监督学习下的机器学习模型。

3.2 深度学习的典型应用

深度学习是如今计算机领域中的一个夺人眼球的技术。而在深度学习的模型中研究热度最高的是卷积神经网络,它是一种能够实现大量图像识别任务的技术。卷积神经网络的核心思想是局部感受野、权值共享以及时间或空间亚采集。通常卷及神经网络使用最后一层全连接隐层的值作为对输入样本所提出的特征,通过外部数据进行的有监督学习,从而可以保证所得的特征具有较好的对类内变化的不变性。

3.2.1基于深度学习特征的人脸识别方法。

卷积神经网络在人脸识别领域取得了较大突破,为了更加有效的解决复杂类内变化条件下的小样本人脸识别问题,使用深度学习的方法来提取特征,与基于稀疏表示的方法结合起来,实验证明了深度学习所得的人脸特征具有很好的子空间特性,而且具有可迁移性以及对类内变化的不变性。

3.2.2基于深度学习的盲文识别方法。

目前盲文识别系统存在识别率不高、图片预处理较为复杂等问题。针对这些问题,利用深度模型堆叠去噪编码器自动、全面学习样本深层次特征,避免人为手工选取特征存在的多种弊端,并用学习的特征作为神经网络的输入,更大程度地避免了传统神经网络由于随机选取初值而导致结果陷入局部极值的问题。

3.2.3基于深度学习的手绘草图识别。

目前的手绘草图识别方法存在费时费力,较依赖于手工特征提取等问题。基于深度学习的手绘草图识别方法根据手绘草图时缺失颜色、纹理信息等特点,使用大尺寸的首层卷积核获得更多的空间结构信息,利用训练浅层模型获得的模型参数来初始化深度模型对应层的模型参数,以加快收敛,减少训练时长,加入不改变特征大小的卷基层来加深网络深度等方法实现减小错误率。

4.结论

图像识别是当代人工智能的热门研究方向,其应用领域也是超乎人类想象的,相信通过技术的不断创新,图像识别技术会给人们的生活带来智能化、个性化、全面化的服务。

参考文献:

[1]穆静,陈芳,王长元.人脸面部表情图像的隐马尔科夫建模及情感识别[J].西安:西安工业大学学报,2015(09).

[2]杨靖尧,里红杰,陶学恒.基于Gabor变换和极限学习机的贝类图像种类识别[J].大连工业大学学报,2013(04).

[3]马晓,张番栋,封举富.基于深度学习特征的稀疏表示的人脸识别方法[J].智能系统学报,2016(11).

[4]赵鹏,王斐.基于深度学习的手绘草图识别[J].四川大学学报,2016(05).

[5]王娜,万洪林,白成杰.基于SVM的离线图像目标分类算法[J].计算机系统应用,2016(02).

上一篇:“产学”合作视角下的高职学生职业能力培养体... 下一篇:《液压与气压传动》课程教学浅析