识别技术范文

时间:2023-03-09 13:45:01

识别技术

识别技术范文第1篇

本文作者:仇阿根、熊利荣、赵阳阳 单位:中国测绘科学研究院、武汉大学资源与环境科学学院、华中农业大学工学院

花生仁的外衣完整性检测是一种模式识别。根据影响花生仁外衣完整性的颜色特征参数,对花生仁外衣完整性进行识别。在神经网络运用领域里,算法的确定无法用一个完全标准,主要是靠经验来选择的。基于以上原因,花生仁外衣完整性检测神经网络的设计算法选择BP算法[9],该算法能实现输入与输出之间的非线性映射,对于样本数量有限的情况也同样适用。一个典型的BP网络结构如图3所示。BP神经网络通常具有多个隐含层。本文中,隐层神经元采用Sigmoid型传递函数,输出层采用logsig型传递函数。花生仁的外衣完整性检测是一种模式识别。根据影响花生仁外衣完整性的颜色特征参数,对花生仁外衣完整性进行识别。在神经网络运用领域里算法的确定无法用一个完全标准的算法确定,主要是靠经验来选择的。基于以上原因,花生仁外衣完整性检测神经网络的设计算法选择BP算法。一个典型的BP网络结构(如图3所示)通常具有一个或多个隐层。其中,隐层神经元通常采用Sigmoid型传递函数,而输出层神经元则采用logsig型传递函数。

BP识别系统是以BP神经网络分类器[10]为核心的系统,系统设计如图4所示。BP神经网络分类器由一个BP网络训练子系统生成得到,图像由CCD摄像头获得后,由图像采集卡数字化输入计算机,提取特征区域获得颜色特征参数,这些参数输入BP网络即可得到分类结果。影响花生完整性的颜色特征参数为H,I和S,因此输入层节点数等于3;网络的输出有两种情况,即完好与破损,因此输出层有2个节点;对应于完整和破损这两种判断结果,分别用2位二进制编码为10和01。隐含层的节点数的确定非常重要,数目过少,网络将不能建立正确的判断界,使网络训练不出来或不能识别以前没有的样本,且容错性差;而节点数目过多,学习时间长,使网络的泛化能力降低。本文通过多次反复训练网络,确定隐含层节点数目为40。本研究采用Matlab软件及其神经网络工具箱来实现网络建模。在神经网络工具箱中,对神经网络的名称、类型、结构和训练函数等参数进行设置,如表1所示。

建立了BP神经网络并对网络进行初始化后,就可对网络进行训练了。将训练步数设为500步,将训练目标误差goal参数设置为0.01,结果如图5所示。图5中,横坐标表示本网络的预置训练步数,纵向坐标表示本网络的预置训练误差,水平横线表示期望的目标误差,误差变化曲线如图5所示。由图5可知,当网络训练到170步时,网络误差已经达到期望的目标值0.01,训练即可停止。

本文采用BP神经网络与计算机视觉技术相结合的手段,建立了一个花生外衣完整性判别系统。实验证明,判别准确率达到87.1%。此系统很容易推广在其他农产品的检测中,只需要改变输入和输出样本数据,重新训练一下BP网络,即可投入使用。因此,将BP神经网络运用到农产品的品质检测过程中,具有巨大的潜力和广阔的应用前景。但必须指出的是,此方法高效可行,整个训练过程只用了6s,且本研究建立在静态实验环境下,生产效率依然很低。如果要将此实验结果运用生产实际,必须设计出配套的硬件分级设备,这将是后续研究的重点。

识别技术范文第2篇

关键词:语音识别;特征提取;模式匹配;模型训练

中图分类号:TP312 文献标识码:A文章编号:1007-9599 (2010) 05-0000-01

Summarization on Speech-Identification Technology

Liu Yu1,2,Ma Yanli1,Dong Beibei1

(1.Hebei North University,Information Science and Engineering College,Zhangjiakou075000,China;2.Tianjin University,Electronics and Information Engineering College,Tianjin300072,China)

Abstract:This text briefly introduces the theoretical basis of the speech-identification technology,its mode of classification,the adopted key technique and the difficulties and challenges it have to face.Then,the developing prospect ion and application of the speech-identification technology are discussed in the last part.

Keywords:Speech identification;Character Pick-up;Mode matching;Model training

一、语音识别技术的理论基础

语音识别技术:是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高级技术。语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支,涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域,甚至还涉及到人的体态语言(如人在说话时的表情、手势等行为动作可帮助对方理解),其最终目标是实现人与机器进行自然语言通信。

不同的语音识别系统,虽然具体实现细节有所不同,但所采用的基本技术相似,一个典型语音识别系统主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。此外,还涉及到语音识别单元的选取。

(一) 语音识别单元的选取

选择识别单元是语音识别研究的第一步。语音识别单元有单词(句)、音节和音素三种,具体选择哪一种,由具体的研究任务决定。

单词(句)单元广泛应用于中小词汇语音识别系统,但不适合大词汇系统,原因在于模型库太庞大,训练模型任务繁重,模型匹配算法复杂,难以满足实时性要求。

音节单元多见于汉语语音识别,主要因为汉语是单音节结构的语言,而英语是多音节,并且汉语虽然有大约1300个音节,但若不考虑声调,约有408个无调音节,数量相对较少。因此,对于中、大词汇量汉语语音识别系统来说,以音节为识别单元基本是可行的。

音素单元以前多见于英语语音识别的研究中,但目前中、大词汇量汉语语音识别系统也在越来越多地采用。原因在于汉语音节仅由声母(包括零声母有22个)和韵母(共有28个)构成,且声韵母声学特性相差很大。实际应用中常把声母依后续韵母的不同而构成细化声母,这样虽然增加了模型数目,但提高了易混淆音节的区分能力。由于协同发音的影响,音素单元不稳定,所以如何获得稳定的音素单元,还有待研究。

(二) 特征参数提取技术

语音信号中含有丰富的信息,但如何从中提取出对语音识别有用的信息呢?特征提取就是完成这项工作,它对语音信号进行分析处理,去除对语音识别无关紧要的冗余信息,获得影响语音识别的重要信息。对于非特定人语音识别来讲,希望特征参数尽可能多的反映语义信息,尽量减少说话人的个人信息(对特定人语音识别来讲,则相反)。从信息论角度讲,这是信息压缩的过程。

线性预测(LP)分析技术是目前应用广泛的特征参数提取技术,许多成功的应用系统都采用基于LP技术提取的倒谱参数。但线性预测模型是纯数学模型,没有考虑人类听觉系统对语音的处理特点。

Mel参数和基于感知线性预测(PLP)分析提取的感知线性预测倒谱,在一定程度上模拟了人耳对语音的处理特点,应用了人耳听觉感知方面的一些研究成果。实验证明,采用这种技术,语音识别系统的性能有一定提高。

也有研究者尝试把小波分析技术应用于特征提取,但目前性能难以与上述技术相比,有待进一步研究。

(三)模式匹配及模型训练技术

模型训练是指按照一定的准则,从大量已知模式中获取表征该模式本质特征的模型参数,而模式匹配则是根据一定准则,使未知模式与模型库中的某一个模型获得最佳匹配。

语音识别所应用的模式匹配和模型训练技术主要有动态时间归正技术(DTW)、隐马尔可夫模型(HMM)和人工神经元网络(ANN)。

DTW是较早的一种模式匹配和模型训练技术,它应用动态规划方法成功解决了语音信号特征参数序列比较时时长不等的难题,在孤立词语音识别中获得了良好性能。但因其不适合连续语音大词汇量语音识别系统,目前已被HMM模型和ANN替代。

HMM模型是语音信号时变特征的有参表示法。它由相互关联的两个随机过程共同描述信号的统计特性,其中一个是隐蔽的(不可观测的)具有有限状态的Markor链,另一个是与Markor链的每一状态相关联的观察矢量的随机过程(可观测的)。隐蔽Markor链的特征要靠可观测到的信号特征揭示。这样,语音等时变信号某一段的特征就由对应状态观察符号的随机过程描述,而信号随时间的变化由隐蔽Markor链的转移概率描述。模型参数包括HMM拓扑结构、状态转移概率及描述观察符号统计特性的一组随机函数。按照随机函数的特点,HMM模型可分为离散隐马尔可夫模型(采用离散概率密度函数,简称DHMM)和连续隐马尔可夫模型(采用连续概率密度函数,简称CHMM)以及半连续隐马尔可夫模型(SCHMM,集DHMM和CHMM特点)。一般来讲,在训练数据足够的,CHMM优于DHMM和SCHMM。HMM模型的训练和识别都已研究出有效的算法,并不断被完善,以增强HMM模型的鲁棒性。

人工神经元网络在语音识别中的应用是现在研究的又一热点。ANN本质上是一个自适应非线性动力学系统,模拟了人类神经元活动的原理,具有自学、联想、对比、推理和概括能力。这些能力是HMM模型不具备的,但ANN又不个有HMM模型的动态时间归正性能。因此,现在已有人研究如何把二者的优点有机结合起来,从而提高整个模型的鲁棒性。

二、语音识别的困难与对策

目前,语音识别方面的困难主要表现在:

(一)语音识别系统的适应性差,主要体现在对环境依赖性强,即在某种环境下采集到的语音训练系统只能在这种环境下应用,否则系统性能将急剧下降;另外一个问题是对用户的错误输入不能正确响应,使用不方便。

(二)高噪声环境下语音识别进展困难,因为此时人的发音变化很大,像声音变高,语速变慢,音调及共振峰变化等等,这就是所谓Lombard效应,必须寻找新的信号分析处理方法。

(三)语言学、生理学、心理学方面的研究成果已有不少,但如何把这些知识量化、建模并用于语音识别,还需研究。而语言模型、语法及词法模型在中、大词汇量连续语音识别中是非常重要的。

(四)我们对人类的听觉理解、知识积累和学习机制以及大脑神经系统的控制机理等分面的认识还很不清楚;其次,把这方面的现有成果用于语音识别,还有一个艰难的过程。

(五)语音识别系统从实验室演示系统到商品的转化过程中还有许多具体问题需要解决,识别速度、拒识问题以及关键词(句)检测技术等等技术细节要解决。

三、语音识别技术的前景和应用

语音识别技术发展到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大于98%,对特定人语音识别系统的识别精度就更高。这些技术已经能够满足通常应用的要求。由于大规模集成电路技术的发展,这些复杂的语音识别系统也已经完全可以制成专用芯片,大量生产。在西方经济发达国家,大量的语音识别产品已经进入市场和服务领域。一些用户交机、电话机、手机已经包含了语音识别拨号功能,还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息,并且取得很好的结果。

语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。

参考文献:

[1]科大讯飞语音识别技术专栏. 语音识别产业的新发展.企业专栏.通讯世界,2007.2:(总l12期)

[2]任天平,门茂深.语音识别技术应用的进展.科技广场.河南科技,2005.2:19-20

[3]俞铁城.科大讯飞语音识别技术专栏.语音识别的发展现状.企业专栏.通讯世界,2006.2 (总122期)

[4]陈尚勤等.近代语音识别.西安:电子科技大学出版社,1991

[5]王炳锡等.实用语音识别基础.Practical Fundamentals of Speech Recognition.北京:国防工业出版社,2005

识别技术范文第3篇

网络游戏是互联网作为网民实用性娱乐工具的重要体现,随着我国整体网络环境的改善,网络游戏市场的增长趋势明显。网络游戏是政府和业界都尤为关注的网络应用。网络游戏是一把双刃剑,在给网民提供更多的娱乐选择和促进相关产业发展的同时,也存在一些网民沉溺网络游戏,影响正常工作、学习、生活的负面问题。据我国CNNIC的最新调查显示,网络游戏在中国网络应用中排名第七位。2008年6月的网民使用率为58.3%,用户规模达到1.47亿人。网络游戏的玩家,每周平均玩游戏时间是11.9个小时。中国的网络游戏用户众多,美国同期的网络游戏使用率为35%,远低于中国。因此迫切需要解决网络游戏中的沉迷问题。

二、现行网络游戏防沉迷系统

我国在2007年8月27日由新闻出版总署《关于开展网络游戏防沉迷系统实名验证工作的通知》,通知要求网游运营企业配合公安部开展网络游戏防沉迷系统实名验证。这个就是现行的网游防沉迷系统。具体的做法是实行实名身份认证,即通过实名认证来区分成年人与未成年人,从而对游戏时间进行限制。而实名认证主要是由玩家输入自己的身份证号来进行判断。

现行防沉迷系统还存在不少安全漏洞。一是未成年人如果冒用成年人帐号进入游戏(冒用成年人的身份证号),在现有条件下仍然难以鉴定;二是该系统解决不了换号的问题,玩家可以申请多个账号,即使在网游防沉迷系统监控下,这个号到时间了,可以换另一个号;三是如果玩家在合法运营商那里玩正版玩得不痛快的话,就会玩****,这不仅让防沉迷系统失去效用,还会给国家税收造成重大损失。

更让人担忧的是,一些网游企业已意识到“在线时长”并非最好的盈利手段,且不利于网游用户的后续粘性,早就未雨绸缪地找到了绕开防沉迷系统束缚的新渠道。他们在增加网络游戏竞技趣味的同时,将赢利模式从在线时长逐渐转到免费模式上,将赢利重心转移到了装备交易上,让玩家不打装备也能长时间钉在网上。还有不少网络游戏公司已经研发、推广出大量的新型游戏。虽然谁都没有明说是针对防沉迷系统的,但从技术上看已经有这种苗头。

业内人士表示,未成年人进网吧摇身一变成年人,网游防沉迷系统的监管作用自然失效。

三.随着计算机技术的发展和网络的普及,加上多媒体与通讯条件的逐渐成熟,网络游戏飞速发展。随着网络游戏飞速发展,产生了一系列令人担忧的问题。其中最令人关注的莫过于许多青少年甚至成年人沉迷于网络游戏无法自拔,从而造成了诸多不良后果。

四、基于指纹识别技术的防沉迷系统

指纹识别技术不论在国内与国外都已经发展的较为成熟了。指纹识别技术有许多特点,比如,稳定性、唯一性等。指纹的这两个特点,为指纹用于身份鉴定提供了客观的依据。依靠这种唯一性和稳定性,就可以把一个人同其指纹对应起来,通过比较其指纹和预先保存的指纹模板进行比较,就可以验证其真实身份。

指纹识别系统完成指纹识别一般分为四个过程:

1.指纹取像。通过利用指纹采集仪采集指纹并生成指纹图像。目前使用的指纹采集仪有光学传感器、硅传感器和利用手指电场的传感器。

2.指纹特征提取。将指纹图像上的节点特征抽取出来,转化为特征数据。

3.数据存储。将指纹特征数据存储下来,这些数据一般被称为指纹模板。

4.比对。通过比对算法,将采集到的指纹与储存的指纹模板进行对比,计算出匹配结果。确认某人是否与他所声称的身份相符合。

现行的网游防沉迷系统主要缺点就是用户可以冒用他人的身份证号,而使用指纹识别技术替代现行防沉迷技术后,即可解决以上问题。指纹识别系统是一个C/S系统,需要在网吧的PC上安装客户端软件,网络游戏运营商的服务器端安装服务器端软件(身份验证程序)。

具体实施步骤为:

1.网吧等网络接入场所安装指纹识别仪器。现行的光学传感器价格都比较低廉,不会大量增加网吧的运营成本。

2.指纹采集,建立指纹信息库。上网人员上网时,必须进行指纹识别。如果指纹信息库中没有该人的指纹,则创建新的指纹信息保存在数据库中。指纹信息库中必须将指纹信息与身份信息进行联系。指纹信息库保存在国家的公安机关。

3.识别身份。根据指纹信息库中的信息,识别上网人员的身份。

4.各个网络游戏运营商要求游戏必须进行身份认证。未满18岁的,只能游戏3小时,3小时后5小时内游戏内收益减半,5小时以上游戏内收益为0。同时,如果同一身份的用户3小时后切换游戏角色,按照以上相同的规则处罚。这样就可以避免切换角色不惩罚的缺点。

以上基于指纹识别技术的网游防沉迷系统仅针对网吧用户,主要原因是当今沉迷网游的青少年大部分都是在网吧上网进行游戏。

另外,需要说明的是,防沉迷在技术上的防范不可或缺,但治标不治本。因为,真正的“防网游沉迷系统”,不仅仅是一个技术的“系统”,需要多管齐下,标本兼治。在这方面,国外的一些做法值得我们借鉴:美国一些网游公司为防玩家沉迷,实施“休息奖励制”,而非我们的“沉迷严惩制”,据说效果不错;韩国采用实名制将游戏账号和身份证联系在一起,保证一个玩家在一款游戏中只有一个账号,同时对网游进行了严格分级,并有一个很好的信用系统和支付系统(用手机支付)。

五、结束语

识别技术范文第4篇

《中国自动识别技术》(CN:11-5503/TP)是一本有较高学术价值的大型双月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度,颇受业界和广大读者的关注和好评。

《中国自动识别技术》全面、系统、长期地介绍自动识别技术与应用,准确地反映国内外自动识别技术的发展与应用现状和趋势,探讨国内外自动识别技术的应用理念、法规、技术、标准,总结自动识别技术与应用的经验,预测自动识别技术的发展方向,为行业管理和企业经营管理提供决策参考,为推动中国自动识别技术与应用的健康发展服务。

识别技术范文第5篇

关键词:车牌识别技术;智能交通;Mean Shit算法

中图分类号:TP391.41 文献标识码:A 文章编号:1007-9599 (2013) 09-0000-02

随着汽车在人们的工作、生产和生活中扮演着越来越重要的角色,汽车的保有量也在急速增加。由此带来的交通管理问题也变得越来越复杂,智能交通系统的建立是最好的解决问题的方法。而车牌识别技术在智能交通系统中占有十分重要的地位。停车厂、收费站、生产企业的门禁管理都有车牌识别技术的身影。

在车辆车牌识别技术中的图像提取、字符分割起、字符识别过程中,数字图像处理技术起到了重要作用。但由于图像提取现场可能存在因时间、光线、天气的变化而造成的干扰使车牌成像效果较差的问题。所以目前现有的车牌识别系统都存在因环境变化而产生的识别率变化的问题。

1 车牌图像预处理技术

车牌图像预处理技术一般包括通过滤波技术、灰度化、图像增强、数学形态学等。

1.1 滤波技术

在实际工作场景中采集到的数字图像通常会因为外界环境、摄像设备、传输线路或保存精度等方面的原因,使其在进行预处理前受到各种噪声的污染。并且在图像处理过程中也可能会对图像产生噪声。噪声与我们想要处理的图像没有任何关联,还会对我们的处理产生不好的影响。所以,一般情况下我们会在进行图像处理前对图像采用滤波技术进行处理,常用的滤波方法有:中值滤波、均值滤波、高斯滤波等。

1.2 图像增强算法

图像的对比度不足是图像处理的过程中经常会遇到的问题。主要的原因是在获取车牌图像时受外界环境的影响。对比度不足的图像会影响到图像的后续处理效果,所以,一般情况下,在进行图像处理前会使用灰度变换的方法来对图像进行对比度增强处理,以达到改善视觉效果的目的。

1.3 数学形态学

数学形态学[1]是在1964年由法国巴黎矿业学院博士生赛拉(J. Serra)和导师马瑟荣,在从事铁矿核的定量岩石学分析及预测其开采价值的研究中提出的。数学形态学的数学基础和所用语言是集合论,因此它具有完备的数学基础,这为形态学用于图像分析和处理、形态滤波器的特性分析和系统设计奠定了坚实的基础。基本方法是利用一个拥有一定形状的结构元素来检测图像的形状和结构。

1.4 Mean Shift算法

Mean Shift这个概念最早是1975年在一篇关于概率密度梯度函数的估计的文章中由Fukunaga等人提出来的,它的意思是偏移的均值向机构量。一般是指一个迭代的步骤,即先算出当前点的偏移均值,移动该点到其偏移均值,然后以此为新的起始点,继续移动,直到满足一定的条件结束。目前,Mean Shift算法较多地应用到图像聚类方面。

2 车牌的定位与校正

本章主要描述的是对已有车牌定位方法的研究,了解它们的算法原理及其优缺点,并提出了一种效果更好适用范围更广的车牌识别系统方法,即将Mean Shift算法运用到车牌识别系统,然后在此基础上对车牌进行校正。

2.1 车牌定位

车牌定位是指根据车牌图像的区域特征来将车牌在图像中的部分从背景图像中分离开来,由于车牌区域在图像特征主要包括颜色和形状,车牌区域的颜色一般为蓝色、黄色或白色,它们与图像的背景颜色存在较大的差异。车牌的形状一般为矩形。而车牌号在外形和排列上都存在规律性。车牌定位技术就是将上述特征经过一定的变换与处理后,使之能作为车牌定位的依据。

常用的车牌定位的方法有基于颜色的方法、基于纹理特征的方法、基于数学形态学的方法、基于小波变换的方法等。这些车牌定位方法,都各自具有不同的局限性。使用Mean Shift算法进行车牌定位可以获得比较好的效果。对于图像空间的所有像素点,在经过Mean Shift算法迭代后,如果最终收敛于同一点,则停止迭代。用同样的方法对图像空间中的所有像素点进行迭代遍历,得出的结果根据收敛点的不同可以把整个空间分成几个区域。这些区域即为可能的车牌区域,再通过上述特征在可能的车牌区域中进行对照分析,就可以得到车牌区域。

2.2 车牌校正

车牌校正是为了解决拍摄的车牌图像因为角度问题,导致定位后的车牌倾斜,而倾斜的车牌会给车牌识别系统的后继步骤增添麻烦,车牌校正是必须的。车牌校正是利用车牌区域的矩形序列分布同组成车牌号的字母、数字位置的分布基本一致的特征,找到了矩形序列中矩形左上角像素点排列的近似斜率,从而找出车牌区域的偏转角度,完成车牌图像区域的校正。

3 车牌的字符分割与字符识别

3.1 车牌字符分割

车牌字符分割主要后面的字符识别做准备,它是把车牌图像区域中的字符和数字一一地分割开,以便于后续处理中对单个字符进行识别。字符分割的方法[2]主要有:基于连通域标记的字符分割算法、灰度垂直投影分割的方法等。

灰度垂直投影分割的方法是车牌字符分割处理中比较热门的技术。李文举[3]等在《种新的面向字符分割的车牌图像预处理方法》一文中提出的算法步骤是:字符上下边界的确定采用的是由中点到两端搜索的方法;运用一维循环清零法对分离出的车牌号图像区域进行垂直分割,从而得到车牌的单个字符;再对二值图像进行垂直投影,若垂线上有亮点则将对应的投影值设为1,否则为0,得到垂直投影矩阵。如果是车牌字符的话,则在生成的垂直投影矩阵上应该是连续的1。如果是字符之间的间隔的话,则应该是连续的0值,噪声点可能会出现单个的1和0值。在对矩阵进行扫描后,就可以识别出字符区和间隔区。

3.2 车牌的字符识别

车牌字符识别是将分割开的单个字符进行匹配判断。常用的车牌字符识别方法主要有:基于模板的识别算法、基于BP神经网络的识别算法等。

基于模板的识别算法由于其处理速度快、识别率高的特点为大多数设计所采用。它是把分割后的单个字符区域与预置的标准字符集进行匹配处理,取标准字符集中相似度最大的字符作为识别结果。这种算法的处理步骤是:将单个字符图像区域进行二值化并改变字符大小,使之与字符集中的字符大小相同,然后再进行匹配操作,筛选出相似首先需要有字符模板库,将待识别的字符进行二值化后,将其大小变成字符模板库中字符大小,然后与库中的字符进行匹配,以相似度最高的字符为最终结果。因为算法简单所以算法的速度较快,只要在前期的预处理中降噪做得比较好,这种算法的识别率也相对较高,是一种简单、快速、有效的字符识别技术,商用价值较高。

从目前研究情况盾来,由于车牌图像拍摄环境的复杂性和多变性,在选择及判断识别技术的好坏时具有一定的难度,现有的一些方法也存在不足。而智能化交通系统对车牌识别技术的需求却十分急迫。因此,需要我们进一步深入研究更有效的车牌识别技术,以使车牌识别系统更加完善。

参考文献:

[1]戴青云,余英林.数学形态学在图像处理中的应用进展[J].控制理沦与应用,2001,1,18(4):478-482.

[2]左望霞.复杂背景下多车牌图像分割技术研究[D].电子科技大学硕士学位论文,2006.

[3]李文举,梁德群,崔连延,毕胜.一种新的面向字符分割的车牌图像预处理方法[J].计算机应用研究,2004(7):258-260.

识别技术范文第6篇

关键词:人脸识别;PCA算法;识别方法

中图分类号:TP39 文献标识码:A

引言

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。生物特征识别技术所研究的生物特征包括脸、指纹、手掌纹、虹膜、视网膜、声音(语音)、体形、人脸识别、个人习惯(例如敲击键盘的力度和频率、签字)等。

一、几何特征的人脸识别方法

几何特征可以是眼、鼻、嘴等的形状和它们之间的几何关系(如相互之间的距离)。这些算法识别速度快,需要的内存小,但识别率较低。

1、基于特征脸(PCA)的人脸识别方法

特征脸方法是基于KL变换的人脸识别方法,KL变换是图像压缩的一种最优正交变换。高维的图像空间经过KL变换后得到一组新的正交基,保留其中重要的正交基,由这些基可以形成低维线性空间。如果假设人脸在这些低维线性空间的投影具有可分性,就可以将这些投影用作识别的特征矢量,这就是特征脸方法的基本思想。

2、神经网络的人脸识别方法

神经网络的输入可以是降低分辨率的人脸图像、局部区域的自相关函数、局部纹理的二阶矩阵等。这类方法同样需要较多的样本进行训练,而在许多应用中,样本数量是很有限的。

3、弹性图匹配的人脸识别方法

弹性图匹配法在二维的空间中定义了一种对于通常的人脸变形具有一定的不变性的距离,并采用属性拓扑图来代表人脸,拓扑图的任一顶点均包含一特征向量,用来记录人脸在该顶点位置附近的信息。

4、线段Hausdorff 距离(LHD) 的人脸识别方法

心理学的研究表明,人类在识别轮廓图(比如漫画)的速度和准确度上丝毫不比识别灰度图差。LHD是基于从人脸灰度图像中提取出来的线段图,它定义的是两个线段集之间的距离,与众不同的是,LHD并不建立不同线段集之间线段的一一对应关系,因此它更能适应线段图之间的微小变化。

5、支持向量机(SVM) 的人脸识别方法

近年来,支持向量机是统计模式识别领域的一个新的热点,它试图使得学习机在经验风险和泛化能力上达到一种妥协,从而提高学习机的性能。支持向量机主要解决的是一个2分类问题,它的基本思想是试图把一个低维的线性不可分的问题转化成一个高维的线性可分的问题。

二、人脸识别的基本方法

1、人脸识别算法

一般来说,人脸识别系统包括图像摄取、人脸定位、图像预处理、以及人脸识别。系统输入一般是一张或者一系列含有未确定身份的人脸图像,以及人脸数据库中的若干已知身份的人脸识别、人脸图像或者相应的编码,而其输出则是一系列相似度得分,表明待识别的人脸的身份。

2、采用人脸识别的优势

人脸识别的优势在于其自然性和不被测个体察觉的特点。所谓自然性,是指该识别方式同人类进行个体识别时所利用的生物特征相同。例如人脸识别,人类也是通过观察比较人脸区分和确认身份的,另外具有自然性的识别还有虹膜识别、语音识别、体形识别等,而指纹识别、虹膜识别等都不具有自然性,因为人类或者其他生物并不通过此类生物特征区别个体。

3、人脸识别困难性

人脸识别被认为是生物特征识别领域甚至人工智能领域最困难的研究课题之一。人脸识别的困难主要是人脸作为生物特征的特点所带来的。

1)相似性

不同个体之间的区别不大,所有的人脸的结构都相似,甚至人脸器官的结构外形都很相似。这样的特点,人脸类似性对于利用人脸进行定位是有利的,但是对于利用人脸区分人类个体是不利的。

2)易变性

人脸的外形很不稳定,人可以通过脸部的变化产生很多表情,而在不同观察角度,人脸的视觉图像也相差很大,另外,人脸识别还受光照条件、人脸的很多遮盖物、年龄等多方面因素的影响。在人脸识别中,第一类的变化是应该放大而作为区分个体的标准的,而第二类的变化应该消除,因为它们可以代表同一个个体。通常称第一类变化为类间变化(inter-class difference),而称第二类变化为类内变化(intra-class difference)。对于人脸,类内变化往往大于类间变化,从而使在受类内变化干扰的情况下利用类间变化区分个体变得异常困难。

4、人脸识别主要用途

人脸识别主要用于身份识别。由于视频监控正在快速普及,众多的视频监控应用迫切需要一种远距离、用户非配合状态下的快速身份识别技术,以求远距离快速确认人员身份,实现智能预警。人脸识别技术无疑主要用于身份识别是最佳的选择,采用快速人脸检测技术可以从监控视频图像中实时查找人脸,并与人脸数据库进行实时比对,从而实现快速身份识别。

5、人脸识别新技术

传统的人脸识别技术主要是基于可见光图像的人脸识别,这也是人们最熟悉的识别方式,已有30多年的研发历史。但这种方式有着难以克服的缺陷,尤其在环境光照发生变化时,识别效果会急剧下降,无法满足实际系统的需要。解决光照问题的方案有三维图像人脸识别,和热成像人脸识别。但目前这两种技术还远不成熟,识别效果不尽人意。最近迅速发展起来的一种解决方案是基于主动近红外图像的多光源人脸识别技术。它可以克服光线变化的影响,已经取得了卓越的识别性能,在精度、稳定性和速度方面的整体系统性能超过三维图像人脸识别。这项技术在近两三年发展迅速,使人脸识别技术逐渐走向实用化。

6、人脸识别的应用

人脸识别的应用主要有如下方面。

1)公安刑侦破案

通过查询目标人像数据寻找数据库中是否存在重点人口基本信息。例如在机场或车站安装系统以抓捕在逃案犯。

2)门禁系统

受安全保护的地区可以通过人脸识别辨识试图进入者的身份。人脸识别系统可用于企业、住宅安全和门禁人脸识别。如人脸识别门禁考勤系统,人脸识别防盗门等。

3)摄像监视系统

可在机场、体育场、超级市场等公共场所对人群进行监视,例如在机场安装监视系统以防止登机。如银行的自动提款机,如果用户卡片和密码被盗,就会被他人冒取现金。如果同时应用人脸识别就会避免这种情况的发生。

4)网络应用

利用人脸识别辅助信用卡网络支付,以防止非信用卡的拥有者使用信用卡等。

5)身份辨识

如电子护照及身份证。这或许是未来规模最大的应用。在国际民航组织已确定,从 2010年4月1日起,其118个成员国家和地区,必须使用机读护照,人脸识别技术是首推识别模式,该规定已经成为国际标准。

6)信息安全

如计算机登录、电子政务和电子商务。在电子商务中交易全部在网上完成,电子政务中的很多审批流程也都搬到了网上。而当前,交易或者审批的授权都是靠密码来实现。如果密码被盗,就无法保证安全。如人脸识别过程,如果使用生物特征,就可以做到当事人在网上的数字身份和真实身份统一。从而大大增加电子商务和电子政务系统的可靠性。

参考文献

识别技术范文第7篇

1.概况

语音识别技术成为21世纪“数字时代”的重要开发领域,在计算机的多媒体技术应用和工业自动化控制应用等方面,成果令人属目。语音识别技术是指用电子装置来识别某些人的某些特征语音,语音识别的手段一般分为二大类,一类利用在计算机上开发语音识别系统,通过编程软件达到对语音的识别,另一类采用专门的语音识别芯片来进行简单的语音识别。利用专门的语音识别芯片应用在地铁车辆上,具有结构简单、使用方便,并且语音识别器有较高的可靠性、稳定性的特点,是简单语音识别在自动控制应用上的一种优先方案。

目前上海地铁

一、

二、

三、

五、

六、八号线在车辆信息显示系统的设计上缺少实用性和操作性,对乘客来讲缺少在实时报站时的人性化。如:地铁车厢内的乘客信息显示系统和车厢外侧的列车信息显示系统。如果在每个车门的上方安装车站站名动态显示地图,实时显示与车厢广播同步的信息,以及在每节车厢外侧显示列车的终点站,良好的工业设计不仅能给广大的乘客带来非常大的帮助,而且能够提升上海地铁服务的形象。由于在设计以上地铁列车时,受科技发展的限制。现在上海地铁4号线在车辆信息显示系统的设计上满足了广大的乘客的需求,

增加了车站站名动态显示地图。

如何在现有的地铁车辆上增加地铁车厢内的乘客信息显示系统和车厢外侧的列车信息显示系统,如图1、2,首先考虑其实用性和性价比,同时安装、操作要方便,在不影响列车的性能的前提下,完成本乘客信息显示系统的应用,设计方案的选择极其重要,目前的乘客信息显示系统比较复杂,例如:对于应用在某条线路上的声音识别系统,不仅要修改原语音文件,而且声音识别器不容易操纵,

对使用者来讲仍然存在比较多的问题。对于应用在某条线路上数字传输显示系统,其操作方法不仅给司机带来了任务,每站需要手动操作二次,同时显示的相关内容没有实时性,总之乘客信息显示系统比较落后。

设计一种符合现代化要求的乘客信息显示系统是非常必要。

2.设计

地铁车辆乘客信息显示系统的设计,采用CMOS语音识别大规模集成电路,识别响应时间小于300ms。HM2007芯片采用单片结构,如图3。将语音识别需要的全部电路:CPU、A/D、ROM、语音的AMP放大器、压缩器、滤波器、震荡器和接口界面等集中在一片芯片内,这样电路就非常少,外接64K非易失性SRAM,最多能识别40个车站站名语音(字长0.9秒),或(字长1.92秒)但识别仅20个车站站名语音。按正常人的讲话速度,0.9秒一般每秒吐字1到3个为宜。

针对目前上海地铁列车在车厢内外无LED动态站名显示而设计,通过将列车车厢广播的模拟信号转换成数字信号,自动控制LED发光二极管,在列车在车厢内使得广播的内容(每个车站站名)与发光二极管显示面板声光同步,将显示面板放置地铁车辆的每扇车门上方,并且显示面板以地铁运营线路为背景,达到列车进站和出站时能分别指示。在列车车厢外让乘客非常直观地、一目了然地了解车辆的终点站方向,从而方便乘客的上下车,提高了地铁服务水平。在国外的地铁列车上应用已相当普遍。

语音识别显示器①的输入端与车载广播功放器相连接,实现广播模拟信号发出的语音进行车站名的自动识别。不需要编程技术和修改文件等方法,全部采用硬件方法设计。整个系统分为5部分:(1)输入控制部分;(2)噪音滤波部分;(3)语言识别部分;(4)执行显示部分;(5)录音功能部分。

(1)输入控制部分:

通过麦克风或(结合器)连接,如图4所示,要求模拟语音输入点的电压必须控制在大约20mv左右,以确保后期语音识别的正确性。在输入电路中增加了声音控制部分的电路,即将模拟信号转变成数字方波信号,对语音输入进行开关量的控制,确保在T<0.9秒内的正确输入语音字长。

(2)语音识别部分:

利用语音识别芯片HM2007和外接6264SRAM存储器组成为主要部分,(HM2007中ROM已经固化了语音语法技术)对语音的存储及语音语法算法进行控制。HM2007的详细内容见产品说明书。

(3)噪音滤波部分:

滤波功能是自动识别(阻挡)我们在设计阶段设计好的各个工况的语音情况,例如:司机的讲话及车辆杂音等(在麦克风的工况下),以确保输入语音的可靠性、稳定性,特采用UM3758串行编译码一体化进行滤波电路。如图5。

(4)执行显示部分:

将车厢广播喇叭的模拟信息通过语音识别器转变成数字信息,最终经过译码电路、4/16多路数据选择器及RS485接口,去控制车厢内车门上十个LED显示面板,如图6。

(5)录音功能部分:

在进行广播内容更改时,本项目最大的特点是:不需要任何手段的手工软件编程的修改,而是通过远程音频电路控制技术进行按动相关按钮,选择地址然后自动录入内容,如图6。

3.结论

语音识别器及LED显示面板的设计,能应用到以前没有LED显示面功能的地铁车辆上,与其他所设计的方式相比较,语音识别控制简单、可靠性好、安装方便、相对投资最小和不改动车厢内任何电器为特点,仅提供110VDC电源和音频输入接口。

本项目的开发具有一定社会效益,得到国内外乘客和残疾人员的欢迎,提高了地铁服务质量。

参考文献:

1.HUALONMICRELECTRONICSCORPORATIONTIWANPRODUCTNUMBER:HM2007

2.555集成电路实用大全上海科技普及出版社

3.①获得“2003年上海市优秀发明选拔赛三等奖”

4.①编入《中国科技发展精典文库》第四辑

5①编入《中国科技发展论坛》建设科技卷

识别技术范文第8篇

关键词:自动识别;技术;体系;应用

中图分类号:F49 文献标识码:A

收录日期:2011年12月8日

一、自动识别技术概述

1、自动识别技术的定义。自动识别技术是指应用一定的识别装置,通过被识别物品和识别装置之间的接近活动,自动地获取被识别物品的相关信息,并提供给后台的计算机处理系统来完成相关后续处理的一种技术。

2、自动识别的对象。目前主要是对物和人进行自动识别。

3、自动识别技术的应用价值

(1)提高企业的自动化水平,提高工作效率,创造更多的价值。

(2)优化企业的工作流程,降低运营成本。

(3)通过建立合理的识别加密方式,保护个人隐私和商业隐私,提高安全性。

(4)利用识别技术,可以在很短的时间内提供更多信息。

二、自动识别的技术体系

自动识别方法常见的技术有5种。如图1所示。(图1)

1、条形码识别技术。条码是一种由一组排列规则的条、空及对应字符组成的标记,用以表示一定的信息。

(1)常用的条码。有EAN码、UPC码、39条码、交插25码和EAN28码。

(2)条码分类。包括:一维条码(通常是指传统条码,一维条码按应用可分为商品条码和物流条码两种);二维条码(按构成原理和结构形状的差异可分为两类,一类是行排式或层次式二维条码,另一类是棋盘式或点矩阵式二维条码)。

2、磁条识别技术

(1)磁条是指一层由定向排列的铁性氧化粒子组成的材料。磁条需要与磁头作物理接触,由磁条滑过磁头进行信息的读写,最终实现识别。

(2)磁条技术在很多领域得到了广泛应用,如:信用卡、银行卡、登机牌、自动售货卡、现金卡、会员卡等。

3、光学字符(OCR)识别技术。光学字符识别主要是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。

4、生物识别技术。生物识别是针对人类独有的物理特征或行为特征进行辨识,透过辨识程序确认并认证身份的技术。主要分为物理特征类识别与行为特征类识别:

(1)物理特征类识别(手指;手掌;眼睛,包括虹膜、视网膜;面孔)。适用于需严格确认身份的情况下,以直接采集人体独有的物理特征方式来识别身份,目前以指纹识别技术应用最为普遍。

指纹识别技术可分为验证和辨识。验证是通过把一个现场采集到的指纹与一个已经登记的指纹进行一对一的对比来确认身份的过程。辨识则是把现场采集到的指纹同指纹数据库中的指纹逐一对比,从中找出与现场指纹相匹配的指纹(一对多)。

(2)行为特征类识别(包括:签字、语音)。适用于需要较高便利性的情况,以采集人类行为表现的差异来识别身份,目前以签名识别技术应用最为普遍。

签名识别技术在应用中具有其他生物识别所没有的优势,人们已经习惯将签名作为一种在交易中确认身份的方法,它的进一步的发展也不会让人们觉得有太大不同。实践证明,签名识别是相当准确的,因此签名很容易成为一种可以被接受的识别符。但缺点是随着人年龄的增长、性情的变化与生活方式的改变,签名也会随着产生改变。

5、语音辨识技术。语音辨识是一种非接触的识别技术,用户很容易接受并使用,但缺点是语音变化的范围太大,很难进行精确的匹配,而语音会随着音量、速度和音质的变化而影响采集与对比的结果。

6、智能卡技术。又称智慧卡、集成电路卡(IC Card),是一种将具有微处理器及大容量存储器的集成电路芯片嵌装于塑料基片上而制成的卡片。卡片包含了微处理器、I/O接口及内存,提供了数据的存取控制及储存功能。

7、射频识别RFID。又称电子标签、无线射频识别,是一种通信技术,通过无线电讯号识别特定目标并读写相关数据,而无需识别系统与特定目标之间建立机械或光学接触。

三、常见自动识别方法比较(表1)

四、自动识别技术的应用

随着自动识别技术的日趋成熟,性能越来越稳定,作用和效果已被社会所公认。目前,自动识别技术已广泛应用于身份识别、零售、物流运输、邮政通讯、电子政务、工业制造、军事、畜牧管理等各个领域,如图2所示,在我国经济发展中发挥着越来越重要的作用。(图2)

物联网时代的来临,给自动识别技术带来新的发展机遇和挑战。随着进一步的推广和应用,自动识别技术将在人们未来日常生活的各个方面都会得到具体的应用,将会发展成为未来信息社会建设的一项基础技术,具有良好的发展前景。

主要参考文献:

[1]中国物品编码中心,中国自动识别技术协会.自动识别技术导论[M].武汉:武汉大学出版社,2007.

[2]张铎.自动识别技术应用案例分析[M].武汉:武汉大学出版社,2010.

识别技术范文第9篇

关键词:车牌识别系统; 智能交通; 技术

中图分类号: TP391.4文献标识码:A文章编号:1009-3044(2008)18-20ppp-0c

Research on Licence Plate Recognition System

YI Lian-jie

(Loudi Vocational and Technical College Loudi Huanan417000)

Abstract: The licence plate recognition system has an importantrole of morden intelligent traffic system. This paper narrated the key technology ofthe licence plate recognition system and discussed the existing problems and development of the licence plate recognition system.

Keywords: the licence plate recognition system; intelligent traffic system; technology

车牌识别系统是智能交通系统的关键部分,可广泛应用于交通管理、监控和电子收费等场合。车牌识别系统就是以车牌作为车辆的唯一标识,采用计算机视觉和模式识别技术对汽车车牌的自动识别。

1 车牌识别系统的组成

典型的车牌识别系统由车辆检测、图像采集、车牌识别等部分组成(图1)。车辆检测就是使用车辆传感器或红外线检测等来判断车辆是否通过某一位置。当车辆驶过探测部位时,CCD摄像机拍摄车辆图像,由图像采集卡采集图像并输入计算机。车牌识别部分由计算机和识别软件组成,从由CCD摄像机采集的图像中自动寻找车牌,然后对找到的车牌进行字符切分和识别,最后获得车牌号码,并将识别结果送至监控中心等场合。

图1车牌识别系统的组成

在整个识别系统中,以车牌识别最为关键。识别过程有两个步骤,首先从图像中找出确切的车牌位置,即车牌定位,然后对找出的车牌进行字符切分和识别。车牌识别过程包含两大关键技术:1.车牌区域定位技术;2.车牌字符切分和识别技术。

2 车牌定位技术

图像输入计算机后,系统要自动找出车牌的准确位置。车牌区域定位是车牌字符切分和识别的基础,是提高系统识别率的关键。车牌定位过程包括三个步骤:图像预处理、车牌搜索和车牌纠偏。

2.1 图像预处理

图像预处理的作用:平滑去噪和车牌特征增强。

平滑去噪就是消除图像上由于光照、车牌污损等产生的噪声干扰。平滑方法主要有平均滤波、中值滤波和指数函数滤波等方法。中值滤波和指数滤波平滑效果好且能较好保持牌照和字符边缘,但在平滑效果和处理速度方面不如平均滤波。

通常的车牌定位算法是依据车牌特征从图像中找出车牌,因此必须使车牌区域显示出与非车牌区域不同的独有的特征,车牌特征增强使图像中车牌区域明显突出。通常有下述增强方法:边缘检测法、二值化法、量化法、数学形态学法。

具有不同灰度的相邻区域之间存在边缘,在车牌区域存在车牌边框边缘和车牌字符边缘。边缘检测法就是要检测出这些边缘。有关边缘检测的算法很多,考虑实时性要求,采用简单的微分算子,如一阶微分算等。这些算子采用小区域模板与图像卷积实现边缘检测。文献[1]提出一种牌照字符边缘特征增强的方法,该方法使用线性滤波器函数将每一行中多个连续的水平方向梯度值相加,使得字符的垂直边缘增强。微分算子对噪声较为敏感,因此在使用之前需要平滑去噪。LOG算子是高斯指数平滑法与Laplacian算子相结合的边缘检测方法,既能消除噪声又能很好的突出车牌字符的边缘。

二值化增强法先确定一个阈值,然后将图像中各个像素的灰度值都与这个阈值比较,根据比较结果将整个图像的像素点分为两类,车牌区域归为一类,便于车牌搜索。为了满足实时性要求,采用简单、快速的二值化法,如平均阈值法,反积分自适应阈值法等。

文献[3]使用神经网络来对彩色图像量化,使得车牌区域的字符为一种特定的颜色,然后进行颜色过滤或线扫描,借此提取车牌。该方法首先必须选取车牌样本图像,并且要把RGB颜色模式转换为HSI模式,以HSI各分量值作为输入对神经网络进行训练,再以训练好的神经网络对图像的各像素点量化分类,该方法抗干扰能力强,量化前可不要求平滑,

数学形态学表示以形态为基础对图像进行分析的数学工具,它的基本思想使用具有一定形态的结构元素去量度和提取图像中的对应形状以达到对图像分析和识别的目的。数学形态学有四种基本的运算:膨胀,腐蚀,开启和闭合。出于以下两个意图而使用形态学方法:1.将开启和闭合结合起来,消除二值化后的车牌区域中存在的细小空洞;2.采用水平线段的结构元素膨胀,使二值化后的车牌区域成为一连通区域。

需要说明的是,上述方法往往不是单独使用,如二值化法是对边缘检测后的图像进行,而形态学方法是在二值化图上实现。不能简单的评价图像预处理方法的优劣,因为这与所对应的车牌搜索方法紧密相关。

2.2 车牌搜索

车牌搜索就是根据车牌区域特征在图像中寻找车牌的过程。根据搜索的方式可把车牌搜索方法分为以下几种:投影统计法、线扫描法、模板匹配法和反Hough变换法等。车牌搜索法要与相应的车牌增强法配合使用(见表2)。

表2车牌增强法用于不同搜索法的情况

投影统计法对边缘化或二值化图像进行水平和垂直累加投影,根据投影直方图呈现的连续峰、谷、峰的分布的特征来提取车牌,或对由形态学膨胀运算后的图像水平和垂直投影,在投影图上寻找波峰和波谷而确定车牌位置。文献[24]提出的采用高斯指数函数对投影图平滑,能有效消除投影图的毛刺,使车牌位置为明显的波峰,提高车牌定位的精度。

线扫描搜索法则是对边缘化或二值化后的图像逐行水平扫描,穿过车牌区域的扫描线因为字符边缘的存在,灰度呈现起伏的峰、谷、峰的变化,或频繁交替出现亮基元、暗基元的特征,以提取车牌。文献[3]用神经网络对彩色图像量化之后,再逐行水平扫描,分别获取颜色向量和长度向量,能与标准车牌区域的颜色向量和长度向量匹配的为车牌区域。

模板匹配搜索法是以特定的模板在图像区域滑动,以与模板匹配的局部区域为车牌。使用的模板有线模板、倒”L”角模板、矩形框模板。线模板以水平线段或垂直线段为模板,来检测车牌的边框角点;倒“L”模板以倒“L”结构为模板来寻找车牌边框的左上角;矩形框模板以一个与车牌长宽比例相当的矩形框作为模板,在整个图像区域滑动,以符合某一判别函数值的区域作为车牌区域。

反Hough变换搜索法是基于车牌形状特征的方法,先对图像进行Hough变换,然后在Hough参数空间寻找车牌的四个端点。

上述搜索法可以结合使用,如文献[25]提出的自适应边界搜索法,先用倒”L”模板寻找车牌边框的左上角,然后用水平线扫描和垂直线扫描找出下边框和右边框。投影统计搜索法和线扫描搜索法处理速度快,能对大小不同的车牌识别,但定位精度不高和出现虚假车牌的情况,需要提高定位精度和去除虚假车牌的后续工作。模板匹配搜索法能比较准确的找到车牌位置,但难以满足实时性要求,可以采用神经网络或遗传算法来加快搜索进程。反Hough变换搜索法除了能准确找到车牌位置,还能确定车牌的倾斜角度,对噪声、轮廓线中断不敏感,但在有直线干扰下可能实效,文献[28]提出的快速Hough变换的策略能满足实时性要求。

2.3 车牌纠偏

由于车辆运行轨迹不定、摄像机位置偏斜等原因,使得图像中车牌扭曲,为了后续正确的车牌字符切分和识别,就须对车牌纠偏,使车牌达到规范的位置和大小。采用的纠偏方法通常先是用Hough变换确定水平边框倾斜角度和垂直边框倾斜角度,然后纠偏。文献[22]提出使用Rodan 变换可用来确定倾斜角度。

3 车牌字符识别技术

车牌定位之后就要对车牌字符识别。这一过程包含下列几个步骤(见图2):车牌二值化,字符切分,字符特征提取和字符识别。这里只讨论后三个步骤。

图2 车牌字符识别步骤

3.1 字符切分

字符切分把车牌上的字符分开,得到一个个的字符图像。常用的字符切分方法有投影法、模板匹配法、区域生长法、聚类分析法等。

投影法把车牌图像垂直累加投影,形成峰谷交替的投影直方图,找到投影图的各个谷就能把字符分开。模板匹配法以字符大小的矩形作为模板,根据字符的宽度初步确定每个字符的起始位置,然后以此模板在初定位置附近滑动,找到最佳匹配位置而切分字符。区域生长法对每个需要分割的字符找一个像素作为生长起点的种子,将种子像素周围邻域中与之相同或相近性质的像素合并到种子像素所在的区域,然后将这些新像素当作新的种子继续进行上述过程,直到再没有满足条件的像素可被包含进来。基于聚类分析的方法对车牌图像从上到下逐行扫描,如属于字符类的两像素间距离小于阈值,可认为两像素为同一字符,由此而得字符像素的聚类。

3.2 字符特征提取和车牌字符识别

目前使用的车牌字符特征提取的方法可归纳为下述三种:1.基于字符统计特征。计算字符图像的多阶原点矩,多阶中心矩以及中心惯性矩,以中心矩与中心惯性矩的比值作为字符特征向量,这样提取的特征量具有平移,旋转和尺度不变性,但运算量大;也有把字符在多个方向上的投影(如水平方向,垂直方向,右斜方向,左斜方向)和二阶中心矩的比值作为特征向量。2.基于结构特征。轮廓特征,粗网格特征,层次轮廓特征以及字符特征点.这类特征提取计算量较少,但对噪声和位置变化比较敏感,需要去噪和对字符归一化。3.基于变换。对原始特征(像素点矩阵)进行傅里叶变换、K-L变换或小波变换等,提取的特征向量反映字符的结构特征和统计特征,相似字符的特征矢量距离较大,效果较好。实际应用中往往是多种特征的提取,多种特征提取方法的使用。

对车牌字符特征提取之后,就把相应的特征值输入分类器识别,目前对于车牌字符的分类识别方法归纳为下列几种。(1)模板匹配。该方法首先对待识字符进行二值化并将其缩放为字符数据库中模板大小,然后与所有的字符模板比较匹配,计算相似度,以最大相似度者为识别结果。(2)PCA子空间分类器。子空间分类器由训练样本相关矩阵的特征向量构成,单个模式的子空间建立彼此独立,相互之间没有联系,以待识别字符的特征向量与所对应的子空间距离最小作为结果。(3)基于人工神经网络。人工神经网络有抗噪声、容错、自适应、自学习能力强的特点。多隐含层的BP神经网络,BAM(Bidirectional association memories)神经网络方法,自谐振ART神经网络识别等是此方法的典范。(4)基于逻辑规则推理的识别方法。文献[18]提出基于归纳推理的字符识别,该方法在训练时自动生成识别规则。(5)基于随机场图像模拟的识别方法。该方法识别率高,并且可对灰度图像直接提取字符特征,抗干扰性强。另外使用感知器的识别,通常感知器只用于相似字符对的识别,作为其他识别方法的补充。

4 总结与展望

从已有车牌识别系统的性能分析来看,正确识别率和识别速度两者难以同时兼顾。其中原因包括目前的车牌识别技术还不够成熟,又受到摄像设备、计算机性能的影响。

现代交通飞速发展,LPR系统的应用范围不断扩宽,对车牌识别系统的性能要求将更高。对现有的算法优化或寻找识别精度高、处理速度快、应用于多种场合的算法将是研究的主要任务。

参考文献:

[1] 廖金周,宣国荣.车辆牌照的自动分割[J].微型电脑应用,1999(7):32-34.

[2] 刘智勇.车牌识别中的图像提取及分割[J].中文信息文报,2000(3):29-34.

[3] Wu Wei,Mingjun Wang.An Automatic Method of Location for Number_Plate Using Color Features IEEE 2001.

[4] 郭捷,施鹏飞.基于颜色和纹理分析的车牌定位方法[J].中国图像图形学报,2002,7(5):473-476.

[5] 章毓晋.图像工程(上)――图像处理与分析[M].清华大学出版社.

收稿日期:2008-04-10

识别技术范文第10篇

关键词: 语音识别; 识别原理; 声学建模方法; 多维模式识别系统

中图分类号: TN912.3?34 文献标识码: A 文章编号: 1004?373X(2013)13?0043?03

Summary of speech recognition technology and its application

YU Lin?lin

(Naval Aviation Military Representative Office Stationed in Beijing, Beijing 100041, China)

Abstract: As a key technology of human?computer interface in information technology, speech recognition has great research significance and broad application value. the development history of speech recognition technology is introduced, the basic knowledge of speech recognition is expounded, such as concept, basic principle, the acoustic modeling approach. The application of speech recognition technology in various fields are briefly introduced.

Keywords: speech recognition; recognition principle; acoustic modeling approach; multi?dimension pattern recognition system

0 引 言

语言是人类相互交流最常用、最有效、最重要和最方便的通信形式,语音是语言的声学表现,与机器进行语音交流是人类一直以来的梦想。随着计算机技术的飞速发展,语音识别技术也取得突破性的成就,人与机器用自然语言进行对话的梦想逐步接近实现。语音识别技术的应用范围极为广泛,不仅涉及到日常生活的方方面面,在军事领域也发挥着极其重要的作用。它是信息社会朝着智能化和自动化发展的关键技术,使人们对信息的处理和获取更加便捷,从而提高人们的工作效率。

1 语音识别技术的发展

语音识别技术起始于20世纪50年代。这一时期,语音识别的研究主要集中在对元音、辅音、数字以及孤立词的识别。

20世纪60年代,语音识别研究取得实质性进展。线性预测分析和动态规划的提出较好地解决了语音信号模型的产生和语音信号不等长两个问题,并通过语音信号的线性预测编码,有效地解决了语音信号的特征提取。

20世纪70年代,语音识别技术取得突破性进展。基于动态规划的动态时间规整(Dynamic Time Warping, DTW)技术基本成熟,特别提出了矢量量化(Vector Quantization,VQ)和隐马尔可夫模型(Hidden Markov Model,HMM)理论[1]。

20世纪80年代,语音识别任务开始从孤立词、连接词的识别转向大词汇量、非特定人、连续语音的识别,识别算法也从传统的基于标准模板匹配的方法转向基于统计模型的方法。在声学模型方面,由于HMM能够很好的描述语音时变性和平稳性,开始被广泛应用于大词汇量连续语音识别(Large Vocabulary Continous Speech Recognition, LVCSR)的声学建模[2?3];在语言模型方面,以N元文法为代表的统计语言模型开始广泛应用于语音识别系统[4]。在这一阶段,基于HMM/VQ、HMM/高斯混合模型、HMM/人工神经网络的语音建模方法开始广泛应用于LVCSR系统,语音识别技术取得新突破。

20世纪90年代以后,伴随着语音识别系统走向实用化,语音识别在细化模型的设计、参数提取和优化、系统的自适应方面取得较大进展[5]。同时,人们更多地关注话者自适应、听觉模型、快速搜索识别算法以及进一步的语言模型的研究等课题[6]。此外,语音识别技术开始与其他领域相关技术进行结合,以提高识别的准确率,便于实现语音识别技术的产品化。

2 语音识别基础

2.1 语音识别概念

语音识别是将人类的声音信号转化为文字或者指令的过程[7]。语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支。语音识别的研究涉及微机技术、人工智能、数字信号处理、模式识别、声学、语言学和认知科学等许多学科领域,是一个多学科综合性研究领域[8]。

根据在不同限制条件下的研究任务,产生了不同的研究领域。这些领域包括:根据对说话人说话方式的要求,可分为孤立字(词)、连接词和连续语音识别系统;根据对说话人的依赖程度,可分为特定人和非特定人语音识别系统;根据词汇量的大小,可分为小词汇量、中等词汇量、大词汇量以及无限词汇量语音识别系统。

2.2 语音识别基本原理

从语音识别模型的角度讲,主流的语音识别系统理论是建立在统计模式识别基础之上的。语音识别的目标是利用语音学与语言学信息,把输入的语音特征向量序列[X=x1,x2,…,xT]转化成词序列[W=w1,w2,…,wN]并输出。基于最大后验概率的语音识别模型如下式所示:

[W=argmaxW{P(W|X)}=argmaxWP(W|X)P(W)P(X)=argmaxW{P(X|W)P(W)}=argmaxW{logP(X|W)+λlogP(W)}]

上式表明,要寻找的最可能的词序列[W],应该使[P(X|W)]与[P(W)]的乘积达到最大。其中,[P(X|W)]是特征矢量序列[X]在给定[W]条件下的条件概率,由声学模型决定。[P(W)]是[W]独立于语音特征矢量的先验概率,由语言模型决定。由于将概率取对数不影响[W]的选取,第四个等式成立。[logP(X|W)]与[logP(W)]分别表示声学得分与语言得分,且分别通过声学模型与语言模型计算得到。[λ]是平衡声学模型与语言模型的权重。从语音识别系统构成的角度讲,一个完整的语音识别系统包括特征提取、声学模型、语言模型、搜索算法等模块。语音识别系统本质上是一种多维模式识别系统,对于不同的语音识别系统,人们所采用的具体识别方法及技术不同,但其基本原理都是相同的,即将采集到的语音信号送到特征提取模块处理,将所得到的语音特征参数送入模型库模块,由声音模式匹配模块根据模型库对该段语音进行识别,最后得出识别结果[9]。

语音识别系统基本原理框图如图1所示,其中:预处理模块滤除原始语音信号中的次要信息及背景噪音等,包括抗混叠滤波、预加重、模/数转换、自动增益控制等处理过程,将语音信号数字化;特征提取模块对语音的声学参数进行分析后提取出语音特征参数,形成特征矢量序列。语音识别系统常用的特征参数有短时平均幅度、短时平均能量、线性预测编码系数、短时频谱等。特征提取和选择是构建系统的关键,对识别效果极为重要。

图1 语音识别基本原理框图

由于语音信号本质上属于非平稳信号,目前对语音信号的分析是建立在短时平稳性假设之上的。在对语音信号作短时平稳假设后,通过对语音信号进行加窗,实现短时语音片段上的特征提取。这些短时片段被称为帧,以帧为单位的特征序列构成语音识别系统的输入。由于梅尔倒谱系数及感知线性预测系数能够从人耳听觉特性的角度准确刻画语音信号,已经成为目前主流的语音特征。为补偿帧间独立性假设,人们在使用梅尔倒谱系数及感知线性预测系数时,通常加上它们的一阶、二阶差分,以引入信号特征的动态特征。

声学模型是语音识别系统中最为重要的部分之一。声学建模涉及建模单元选取、模型状态聚类、模型参数估计等很多方面。在目前的LVCSR系统中,普遍采用上下文相关的模型作为基本建模单元,以刻画连续语音的协同发音现象。在考虑了语境的影响后,声学模型的数量急剧增加,LVCSR系统通常采用状态聚类的方法压缩声学参数的数量,以简化模型的训练。在训练过程中,系统对若干次训练语音进行预处理,并通过特征提取得到特征矢量序列,然后由特征建模模块建立训练语音的参考模式库。

搜索是在指定的空间当中,按照一定的优化准则,寻找最优词序列的过程。搜索的本质是问题求解,广泛应用于语音识别、机器翻译等人工智能和模式识别的各个领域。它通过利用已掌握的知识(声学知识、语音学知识、词典知识、语言模型知识等),在状态(从高层至底层依次为词、声学模型、HMM状态)空间中找到最优的状态序列。最终的词序列是对输入的语音信号在一定准则下的一个最优描述。在识别阶段,将输入语音的特征矢量参数同训练得到的参考模板库中的模式进行相似性度量比较,将相似度最高的模式所属的类别作为识别中间候选结果输出。为了提高识别的正确率,在后处理模块中对上述得到的候选识别结果继续处理,包括通过Lattice重打分融合更高元的语言模型、通过置信度度量得到识别结果的可靠程度等。最终通过增加约束,得到更可靠的识别结果。

2.3 声学建模方法

常用的声学建模方法包含以下三种:基于模式匹配的动态时间规整法(DTW);隐马尔可夫模型法(HMM);基于人工神经网络识别法(ANN)等。

DTW 是较早的一种模式匹配的方法。它基于动态规划的思想,解决孤立词语音识别中的语音信号特征参数序列比较时长度不一的模板匹配问题。在实际应用中,DTW通过计算已预处理和分帧的语音信号与参考模板之间的相似度,再按照某种距离测度计算出模板间的相似度并选择最佳路径。

HMM是对语音信号的时间序列结构所建立的统计模型,是在马尔可夫链的基础上发展起来的,它是一种基于参数模型的统计识别方法。HMM可模仿人的言语过程,可视作一个双重随机过程:一个是用具有有限状态数的马尔可夫链来模拟语音信号统计特性变化的隐含的随机过程,另一个是与马尔可夫链的每一个状态相关联的观测序列的随机过程[10]。

ANN以数学模型模拟神经元活动,将人工神经网络中大量神经元并行分布运算的原理、高效的学习算法以及对人的认知系统的模仿能力充分运用到语音识别领域,并结合神经网络和隐含马尔可夫模型的识别算法,克服了ANN在描述语音信号时间动态特性方面的缺点,进一步提高了语音识别的鲁棒性和准确率。其中成功的方法就是在混合模型中用ANN替代高斯混合模型估计音素或状态的后验概率。2011年,微软以深度神经网络替代多层感知机形成的混合模型系统大大提高了语音识别的准确率。

3 语音识别的应用

语音识别技术有着非常广泛的应用领域和市场前景。在语音输入控制系统中,它使得人们可以甩掉键盘,通过识别语音中的要求、请求、命令或询问来作出正确的响应,这样既可以克服人工键盘输入速度慢,极易出差错的缺点,又有利于缩短系统的反应时间,使人机交流变得简便易行,比如用于声控语音拨号系统、声控智能玩具、智能家电等领域。在智能对话查询系统中,人们通过语音命令,可以方便地从远端的数据库系统中查询与提取有关信息,享受自然、友好的数据库检索服务,例如信息网络查询、医疗服务、银行服务等。语音识别技术还可以应用于自动口语翻译,即通过将口语识别技术、机器翻译技术、语音合成技术等相结合,可将一种语言的语音输入翻译为另一种语言的语音输出,实现跨语言交流[11]。

语音识别技术在军事斗争领域里也有着极为重要的应用价值和极其广阔的应用空间。一些语音识别技术就是着眼于军事活动而研发,并在军事领域首先应用、首获成效的,军事应用对语音识别系统的识别精度、响应时间、恶劣环境下的顽健性都提出了更高的要求。目前,语音识别技术已在军事指挥和控制自动化方面得以应用。比如,将语音识别技术应用于航空飞行控制,可快速提高作战效率和减轻飞行员的工作负担,飞行员利用语音输入来代替传统的手动操作和控制各种开关和设备,以及重新改编或排列显示器上的显示信息等,可使飞行员把时间和精力集中于对攻击目标的判断和完成其他操作上来,以便更快获得信息来发挥战术优势。

4 结 语

语音识别的研究工作对于信息化社会的发展,人们生活水平的提高等方面有着深远的意义。随着计算机信息技术的不断发展,语音识别技术将取得更多重大突破,语音识别系统的研究将会更加深入,有着更加广阔的发展空间。

参考文献

[1] 马志欣,王宏,李鑫.语音识别技术综述[J].昌吉学院学报,2006(3):93?97.

[2] RABINER L R, JUANG B H. An introduction to hidden Markov models [J]. IEEE ASSP Magazine, 1986, 3(1): 4?16.

[3] GALES M, YOUNG S. The application of hidden Markov models in speech recognition [J]. Foundations and Trends in Signal Processing, 2008, 1(3): 195?304.

[4] JELINEK F. Continuous speech recognition by statistical methods [J]. Proceedings of the IEEE, 1976, 64(4): 532?556.

[5] 倪崇嘉,刘文举,徐波.汉语大词汇量连续语音识别系统研究进展[J].中文信息学报,2009,23(1):112?123.

[6] 顾亚强.非特定人语音识别关键技术研究[D].长沙:国防科学技术大学,2009.

[7] 中华人民共和国国家质量监督检验检疫总局.GB/T21023?2007 中文语音识别系统通用技术规范[S].北京:中国标准出版社,2007.

[8] 王文慧.基于ARM的嵌入式语音识别系统研究[D].天津:天津大学,2008.

[9] 何湘智.语音识别的研究与发展[J].计算机与现代化,2002(3):3?6.

[10] 吕云芳.基于模板匹配法的语音识别系统研究与基本实现[D].天津:河北工业大学,2005.

上一篇:审计公告制度范文 下一篇:师资培育论文范文