模式识别技术范文

时间:2023-03-08 22:17:23

模式识别技术

模式识别技术范文第1篇

关键词:模式识别卷积神经网络 google earth 应用

中图分类号:TP39 文献标识码:A 文章编号:1007—3973(2012)009—087—02

随着科技的进步,许多发明、电子产品使人们的生活更加方便。生活经常见到的有:笔记本电脑的指纹锁、数码相机的人像识别功能、电脑手写板、语音录入设备、门禁中的虹膜识别技术等等,这些设备与技术中都包含了模式识别技术。这些看似抽象的技术与算法正与其他技术一起悄然的改变人们的生活。

1 什么是模式识别

人们的许多感官功能看似简单,但用人工的办法实现却比较困难。人与人见面相互打招呼。在看见对方的面部后,人能够很快的认定这张脸是个人脸,而且我认识他,应该和他打招呼。这个看似简单的过程其实并不简单,我们不仅仅要识别五官,还要扫描轮廓,而且还要判断是否认识等等。可见,很多看似简单的认知过程,如果试图用某一方法描述确实不宜。对人脸进行模式识别就可以解决这个看似简单的问题。

模式识别(Pattern Recognition)是指通过用计算机对事物或现象的各种形式的(光信息,声信息,生物信息)信息进行处理和和判读,以对事物或现象进行描述、辨认、分类和解释的过程,是人工智能的和信息捕获的重要组成部分。现在被广泛应用于计算机视觉,自然语言处理,生物特征识别,互联网搜索等领域。

2 模式识别与google earth卫星照片

在卫星图片中识别特定的目标,如道路,湖泊,森林等等,往往要运用模式识别技术,现在较为主流的是神经网络识别。上一代的技术室根据RGB提取的,在提取森林或湖泊的时候,有很多干扰颜色,对卫星照片精度有很高要求。根据RGB提取效果不是十分理想,而且计算量大,对硬件有一定要求。

随着神经网络识别技术的发展,现在计算机可自动识别目标。不必使用特殊的卫星波段影像,小型机计算,只要从GOOGLE EARTH获取的普通卫星影像就可以自动识别了。

Google Earth是Google公司开发推出的一款虚拟地球仪软件,它把卫星照片、航空照相布置在一个地球的三维模型上,是一款全球地图集成软件。Google Earth与模式识别技术的综合运用,使其卫星图片在道路规划,通信线路管理,土地勘察,遥感探测等等行业有着很大的运用。

在实际情况下对卫星图片进行模式识别,实现起来有许多困难,光线条件、大地背景、大气云层情况影响以及由于拍摄角度或空气密度等原因导致照片的被照物体的几何变形等都会对识别效果有直接影响。这些都对识别算法要求很高。本文选用的神经网络识别方法,具有识别率高、对不规则物体识别效果好等优点,被广泛运用在许多领域。本文使用改进的卷积神经网络对google earth 卫星图片进行处理,几乎不用对照片进行预处理。这大大节省了运算时间,而且避免了二次处理后对原始文件的污染,大量原始信号被最大程度地保留。

3 模式识别与卷积神经网络

卷积神经网络CNN(Convolutional Neural Networks)是近年发展起来并引起广泛重视的一种高效识别方法。神经网络是受动物神经系统启发,利用大量简单处理单元互联而构成的复杂系统,以解决复杂模式识别与行为控制问题。目前,CNN已经成为国内外科学家研究的重点方向,特别是在模式识别领域。它的优点是不需要对图像进行复杂的预处理,成为大家广为使用的方法。CNN的基本结构一般包括两层:(1)特征提取层。每个神经元的输入与前一层的局部接受域相连,并提取该局部的特征。一旦该局部特征被提取后,与其他特征间的位置关系也随之确定下来。(2)特征映射层。网络的每个计算层由多个特征映射组成,每个特征映射是一个平面,平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数,使得特征映射具有位移不变性。

4 卷积神经网络在卫星图片识别中的应用

为提高google earth卫星照片中目标的识别率,创造性使用卷积神经网络进行模式识别,其主要部分基本设计结构如图1所示。

图1中,整个结构模仿动物的神经结构,大量的单一识别单元被关联成一个网路。 C层则是由复杂(complex)神经元组成的神经层,它的输入连接是固定的,不可修改,显示接收信心被激励位置的近似变化。网络中C层的最后一层为识别层,显示模式识别的结果。S层为简单(simple)神经元组成的神经层,完成主要信息提取,其输入连接是不是固定的,可在训练的过程中不断修改。这个系统进过不断的训练,输入照片的格式和大小会自动地被识别,大大节省了前期的工作时间,提高了识别速度。

在训练集中同时需要常规积极样本和消极样本,样本包括卫星图片中房屋和道路的1000个图像目标积极训练集。大多数基于学习方法的目标物体识别使用一个大约为10?0的最小输入窗口,好处是可以做到不遗漏任何重要信息。为了达到稳定的效果,对所有原有的训练样进行色彩转换和对比还原转换,得到的积极样本训练集有2400个目标样本。

5 实验结果

分两个步骤进行试验,第一步对卫星图片进行定位和裁剪等预处理,第二步选取合格卫星图片200个样本图片训练卷积神经网络,训练后得到各层3个主要数据:阈值、权值及神经元细胞平面数,然后使用优化后的神经网络识别机对200个测试样本进行检查,其正确的识别率达到97%。实验要注意训练的时间,系统过度训练后,识别率会不断提高,但训练时间的不断增加,测试失败率到最小值后出现及其微细震荡,造成识别率的小幅波动。(见图2)

实验表明,卷积神经网络应用于卫星图片目标识别是完全可行的,训练样本越丰富则则识别率越高。与传统模式识别方法相比有更高的识别率和抗干扰性。本文采用一种改进的基于卷积神经网络的识别机制对卫星照片中的目标物体进行识别。该识别方法通过对目标物体图片的学习,优化了系统中的关键参数的权值。大大提高了目标物体的识别率。

参考文献:

[1] 高隽.智能信息处理方法导论[M].北京:机械工业出版社,2004.

[2] 高隽.人工神经网络原理及仿真实例[M].北京:机械工业出版社,2003.

[3] 边肇祺.模式识别[M].北京:清华大学出版社,1987.

[4] NEUBAUER C.Evaluation of convolutional neural networks for visual recognition[J].Neural Netwoks,1998,9(4):685—696.

模式识别技术范文第2篇

关键词:模式识别技术;刑事科学技术;生物识别

存在于时间和空间中可观察的事物,如果可以区别它们是否相同或相似,都可以称之为模式(pattern)。而针对现代信息科技的狭义领域内,模式可以说是为了能让计算机执行和完成分类识别任务,通过对具体的个别事物进行观测所得到的具有时间和空间分布的信息。从这些大量的信息及数据出发,模式识别(Pattern Recognition)便是用计算机实现人对各种事物或现象的分析,描述,判断,识别的过程。模式识别技术的发展是从1929年G. Tauschek发明数字阅读机开始的,直到20世纪70年代,一些发达国家开始将模式识别应用到刑事侦查部门。随着科技的不断进步,模式识别在刑事科学技术方面的应用越来越广泛,发挥的作用也越来越大,从某种意义上说模式识别促进了侦查和刑事技术手段的发展。

一、模式识别系统

模式识别是解决如何利用计算机对样本进行模式识别,并对这些样本进行分类。执行模式识别的计算机系统被称为模式识别系统。一个完整的模式识别系统,由数据获取、预处理、特征提取、分类决策和分类器设计5部分组成。可以分为上下两部分:上半部分完成未知类别模式的分类;下半部分完成分类器的设计训练过程。

1.数据获取及预处理

数据获取是通过传感器,将光或声音等信息转化为计算机能够识别的电信息的过程。为了更准确有效的读取信息,对由于信息获取装置或其他因素所造成的信息退化现象进行复原、去噪,从而加强信息的利用率,这个过程就是预处理。

2.特征提取

由于数据获取部分所获得的原始信息数据量相当庞大,为了将这种维数较高的模式空间转换为维数较低的特征空间,从而实现分类识别,得到最能反映分类本质特征的向量,这个对特征进行抽取和选择的过程即为特征提取。

3.分类器设计和分类决策

分类器设计的主要功能是通过训练来确定判决规则,它属于训练过程的一部分,其主要目的就是针对训练样本来按其判决的规则进行分类,以建立错误率最低的标准库。分类决策便是以分类器设计所建立的标准库为标准对特征空间的待识别对象进行分类,这样不仅能够使错误识别率降到最低,还能极大的提高数据利用率,最大程度的减少客观的信息损失。

二、模式识别在刑事科学技术中的应用

近几年,作为新生现代科技手段,模式识别技术被广泛应用于生活中的各个领域,如:字符识别、医疗诊断、遥感控图、环境监测、语音识别和产品检测等。模式识别技术极大的提高了人们的工作和生活质量,不断推动着社会的发展。在刑事科学技术方面,模式识别已经处于举足轻重的地位,特别是在指纹识别、人脸识别、虹膜识别等生物识别技术方面极大的提高了刑事侦查水平,为寻找犯罪证据和破获案件提供了强有力的技术手段支持,促进了刑事科学技术现代化建设。

1.指纹识别

由于指纹具有唯一性、方便性和终身不变性,我国早在两千年前就曾使用指纹来破案。替代了传统的人工识别指纹的方法,指纹识别技术已成为目前刑事侦查部门进行认定识别工作的主流技术,同时也是证据鉴定和侦查破案的有力保障。

如在20年前漳州商业大厦电梯杀人一案中,现场的线索少之又少,唯一有价值的线索是民警通过仔细勘查所提取到的一枚残缺指纹。在当时指纹识别技术还未完全成熟的年代,仅仅通过这枚残缺指纹找到凶手是相当困难的。然而,随着指纹识别技术的成熟,这件在当时看来无法破解的谜案,却在2011年全国公安系统的“清网行动”中发现08年嫌疑人于上海斗殴的指纹与95年杀人案的残缺指纹认定同一。20年前的谜案被轻松告破,嫌疑人蔡某伟终被缉拿归案。

指纹识别系统是一个典型的模式识别系统,其主要分为指纹数据获取、指纹区域分割、指纹图像预处理、特征提取和匹配五个过程。凭借着可靠性强、速度快、操作简便等优点,指纹识别技术将继续作为刑事科学技术里进行生物识别的主要技术手段不断成熟发展。但是,小几率的错误识别和模糊难成像等问题仍是指纹识别技术进行改进需要考虑的首要问题。

2.人脸识别

人脸识别是目前模式识别领域中被广泛研究的热门课题,相比传统的身份识别方式,人脸识别凭借着其身具有的安全性、保密性和方便性等优势,在近几年来得到了飞速发展并广泛应用于社会中的安全和经济领域。目前,人脸识别技术已经成为刑事科学技术工作中较为成熟的鉴定技术之一,在刑事侦查实际工作中,人脸识别技术落实到身份认证、视频监控、视频资料分析等具体工作上,使得在进行布控排查、人像识别、犯罪嫌疑人认定以及门禁等方面都得到了良好的应用效果。

如在09年的郑州市特大抢劫杀人案中,人脸识别技术就发挥了高效的作用:2009年3月17日下午,郑州市金水区紫荆山路繁华路段发生一起特大入室抢劫杀人案,由于现场线索较少,案件的侦破一度陷入僵局。唯一的一段有价值的监控录像,是嫌疑人闪过的一个侧面照,而且很模糊。通过清大维森人脸识别比对系统小图像重建功能,对模糊的犯罪嫌疑人影像,进行了还原重建,最终锁定了大同籍男子次全为重点嫌疑对象。2012年12月29日,专案组民警在大同市将次全抓获,案件成功告破。此外,在近几年的南京“2.8” 贩毒团伙案、武汉“4.15”特大入室盗窃案等重要案件中,人脸识别相关技术都实现了快速认定犯罪嫌疑人身份的工作,是案件迅速告破。

模式识别技术范文第3篇

关键词:模式识别;语音识别;交互式语音应答;司法社区矫正

中图分类号:TP391.41 文献标识码:A

Abstract:Systematic research was done on the specific algorithm for speech recognition in using genetic algorithm to train continuous hidden Markov mode. Then the detailed design of Voiceprint Recognition System of Community Correction Objects in the Shenzhen City Bureau of Justice has been done based on the speech recognition technology. The system running results show that the recognition rate of recognition algorithm using genetic algorithm to train continuous hidden Markov model is faster and has a higher rate of recognition. Construction of voiceprint recognition system of judicial community correction objects based on pattern recognition is still in the junior stage in our judicial system, and promotion and the construction of voiceprint recognition system of judicial community correction objects have the important practical significance.

Key words:pattern recognition;speech recognition;interactive voice response;judicial community correction

1 利用基因算法训练连续隐马尔柯夫模型的语音识别以及具体算法

作为模式识别重要应用之一的语音识别技术所涉及的领域包括信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。近年来,在生物识别技术领域中,声纹识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安全验证方式。

隐马尔柯夫模型(Hidden Markov Model,HMM)方法是二十世纪70年代引入语音识别理论的,它的出现使得自然语音识别系统取得了实质性的突破,现已成为语音识别的主流技术[1-4] ,该方法在语音识别时识别速度较快,也有较高的识别率。目前大多数大词汇量、连续语音的非特定人语音识别系统都是基于HMM模型的。HMM是对语音信号的时间序列结构建立统计模型,将之看作一个数学上的双重随机过程:一个是用具有有限状态数的Markov链来模拟语音信号统计特性变化的隐含的随机过程,另一个是与Markov链的每一个状态相关联的观测序列的随机过程。前者通过后者表现出来,但前者的具体参数是不可测的。人的言语过程实际上就是一个双重随机过程,语音信号本身是一个可观测的时变序列,是由大脑根据语法知识和言语需要(不可观测的状态)发出的音素的参数流。可见HMM合理地模仿了这一过程,很好地描述了语音信号的整体非平稳性和局部平稳性,是较为理想的一种语音模型。

在HMM(隐马尔柯夫模型)中,分为离散HMM(DHMM)和连续HMM(CHMM)。由于CHMM直接以帧语音特征向量本身为观测序列,而不是像DHMM那样先将语音特征向量经矢量量化为观测符号,因此CHMM有优于DHMM的识别精度。然而,由于CHMM参数多,传统的训练方法采用迭代法,先假设初始值,用语音信号的观测序列对该初始值进行训练,也即按照一定的方法对这些估值进行提纯,对提纯了的估值要接着进一步的提纯,直到再没有改进的余地,达到某个局部最佳值为止。传统的训练方法不保证训练得到全域最优解,而且训练所需要的时间非常巨大。

本文侧重地研究了基因算法[5],并按照CHMM的特点构造染色体,用基因算法对CHMM进行训练。基因算法自身的特点使得训练结果趋向于全域最优解。同时,由于只需要用Viterbi算法计算语音的观测序列对某一CHMM模型的相关概率,用作基因算法的适应函数,故该算法可以提高CHMM的训练速度。

基因是生物学概念,之所以将基因算法引入HMM的训练中,是因为HMM的训练过程实际上是一个在特定范围内将HMM模型进行一次次的迭代提纯,选择最优模型的过程。将基因算法引入CHMM的训练,就是基于将CHMM看作在特定域的有约束的寻找最佳匹配点的问题。CHMM的状态转移矩阵A和输出概率密度函数中的混合系数c矩阵的每一行向量之和为1.0,可看作是优化问题的约束条件。如果在选取CHMM的初始值时,不是选取一个初始值,而是选取一组分布于不同区域的初始值,以某一种特定的训练方法,使其趋向于全域最优解,那么最终也同样可以完成对CHMM的训练。

根据待优化问题的数学模型,定义适合函数F(ai)。其中ai是某一条染色体,则适合函数F(ai)就是该染色体与目标函数的距离,或是判断该染色体优劣的依据。对每一代基因,计算所有染色体的适合函数,进行排序选择一定数目较优秀的染色体,作为生成下一代基因的父代样本。自然界中染色体成对出现,时一对染色体分离、重组。多点交叉在实现时,可以设定交叉概率门限为ρc。染色体的长度为L,对于随机数0≤rj≤1 (j=1,2,…,L),如果rj≥ρc,那么下一个变量属于另一条基因,否则下一个变量与前一个变量属于同一条基因。

最佳基因是在一代一代的基因重组和基因突变中形成的,是在选择的作用下最适应的个体。基因突变有利于从局部最佳处跳出,防止算法的过早收敛。设定突变概率门限为ρm,对于随机数0≤rj≤1 (j=1,2,…,L),如果rj≤ρm,那么染色体中第j个变量有突变现象发生;否则,复制原染色体的第j个变量。

基因算法的具体实现步骤参考文献[5]。

HMM是用一个有限状态系统作为语音特征参数的生成模型,每个状态能产生连续的输出特征。HMM实际上是一个特征参数发生器,依据其产生的参数与观察到的语音参数的比较,从而识别语音。在识别时的判决依据是HMM模型的生成概率。

在将基因算法引入CHMM训练的过程中,首先要解决的是染色体的构造问题。将CHMM模型的所有关键特征参数排列成一串,构成染色体。对于语音识别,采用自左向右的HMM模型,本文中为5状态自左向右只含一阶跳转的CHMM模型。CHMM模型中参数由初始状态向量π,状态转移矩阵A和每个状态的输出概率密度函数组成。

在CHMM模型中,染色体前一部分的行向量之和均为1。也就要求在产生染色体时,需对其进行一定的控制。在生成每一代染色体时,对这一部分行向量所对应的每一段染色体进行归一化,则可以满足CHMM的约束条件。

Viterbi算法在通常的CHMM语音识别中是作为识别算法的,换句话说,使观测序列与CHMM模型经Viterbi算法的运算结果最大即为优化目标。基于这样的思想,基因算法的适合函数为:所有该CHMM对应的观测序列用Viterbi算法求其观测概率之和,运算结果越大,则该染色体越优秀。

在实验中染色体的前一部分依概率进行二点或多点交叉,而后一部分染色体只进行多点交叉,多点交叉概率ρc=0.8。染色体前一段的基因突变概率ρm=0.1;而对于染色体的后一部分,取ρm1=0.01,对应于以一个参数为单位发生基因突变;ρm2=0.08,以行向量为单位发生基因突变。经基因交叉或基因突变后,对染色体的前一部分需要进行各行向量的归一化处理。每一代基因的数目为300,从中选出60条优秀的染色体作为新的父代基因,经基因重组和基因突变生成240条染色体,共同组成新一代染色体。CHMM模型的训练问题现已转化为求其对观测序列适应概率最大值的问题,用基因算法求解。

训练数据取自博域通讯一体化呼叫中心平台产品BYICC2.0的IVR服务器在实际商业运行中产生的WAV录音文件2000个。

2 利用基因算法训练连续隐马尔柯夫模型的语音识别技术在深圳市司法局社区矫正声纹识别系统中的应用介绍

2.1 司法社区矫正的需求背景以及存在问题

司法社区矫正,是指将社区矫正对象置于社区内,由专门的国家机关负责并组织社会力量对其采取监督管理、教育、帮助措施,矫正其犯罪心理和行为恶习,促进其顺利回归社会的非监禁刑罚执行活动。尽管目前我国社区矫正工作中较普遍地应用了信息化管理手段,根据社区矫正的刑罚执行性质和非监禁特征,各地积极探索运用手机定位等现代科技手段加强对社区矫正人员的实时监管,具体的监管手段包含:手机实时定位监控、电子地图越界告警、人机分离抽查等。现阶段,很多司法社区矫正工作中应用到了诸如手机实时定位监控等高科技手段来实现对社区矫正人员的监控,但在具体操作中仍然存在一些问题和障碍,主要在现有手机定位监控的技术下,难以有效控制人为出现的“人机分离”现象。现有“人机分离”抽查手段主要有:电话抽查、短信抽查、拍照抽查等。虽然一定程度上降低了矫正对象“人机分离”的风险,但这些抽查手段皆无法确保是否为矫正对象本人,有脱管、漏管的可能性。

正是基于以上原因,博域通讯推出的社区矫正声纹识别系统的主要功能是通过远程电话录音来对社区矫正人员进行身份认证,结合手机定位监控系统,促进社区矫正工作向合理化、人性化、智能化、效率化方向发展,推动社区矫正信息化建设,并有效破解移动定位监管“人机分离”的难题。

2.2 深圳市司法局社区矫正声纹识别系统设计

2.2.1 系统应用体系架构

社区矫正声纹识别方案中,包括声纹识别系统、IVR自动语音服务系统并结合现有的手机定位系统以及后台管理系统,同时,声纹识别服务也涉及到了数据库服务器之间的数据通信。

2.2.2 系统网络架构

被矫正人员通过拨打固定电话号码接入社区矫正声纹识别系统,由内置电话语音板卡的IVR服务器将采集到的客户语音,并通过调用声纹服务器提供的接口函数与声纹识别服务器进行交互。声纹服务器将识别的结果反馈给IVR服务器以便进行相应的IVR语音流程控制,同时,社区矫正声纹识别系统将被矫正人员的声纹身份识别结果反馈给手机定位系统。其网络拓扑结构图如图3所示。

2.2.3 系统业务流程

深圳市司法局社区矫正声纹识别系统与现有手机定位系统结合后的主要业务流程如下图:

2.2.4 系统运行结果主要指标

利用基因算法训练连续隐马尔柯夫模型的语音识别的司法社区矫正声纹识别系统已于2014年1月在深圳市司法局上线投入运行。

声纹识别技术在实际应用中,会根据说话人识别内容的不同分为文本相关验证和文本无关验证。深圳市司法局社区矫正声纹识别系统,支持这两种方式的验证,根据实际工作和业务的需要,用户可以选择适合自己的声纹验证方式。

同时,与手机实时定位监控、电子地图越界告警、电话抽查、短信抽查等传统监管手段相比较,语音识别技术有效地控制了司法社区矫正中人为出现的“人机分离”现象。

3 结束语

模式识别从20世纪20年展至今,人们的一种普遍看法是不存在对所有模式识别问题都适用的单一模型和解决识别问题的单一技术,我们现在拥有的只是一个工具袋,所要做的是结合具体问题把统计的和句法的识别结合起来,把统计模式识别或句法模式识别与人工智能中的启发式搜索结合起来,把统计模式识别或句法模式识别与支持向量机的机器学习结合起来,把人工神经元网络与各种已有技术以及人工智能中的专家系统、不确定推理方法结合起来,深入掌握各种工具的效能和应有的可能性,互相取长补短,开创模式识别应用的新局面。基于模式识别技术的司法社区矫正声纹识别系统能够有效地破解移动定位监管“人机分离”的难题,其建设工作在我国司法系统目前尚处于起步阶段,推广和建设司法社区矫正声纹识别系统具有重要的现实意义。

参考文献

[1] 刘伯高.化工过程推断估计的若干问题研究[D].华东理工大学博士论文.华东理工大学图书馆,2000.

[2] 王岚,陈晶,王睿,等.几种模式识别方法在生物信息中的应用[J]. 计算机与应用化学,2007,(1):8-12.

[3] 杨海峰,张德祥.模式识别理论和技术在语音识别研究中的应用[J].合肥学院学报:自然科学版, 2009,(1):40-46.

[4] LEE K F,HON H W. Speekerindependent phone recognition using hidden markov models[J].IEEE Trans on ASSP,1990,37(11):1641-1648.

模式识别技术范文第4篇

[关键词] 模式识别 风险分类 适用性

一、引言

贷款风险分类,就是根据借款人的当前经营情况和违约迹象来判断其按时还款的可能性并给予风险等级评价,是银行综合了借款人财务、非财务因素,对贷款未来安全收回可能性的评价。如何判断借款人的每个因素对贷款偿还的影响程度,以及如何将上述各种因素定性和定量分析归纳汇总,作出全面科学的风险评定是贷款风险分类操作的难点和关键。

在现代信用风险度量模型出现以前,测度信贷信用风险的方法主要有:专家制度法、评级法和信用评分法。近年来,一些大的金融机构相继构建了比较规范的、有重大影响的四大信用风险度量模型:JP 摩根的Credit Metrics 方法;KMV公司的KMV 模型;CSFP(Credit Suisse Financial Products) 的Credit Risk + 方法;麦肯锡公司的信用组合观点模型(Credit portfolio View)。这四大信用风险度量模型对中国银行业都有一定的借鉴意义。模型最大的问题是任何一个模型都没有全面考虑到借款人的道德风险,还有借款人的具体情况,如银行合同、贷款合同、担保能力、借款期限等,而且由于经济制度、金融发展水平等方面的差异,因此,借用西方信用风险模型应慎重,我国应用这些大型量化模型的条件还不成熟。

本文把贷款风险分类看作是一个模式识别问题,在此框架下,就统计模式识别领域中最新使用的神经网络方法、分类树法、以及支持向量机三种方法的建模思想、适用性进行比较,并给出有关结论。

二、贷款风险分类是一个模式识别问题

所谓模式识别,就是用计算机的方法来实现人对各种事物或现象的分析、描述、判断和识别。目前我国实行的贷款风险五级分类法(简称风险分类),它是根据贷款对象的第一还款来源与第二还款来源共同特征(财务指标)或属性(非财务指标)进行识别判断而进行分类的,其核心在于它以借款人的偿还能力作为分类标志。

贷款风险分类的模式识别系统的精度及其正确性,主要取决于(1.3)式中的一些参数的估计的精度。训练时如果输入模式样本的类别信息是已知的,这时可以用“有监督”的模式识别技术,让识别系统执行一个合适的学习训练过程,把系统“教”成可使用各种适应修改技术再去识别模式。如果采集到样本模式是未知类别的,这时可用“无监督的模式识别技术,即必须通过系统的学习过程去得到其所属的范畴。

三、模式识别技术的建模思路及其适用性分析

目前用于统计模式识别的方法很多,主要有判别分析法、回归分析法、人工智能(专家系统)、神经网络、决策树法、K近邻法、支持向量机等。本文仅就目前最为流行的人工神经网络、决策树法、支持向量机三种非参数模式识别方法建模思路、适用性进行比较分析。

1.神经网络模型(ANN)

(1)建模思路

人工神经网络(Artficial Neural Networks ANN )是一种具有模式识别能力,自组织、自适应,自学习特点的计算方法。神经网络模型建模思路是,首先找出影响分类的一组因素,作为ANN的输入,然后通过有导师或无导师的训练拟合形成ANN风险分析模型。对于新的样本输入(即一组影响因素值),该模型可产生贷款风险的判别。

(2)适用性分析

神经网络的适用性首先表现为分类的准确性比较高。特别是在测试数据为非线性关系的情况下,尤其如此;其次是神经网络有较强的适应训练样本变化的能力,当训练样本增加新的数据时,能够记忆原有的知识,根据新增的数据作恰当的调整,使之表示的映射关系能够更好的刻画新样本所含的信息。这一点不仅使得神经网络具有较强的适应样本变化的能力,还使它具有动态刻画映射关系能力,也克服了线性判别分析方法的静态特点;再次是其具有鲁棒性。神经网络对于样本的分布、协方差等没有要求,对样本中存在的噪音数据、偏差数据不敏感。监管部门在面对众多监管对象银行时, 可以根据其报表中的监管指标与监控指标的输出结果,迅速、准确地判断商业银行的经营状况,就可以辅助以现场检查的手段,对商业银行进行适当、适时的干预。

神经网络方法的主要缺点一是对样本的依赖性过强,对样本提出了很高的要求。因为它很少有人的主观判断因素的介入;二是解释功能差。它仅能给出一个判断结果,而不能告诉你为什么;三是在神经网络方法中输入特征变量的确定出关键指标问题时,需要依赖于其他的统计分析方法;四是是样本分成多少个种类,这些问题都是神经网络方法无法独自解决的,要依赖于其他方法;五是神经网络的训练速度慢且极易收敛于局部极小点,推广能力差,以及容易出现“过学习”现象。

2.分类树方法(CART)

(1)建模思路

分类树方法(CART)是一种由计算机实现,基于统计理论的非参数识别方法。其建模思路是:在整体样本数据的基础上,生成一个多层次、多节点的树,按广度优先建立直到每个叶节点包含相同的类为止,以充分反映数据间的联系。然后对其进行删减,参照一定规则从中进行选择适当大小的树,用于对新数据进行分类即建造最大树,对树删减,选择适当的树用于新样本分类。

(2)适用性分析

分类树方法在银行贷款风险分类中的适用性首先在于通过借款人经营状况的变化及其破产的可能性的判断,来估计其违约的可能性,进而来推测该借款人持有的贷款风险程度。它不但具有哲学上的二分法的优点,而且其分类标准的选择也包含着经济理论上的合理性。反映申请者信用关系中各项指标之间的相关性是应用分类树于信贷信用分类的有利条件,它可以有效地利用定性变量进行分类。

分类树的缺陷表现在:一是计算量大;二是在一些连续型定量变量的处理上,分类树就显得有些力不从心;三是对结点属性的判定上,往往以叶结点中所含多数样本的属性来决定该叶结点的属性。但如果碰到训练样本中某种样本(譬如好样本,占大多数)。此时分类的结果很可能是几乎每个叶结点都是好样本占多数,或出现一些好坏样本的个数相当的叶结点。于是就可能出现几乎所有的叶结点都是好样本集合,或其中一些结点无法判断。无论哪种情况出现,都将导致对坏样本的辨别率降低,进而导致分类树的效率降低。

3.支持向量机模型(SVM)

(1)建模思路

(2)适用性分析

由于支持向量机出色的学习性能、泛化性能、良好表现和所估计的参数少等特点,能够较好地解决小样本、高维数、非线性、局部极小等问题。鉴于支持向量机的诸多优点,国外学者 Van.Gestel(2003)将支持向量机应用到信贷风险分类与评估领域,并与神经网络及Logistic回归相比较,得到了较好的结果。同时利用支持向量机,能提高学习机的泛化能力,能成功地解决风险分类、函数逼近和时间序列预测等方面,对构建贷款分类模型也具有重要的实践意义。

但SVM是解决一个二分类问题,现实中遇到的大都是多分类问题,如支持向量机无法解决信贷风险的五级分类问题。另外,影响支持向量机模型分类能力的参数选择存在人为确定的主观性等。

四、结论

从信贷风险管理角度看,信贷风险分类与量化管理是一个必然趋势。为了提高贷款分类的准确性,必须将上述两种或两种以上的方法结合起来使用,取长补短。同时,中国银行业在运用这些相对复杂的预测技术时,不仅要根据国内的实际情况和银行业自身发展阶段,科学地制定信贷风险管理流程,还要加强人才培养和数据库建设,尽可能地运用信贷风险管理先进技术将信贷风险损失降到最低限度,实现可持续发展。

参考文献:

[1]J.P. Morgan.Credit Metrics―Technical Document.1997, 4:2

[2]KMV.Global Correlation Factor Structure. San Francisco:KMV Corporation.1996,8 :16~17

[3]Credit Suisse First Boston. Credit Risk+, A Credit Risk management Framework. Credit Suisse First Boston Internation, 1997

[4]McKinsey and Co, Credit Portfolio View. New York, Mckinsey and Co.1997

[5]曹道胜等:商业银行信用风险模型的比较及其应用[J].金融研究,2006年第10期

[6]王振民,中国商业银行贷款风险分析[D].天津大学博士论文,2005年5月,P33

[7]Mark T.Leung,Hazem Daouk,An-Sing Chen.Forecasting stock indices: a comparison of classification and level estimation models, International Journal of Forecasting,2000(16)

模式识别技术范文第5篇

背景

红外光谱法(FTIR)指的是用红外光照射植物叶片后,红外光谱的某波长区域会被此叶片成分内的分子所吸收。被吸收的红外光波长和被吸收的程度(称为吸收度或者透过率)根据成分的不同而有所差异,基于这样的规律,可以定性分析植物叶片内物质的官能团并获取化学结构信息。进一步根据Lambert-Beer定律公式可以得出吸光度A与浓度成一定比例,从而使用红外光谱法进行定量分析。衰减全反射法简称为ATR,利用光波入射时,入射面内偏振的单色平面光波在密-疏媒质的界上全反射时,表面共振激发后光强发生显著衰减的原理,是红外光谱常用的一种采样方式,采样时用到一种高折射率的晶体,该晶体是一种无损非接触的快速红外检测技术。ATR-FTIR方法利用红外光的透入深度与入射光的波长、样品和晶体之间折射率的关系来获得待测叶片内物质含量的光谱特性。模式识别(Soft Independent Modeling of ClassAnalogy,SCMIA)是一种基于类模型带监督的模式识别方法,其利用同一类叶片样本具有相似的特征,在一定的空间内,属于同一类的样本就会聚集在一定的空间区域内,不同的样本就会在空间内显著的分开并具有明显的边界[1]。因此可利用因子分析法针对随机选择的80%样本建立训练集中每一种杂草的样本,从而建立聚类分析模型,然后利用剩余的20%样本计算这些样本到模型的SCMIA距离,判别该样本属于哪一种杂草。

材料和方法

首先采集不同s草活体叶片的ATR谱图,通过分析不同杂草叶片红外谱图中的脂类特征吸收峰和多糖类成分吸收峰,利用不同叶片里含有多糖成分的不同来区别。作为补充手段可以采用杂草叶片含水量显著差异的区别利用水特征吸收峰来进行甄别。然后处理光谱数据,预先对原始光谱数据进行多元散射校正(MSC)和平滑处理,消除其采样的误差[2],最后利用前几个主成分建立识别分类图。为了使得识别的光谱数据计算量图能显著减小,通过主成分载荷图曲线筛选几组特征光谱作为变量进行聚类识别,这样提高运算速度后可以使得变量作业机械系统能够利用模型进行在线识别(图1)。

结语

通过光谱手段对杂草进行鉴别具有快速、准确、非接触的优势,其成本低,实时性好,非常适合变量作业机械传感技术采用,是一种有潜力的可行方法。通过试验初步效果看,温室内杂草相对大田而言测量条件比较理想,影响因素较少,因此可以采用几个较窄的特征波长带对杂草种类进行甄别。需要注意的是,当作为变量机械系统的传感器使用时,就面临在线动态识别的问题,光照、水分、土壤、病虫害等因素也需要综合考虑。

另一方面,温室杂草识别的后续应用除了获得温室土壤的草害信息外,还包括喷药除草或物理方法铲除杂草(图2)。温室中杂草的控制如不适合喷洒除草剂,也可以用除草铲去除杂草,通过自动控制除草铲的升降来定点清除杂草。

总体而言,杂草的防控采用光谱手段的优势很明显,但外界因素对光谱识别精度的影响也不能忽视,扬长避短,面向实际问题,这一领域还有很大的发展空间。

参考文献

[1] 吴迪,黄凌霞,何勇,等.作物和杂草叶片的可见-近红外反射 光谱特性[J].光学学报,2008,28(8):1618-1622.

模式识别技术范文第6篇

关键词:模式识别;概率密度估计;特征选择和变换;分类器

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2013)30-6879-02

模式识别(Pattern Recognition)是对外界采集的信号如:图像信号、声音信号、视频信号、文本等进行分析和处理,这种对处理对象数据中蕴含的行为或规律进行判别、识别、解释的过程就构成了模式识别技术的基本元素。自然界中有生命的人和动物普遍都具有模式识别能力,这种识别的能力是具有此种模式能力的对象与外界进行交互的重要接口和基石。现阶段学术界和工业界所倡导的模式识别是指用人造计算机或其他设备实现模拟识别的过程,因此模式识别成为了人工智能领域的一个重要分支。早在Rosenblatt 的感知机和 Nilsson的学习机理论中就解释了机器学习、模式识别以及阐述了机器学习与模式识别相关领域的关系[1]。随着时间的推移,人类的需求不断的变化,原来专注于识别的过程现阶段转移到对事物的内在关系和未来的推理上来了。

本文首先叙述了关于模式识别领域的发展历史以及模式识别在此过程中使用的主要方法的演变过程,文章后阶段介绍了模式识别理论方法研究的最新进展并分析未来的发展趋势。由于 Jain 等人的综述[3]已经全面介绍了 2000 年以前模式分类方面的进展,该文侧重于 2000 年以后的研究进展。

1 历史回顾

早在20 世纪 40 年代,随着电子计算机的逐渐兴盛,人们对于计算机的不断探索研究,发现需要用一些科学的方法来解决计算机识别和处理等问题。在已有的模式识别在其他领域的应用范例,如:机械领域和光领域。其中在光领域最具代表性的是现代模式识别例子是德国人Gustav Tauschek与1929年关于光学字符识别的专利。

20 世纪 80 年代 BP(Back-propagation)神经网络算法的兴起以及成功的在工程和学术上的应用燃起了人们对人工神经网络技术的研究和探索的激情,仿佛人工神经网络即将会实现,用以取代人类智能。国际性的模式识别大会也不断的召开,直至2012年国际模式识别大会已经成功举办的21届。

纵观模式识别的发展历程,该文将模式识别研究的过程归纳为以下几个方面:首先,针对模式识别的原始处理识别以及模型的选择问题,人们做了大量的研究,其中最具有代表性的是 Bayes 学习理论,其产生对分类方法的研究提供了新的方法[2]。其次,一些在传统领域应用的比较多的问题,如:概率估算、可代表莫一类事物的特征向量的选择问题、针对未知问题的类别聚合问题等等,人们都期望用新的方法加以实验。第三方面,随着机器学习领域的不断发展,如粒子群优化算法、C4.5、支持向量机等技术的发展,这些都极大的促进了模式识别的进步,机器学习和模式识别领域相互交融、相互补充和融合的趋势进一步加强。第四个方面,模式识别与数据挖掘技术进一步结合,随着模式识别技术的不断发展,产生了新的问题,事物潜在的内部规律有待进一步发掘,故模式识别与数据挖掘的相关技术有进一步结合的趋势。第五,模式识别的理论和方法等不断的进步、计算机性能的不断提升人们迫切的需要将理论转化为现实的生产力,故模式识别在现实中的应用研究占据主要地位。第七,随着云计算与物联网的兴起和发展,这些技术为模式识别领域带来了新的机遇,模式识别中的大数据处理以及物物相联问题将是一种研究的趋势。

2 模式识别的研究现状

2.1 模式识别系统和方法概述

模式识别从其加工处理的过程来看,总的可以分为:前期处理、中期计算、后期融合三个阶段。其中前期处理有可以分为:数据初处理、归一化、模式分隔与计算、特征提取等,中期计算包括模式识别、模式匹配,后期融合包括数据合并、数据计算等[3]。

2.2 概率密度估计

在非监督学习技术中,其最具代表性的发的当属概率密度估计和聚类,二者都属于非监督学习方法。概率密度估计技术主要应用在诸如聚类、特征选择、分类奇异点检测等多方面。基于Bayes 决策规则理论的分类问题就应用了概率密度估计方法,通过概率密度估计方法对未知的事物进行分类。此外在支持向量机的应用基础上,利用距离向量函数与核函数等技术将为分类的数据依据最小分类间隔进行分类,这种方法有其自身的优越性,但是在算法的性能上有待提高,尤其是对于特征向量较多地情况,虽然引入了核函数,但是在运行效率上还是有待提高。

2.3 特征的选择

为了减少高纬度数据对数据处理以及计算的精确度的影响,模式识别领域以及机器学习领域引入了特征选择的概念。就是将过多的特征进行裁剪,选出最具代表性的特征,从而用这些样本的特征对同类新进元素进行分析,将新进的事物的特征向量与样本的特征向量通过函数或者概率的方法对新进事物进行判别。这样在削减特征的前提下,也提高的计算的效率,提高分类的效率以及泛化能力[4]。

3 发展趋势

对于本文中对模式识别技术前期简要介绍的方法以及研究进展外,模式识别技术还有其他的方法和技术。如,在分类问题上,怎样维持分类模型的更新,以及更新的效率等问题上都是未来需要研究的方向。此外智能信息处理中的模式识别技术应适应时代潮流与云计算和物联网技术相结合。

4 总结

本文以模式分类中模式识别问题为主线对模式识别的发展技术以及相关的理论进行了探讨。结合现阶段的现状提出了模式识别技术应与云计算和物联网技术相融合。

参考文献:

[1] Fumin Q I,XIE Xiao-yao,JING Feng-xuan, Application of Improved PSO-LSSVM on Network Threat Detection[J].Wuhan University Journal of Natural Sciences, 2013,18(5): 418-426.

[2] Malley J D, Kruppa J, Dasgupta A, et al. Probability machines: Consistent probability estimation using nonparametric learning machines[J]. Methods of information in medicine, 2012, 51(1): 74.

[3] Structural, Syntactic, and Statistical Pattern Recognition: Joint IAPR International Workshop, SSPR&SPR 2012, Hiroshima, Japan, November 7-9, 2012. Proceedings[M]. Springer, 2012.

模式识别技术范文第7篇

关键词: 模式识别系统 统计模式识别 发展趋势

1.引言

通常我们所说的机器识别、计算机识别等都属于模式识别。它是通过某种方法对事物进行分析比较,根据某种判别规则识别事物。如:手写数字识别,是对0~9数字进行模式匹配,计算出相似度较高的对应值作为识别结果。模式识别研究的内容是使机器完成曾经只有人类才能完成的事,它具有分析、描述与判断事物的能力。经过多年的迅速发展,当前模式识别已经广泛应用于各个领域,如工、农、医、自然科学、社会科学等。在农业中,通过分析土壤成分及农产品的收成,决定种植何种作物、了解养料是否充足,以提高产量。在工业生产中,有语音识别、过程控制、地下探测、图像分割等。医学中主要有心电图与向量心电图分析、显微观察与生物医学数据分析、基因染色体研究、医学图像分割等。在自然科学中有地球和行星探测、卫星数据分析、遥感图像地质勘探等方面应用广泛。然而,种种应用都是随着问题的出现而出现的解决方法,至今模式识别还没有发展成统一的、有效的可以应用于所有模式识别的理论。模式识别的技术对国民经济建设和国防科技发展的重要性已得到人们的认可和广泛重视。本文将就模式识别所涉及的基本问题、研究的领域及其当前进展现状进行详细的介绍,并对模式识别的发展趋势进行展望。

2.模式识别系统

模式识别系统在工作时,只要判别被识别的对象落入哪一个区域,就能确定出它所属的类别。由噪声等导致的变异性,可通过预处理部分消除;模式本身固有的变异性可通过特征提取和选择得到控制。因此,一个典型的模式识别系统由数据获取、预处理、特征提取、分类决策及分类器设计组成。对应部分分别完成未知类别模式分类、分类器设计训练和对识别样品的分类决策。基本的模式识别方法有统计模式识别方法和结构模式识别方法。除此之外,还有模糊模式识别、神经网络模式识别和多分类器融合方法。以下对模式识别系统中五个组成部分简单介绍:

(1)数据获取

通常获取的数据类型有二维图像、一维波形、物理参量逻辑值三种。计算机使用可运算的符号研究文字、指纹、心电图、体温等对象。

(2)预处理

预处理的目的就是对原退化或干扰、冗余的数据信息进行去噪、复原,提取有用的信息。

(3)特征提取和选择

一般来说它包含将所获取的原始量测数据转换成能反映事物本质,并能将其最有效分类的特征表示,输入的是经过预处理的量测数据。通过将原始量测数据转换成有效方式表示的信息,分类器能根据这些信息决定样本的类别,对所获取的信息实现高维量测空间转换成地维特征空间。

(4)分类决策

模式识别系统工作有训练方式和分类决策两种方式。前一种是在确定的特征空间中,对测量数据进行特征选择与提取,得到样本的特征空间分布,并决定分类器参数。后一种方式是对待分类样本进行分类决策的过程。

(5)分类器设计

模式识别研究的主要目的是利用计算机进行模式分类。分类器设计的基本做法是在样品训练集的基础上来确定判别函数、改进判别函数和误差检验。我们把执行模式识别的计算机系统成为模式识别系统。

3.统计模式识别

统计模式识别(Statistic Pattern Recognition)的基本原理是,相似性高的样本在模式空间中相互接近,形成“簇”,根据模式所得的特征向量,判归所属类目。统计模式识别的方法有:

(1)贝叶斯决策方法

贝叶斯决策包含三种基本假设:首先是各类别总体的概率分布式已知的,其次是被决策的分类数是一定的,最后是被识别的事物或对象有多个特征观测值。运用统计决策理论设计的分类系统又称为分类器。分类器的判别准则有:最小错误概率贝叶斯判别准则、最小风险贝叶斯判别和聂曼・皮尔逊判别准则。

(2)判别函数法

判别函数可以是线性的,也可以使非线性的。利用已知类别的训练集,通过统计方法,求得判别函数的具体形式和参数,求出未知样本类别。由于该方法无需依赖条件分布密度等先验知识,因此,在一些场合要比基于贝叶斯公式的概率分类法简单。

(3)监督参数统计法

包括该方法分为KNN法(K最近邻法)和Fisher判别分析法。前者的基本原理是将分好类别的训练样本点映射到多维空间中,建立与待分类的未知样本对应关系,若近邻中某一类样本最多,则将该未知样本判为该类。该方法的优势在于对数据的结构没有特定要求,也无需训练,缺点在于计算量大。

(4)非监督参数统计法

有基于概率密度函数估计的直接方法和与样本空间相似性度量的间接聚类方法。

(5)聚类分析法

该方法是在没有训练集的情况在,对一批没有类别划分的样本根据相似度进行划分类属的方法。通常被称是一种无教师的非监督分类方法。

(6)近邻函数法

该方法根据距离测度,判别样本的类属,如基于最近邻规范的试探法和最大最小距离法。

4.结语

模式识别是一个快速发展的学科,其在国民经济和国防现代化建设中应用广泛。本文围绕模式识别的一些基础知识、模式识别系统和统计模式识加以介绍,着重介绍了模式识别系统中的五个组成部分和统计模式识别方法。随着模式识别理论与技术的不断发展前进,其应用领域和实际需求将会不断增长。

参考文献:

模式识别技术范文第8篇

关键词:智能监护系统;模式识别技术;老年人;隐私安全

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)11-0001-02

一、引言

数据显示,2014年我国65岁以上人口数量达到13755万人,占全国总人口比重的10.1%。空巢老人数量的剧增得社会养老负担加重,如何让老年人安享晚年,减轻子女的养老负担是亟待解决的问题。目前,针对老年人的监测系统大部分是通过人的实时监测来完成的,很容易产生疏漏,不能及时发现被监测地点发生的异常状况。笔者将基于模式识别技术,对老年人智能监护系统[1]进行深入研究。该系统仅仅显示需要监护人员关注的异常状态,而对于老年人正常的行为活动则不予显示,实现了对空巢老人日常生活的智能视觉监护,其市场需求明确,潜在用户数量巨大,因此具有重要的经济和社会意义。

二、模式识别技术与老年人智能监护系统的融合

(一)模式识别技术

模式识别技术是集图像处理、数理统计、几何运算、判别分类等于一体的综合技术,包括语音识别技术、生物认证技术、声纹识别、指纹识别、数字水印技术等,是人工智能的基础技术。模式识别技术是指根据模式的特性,将其判断为某一类,然后用计算机实现人对各种事物或现象的分析、描述、判断、识别。一个典型的模式识别系统一般由数据获取、预处理、特征提取选择、分类决策及分类器设计五部分组成。其目标为,在特征空间和解释空间之间找到一种映射关系,根据X的n个特征来判别模式X属于w1,w2,…,wm类中的哪一类。由从模式得到的对分类有用的度量、属性或基元构成的空间称为特征空间,由M个所属类别构成的集合称为解释空间。人工智能在模式识别方面的一些具体和最新的应用范围遍及遥感、生物医学图像和信号的分析、工业产品的自动无损检验、指纹鉴定、文字和语音识别、机器视觉等方面。

(二)老年人智能监护系统

老龄化背景下,智能监护产品应运而生。老年人智能监护系统是通过摄像头、传感器等电子监测设备对老人的居家生活情况进行实时监测,然后将监测画面传输到监控中心或根据实际需求通过手机、电脑将家里的实时监测信息传送给家人,以最大程度地确保老年人的人身与财产安全。与传统的社区报警系统相比,其优势在于:实时可靠性增强,人性化大幅提升,画面呈现更加直观,可扩展性提高。把该系统为核心的智能监护产品运用到实际当中,将大大减轻各家庭的养老负担,同时随着老年人口规模的扩大以及购买力水平和购买欲望的增长,产品推广后定会为企业带来长期、良好、稳定的收益。

(三)模式识别技术与老年人智能监护系统相结合

目前,国内的智能视频监护技术还处于研究阶段,现存的老年人智能监护渠道仍较狭窄,且存在较多问题,如技术复杂、及时性达不到或是错误率较高等,已无法满足当今老年人对智能监护日益增长的需求。由此可见,研发带有异常模式数据库,实现监测、反馈、报警功能的智能视频监护系统,实现以老年人智能视频监护系统为核心的产品的研制,显得尤为重要。这就需要模式识别技术的融入,使其与老年人智能监护系统的设计相结合,对视频监测设备和传感器采集到的电子信号、视频数据进行分析,判断采集信号与异常模式是否匹配,在目标出现异常状况时呈现监测画面并及时向监测中心反馈,实现老年人智能监护系统的技术革新与功能提升。

1.模式识别技术与老年人智能监护系统相结合的研究方案。基于模式识别技术与老年人智能监护系统相结合的理论,笔者制作了基于模式识别技术的老年人智能监护系统的研究方案。①硬件平台的设计。建立一个包括监控、环境状态采集设备,数据分析存储设备,报警信号产生以及数据远程发送的硬件电路平台。②异常模式数据库的建立。对异常模式进行研究和分析,形成“异常群模式库”,建立模式识别技术的特征空间。通过文献资料、咨询专家确定老年人的危险行为及所处场景的异常,得到异常模式数据,经过预处理、特征提取和选择获得异常模式在视频图像上的特征体现,然后归纳整理,建立相应的异常模式数据库。③监控视频数据的处理及匹配。利用图像处理技术,对监控设备采集到的电子信号、视频数据进行预处理[2]和特征提取,建立模式识别技术的解释空间。然后,找到特征空间和解释空间之间的映射关系,做好分类决策。设从当前视频中分析得到的特征数据为向量X1,Y={Y1,Y2,…,Yn}为异常模式库中的各种异常模式。对X1和Yi进行模式匹配,i=1,……,n,通过属性距离计算、模板匹配、结构匹配等方式分析X1与Y中模式的相似程度,识别出X1是否属于异常模式库中的模式,以及属于哪一种异常模式,并把识别结果进行的输出。④数据采集匹配后的报警反馈。若经过匹配结果判断出现了异常情况,则在监视器上显示现场的实时图像,并进行声音报警,同时确定为何种紧急事故,以便施救及时且有效;若识别结果为正常,则将场景数据丢弃,不形成显示画面。

2.模式识别技术与老年人智能监护系统相结合的技术路线。基于模式识别技术与老年人智能监护系统相结合的理论,笔者制作了基于模式识别技术与老年人智能监护系统相结合的技术路线。如图1所示。

三、带有模式识别的老年人智能监护系统分析

(一)带有模式识别的老年人智能监护系统的价值与意义

带有模式识别的老年人智能监控系统提升了隐私安全保护:该系统打破了传统的全程监控模式,对老年人正常的行为活动不予显示,仅在发生异常情况时传输影像,在无隐私侵犯的安全状况下,实现针对独居老人日常生活的智能视觉监护;该系统开创了无人监护,与传统监护系统相比,该系统具有无人监护的优势,有效减少了成本支出与人力资源的浪费;带有模式识别技术的老年人智能视频监控系统大幅度地提高了安全性与灵活性:传感器与摄像头相结合,与传统的单一技术相比其安全性更高,无线技术的应用使得系统具有安装位置灵活机动、可根据需要随时调整位置的优点。

目前的视频监测系统大部分是通过人的实时监测来完成的,其缺点是:需要监测工作人员通过不断观看监视屏来发现异常状况,具体的监测过程是细致、连续、长期枯燥的过程。尤其是当监测点较多时,监测工作人员常常要面对很大的一面电视墙,很容易产生疏漏,不能及时发现被监测地点发生的异常状况。而且,连续不断地监测画面必然会涉及个人隐私问题,监护方式不易被老人接受。如果仅仅显示需要监护人员关注的异常状态,而对于个人正常的行为活动则不予显示,这样就可以在无隐私侵犯的安全状况下,实现针对独居老人日常生活的智能视觉监护,对解决空巢家庭独居老人的监护问题有着非常积极的意义。

(二)带有模式识别的老年人智能监护系统的实际应用

医院对监护的需求无处不在,且需要付出巨大的人力、物力及财力。在社会需求和政府政策的推动下,未来五年将成为养老机构快速发展的黄金期,包括政府筹办和民间资本筹办的养老院、敬老院、老年公寓等机构。中国老龄事业发展“十二五”规划提出,全国城市街道和社区统筹安排服务设施,实现居家养老服务、老年日间照料,卫生站和助餐网点基本覆盖,80%以上的乡镇和50%以上的农村杜区建立包括养老服务在内的综合设施和站点。因此将带有模式识别技术的老年人智能视频监护系统应用于医院、专门的养老机构、居住社区养老服务中心以及有需求的居家养老家庭,对构建以居家为基础,以社区为依托,以养老机构为支撑,资金保障与服务保障相匹配,基本服务与选择相结合的养老社会服务体系有极其重要的推动作用。

四、结语

基于模式识别的老年人智能监护系统研究是缓解由于人口老龄化所引起的医疗资源短缺问题以及养老负担问题的必要途径。随着科技的进步、人口老龄化问题的加剧以及人民对医疗护理水平要求的不断提高,智能视频监护系统必将得到广泛应用。针对传统的智能视频监控系统技术研究的不足和我国社会空巢老人这个社会热点问题,基于模式识别的老年人智能视频监护系统研究将成为应用于家庭空巢老人监护的关键。研发基于模式识别的老年人智能监护系统,实现以该系统为核心的产品研制,必将会在智能监护领域取得重大突破,为老年人家庭带去福祉,同时使企业获得良好稳定的收益。

参考文献:

[1]马宝庆,汤一平,严杭晨.基于全方位视觉的独居老人监护系统[J].计算机工程,2013,8(39).

[2]石青云.模式识别的现状与发展趋势[M].北京:北京大学信息科学中心,1988.

模式识别技术范文第9篇

Abstract: Pattern recognition in computer-assisted information system is important to jewelry gemstone identification. Pattern recognition effectively analyzes identification process of jewelry gem; it directs the actual operation of the identification. This paper analyzes the specific application of the pattern recognition in the jewelry gem, and does a brief discussion.

关键词: 模式识别;珠宝;宝石鉴定

Key words: pattern recognition;jewelry;gem identification

中图分类号:TS934.3 文献标识码:A 文章编号:1006-4311(2011)28-0314-01

0 引言

模式识别最早起源于上个世纪的20年代,并随着上世纪40年代计算机的诞生以及50年代中期人工智能的逐步兴起,识别模式就此在上世纪60年代迅猛发展开来,由此应运而生,随着时代不断的前进与发展,现行科学技术领域中,模式识别的研究理论与方法愈来愈授以重视与关注,并且其再不断的推动人工智能系统的发展,逐步壮大计算机应用技术的领域规模。近20年来,全球珠宝市场的贸易额不断攀增,以20%的高增长速度发展,并且多个国家地区或者城市珠宝行业已经占据主要地位,成为支柱性产业,珠宝是市场的规模壮大与发展,不但从客观上满足了人们的精神需求以及信息消费需求,进而还一定程度上带动了整个经济的发展。从国际的发展趋势而言,各国对珠宝玉石的评价都力争走向科学化、标准化的发展道路,开展宝玉石鉴定与评价的理论和现实意义重大。珠宝玉石鉴定是一项利用多种仪器和检验方法测试宝石多个参量, 并依据这些检验数据进行综合判断的复杂工作。珠宝鉴定辅助信息系统,即模式识别程序的运用,可以充分利用计算机强大的特性,调动其数据库等信息加以鉴定,从而在实践应用中效果显著。

1 软件系统主要特点

模式识别在宝石鉴定的运用,全面性的涵盖了常规仪器的检验方法。它对宝石鉴定的具体性、标准性、系统性的描述参量做出了准确有效的对比判断,如宝石的硬度、密度、质地等。另外,对于宝石的颜色、所吸收的光谱等非标准化特性描述参量也能够做出有效的对比与判断。

模式识别技术的在珠宝玉石中的主要运用成果表现可实现对宝石不同层面、性质上的参量做出标准、有效的综合判断;并且计算机模式识别中的形象特征数据库里有更为丰富的珠宝玉石信息资源,这样就使得实际鉴定过程与信息自动化的辅助鉴定系统紧密联合开来。系统内部提供了大量的宝石的品种、处理优化样本、和成品、相似品等以及相关鉴定检验方法,这对珠宝玉石的鉴定工作具有重要性的指导意义。

2 模式识别应用理论与方法

常规来讲,模式识别的方法为统计模式识别。而特征向量是统计模式识别所研究的主要对象。而特征向量由多种元素组成,每种元素所对应的特征或者属性,均能够构成一个自设的特征空间;而对统计模式识别做以细致性的研究,就是对特征空间进行多重划分,从而达到根据属性、特征做以鉴定。因此,对于统计模式识别的主要识别系统主要由以下四部分构成:数据提取、预处理、特征提取与选择、分类决策。如下所示:

信息处理预处理特征提取与选择分类决策

2.1 信息处理 珠宝玉石鉴定过程实际运用到了多个科学领域的综合组成,其涉及到力学、光学、化学、以及物理学等领域。通过对珠宝的颜色、折射率、密度、硬度、等多方面提供了诸多参量进行综合对比检测,并在实际鉴定过程以标准值相互比对,最后在下设定论,做出正确判断。因此,模式识别的信息处理数据实际上属于物理参量与逻辑值范围之内的。在以往常规的人工检测鉴定过的数据结果,通过人工录入把标准参量数据输入到系统中,从而实现此类宝石特征的数据提取。

2.2 预处理 预处理的主要目的是去除光谱等非描述性的参量的影响因素,并对其加强信息处理,同时对测量设备仪器的所造成的不确定性因素或者所造成的退化现象进行修复还原;往往珠宝的性质都是用语言去描绘的,内同十分复杂繁多,较为庞大,这其实是与计算机的数字化、标准化是相悖的,因此,对于颜色、吸收光谱等非描述性参量,进行标准化和编码。通过对这些数据的预处理,使计算机对这些参量也能进行准确查询和比较。

2.3 特征提取和选择 珠宝玉石的鉴定标准,为了便于分类决策,采用了测量值与标准值进行逻辑比较的方法,将测量值统一变换为逻辑值来表示,即测量值与标准值相符为1,不符为0。这样可使分类器的设计简单化。

2.4 分类决策 分类决策就是指在特征空间运用统计模式识别方法把所有识别的对象归为一类,即研究对象在本身训练的前提条件以及基础之上,确定某个判决性规则,从而按这种判决性规则对所统计的要被识别的对象进行系统分类,并且以错误识别率最小为识别标准。

2.5 线性分析器 而线性分类器的设计通常采用最大值选择器。但由于在实际鉴定过程中,对宝石参量的测量是有选择性的,而且,多个品种的宝石在某些参量上十分相近,甚至出现重叠。识别模式以匹配度的形式提示给使用者,以防止漏判。

3 结语

珠宝宝石的模式识别系统以及计算机的特征数据库,均为实际宝石鉴定过程提供了宝石鉴定体系的相关知识,并通过模式识别的高效程序系统,实现了对宝石种类、以及多个不同属性的参量都做出了明确性的判断。经过理论实践证明,模式识别的系统程序,在很大程度上突破了个人自身的经验局限并为实际鉴定珠宝宝石提供了全面性以及可靠性的操作经验,另外,在实际应用中,模式识别系统程序在设计上,如果能提高加大检查项目的比较和判断能力,那么就会使宝石鉴定在模式识别程序系统中的实际鉴定过程更加健全、完善,更具推广价值。

参考文献:

[1]张彩甜.模式识别技术的应用――珠宝玉石计算机辅助鉴定及信息系统[J].福建电脑,2009,(09).

[2]何军,叶东.珠宝科技进步对珠宝鉴定的影响[J].珠宝科技,2002,(02).

[3]何乃华.“模糊”的珠宝鉴定[J].中国宝玉石,2003,(03).

模式识别技术范文第10篇

关键词:模式识别;本科教学;教学实践;教学改革

随着电子信息技术的迅速发展和信息处理自动化需求的不断扩大,模式识别方法和技术在信息处理领域中的重要性越来越受到重视。在吸引了众多研究者投身到模式识别研究领域的同时,模式识别的教学也从研究生教学逐渐延伸到了本科教学。模式识别作为计算机、电子信息技术等专业的专业基础课程,已经在越来越多的高等院校开设。本科模式识别课程主要讨论以统计学为基础的模式识别理论和方法,内容包括:贝叶斯决策理论以及参数估计方法、以误差函数最小化为原则的线性和非线性判别、近邻规则、特征提取和选择、聚类分析、神经网络、支撑矢量机、随机方法、非度量方法、独立于算法的机器学习等内容[1]。由于模式识别研究领域的广泛性,模式识别本科教学的内容和侧重点的安排目前尚处于探索阶段。模式识别领域的发展日新月异,这就要求教师在授业解惑的同时能够与时俱进地介绍该领域的发展前沿,从而培养学生主动探索知识的兴趣。

本文将结合本科模式识别教学的实践,分析该课程在内容设置方面面临的问题并给出相应的解决问题的建议;结合模式识别课程的特点,提出了以应用实例为先导的教学方法,以提高学生的学习兴趣;针对不同类型的学生,提出了如何培养学生实践能力和科研兴趣的方法。

1模式识别教学内容的层次划分和讲授方法

模式识别是一门理论与实践紧密结合的学科,其理论基础涉及高等数学、线性代数、数理统计、矩阵论、随机过程、工程优化方法、小样本统计学习理论、模糊数学等学科[2]。然而除了高等数学、线性代数和数理统计,其他课程都是研究生阶段才会开设的数学基础课。这就使得本科的模式识别教学面临着尴尬的局面:既不能花过多的时间讲数学基础知识,又要把以这些数学知识为基础的内容讲清楚。面对这一难题,我们在教学实践中总结出了一套办法,具体做法是将教学内容划分为基础型、前沿型两类;并采用弱化公式推导,强调数学表达式物理含义的方法进行讲授。

基础型教学指的是已经发展完善的模式识别原理和方法。基础型内容包括:贝叶斯决策理论、概率密度函数估计、线性判别、近邻规则、独立于算法的机器学习等内容。贝叶斯决策理论和概率密度函数估计是以数理统计为基础的[3],这一部分也是模式识别的重点内容。线性判别是以高等数学和线性代数为基础,同时涉及工程优化方法课程的部分内容。在这部分内容中,公式推导占据了相当大的篇幅,而且推导过程是学生可以理解和掌握的。对于基础型的内容,可以采取理论推导和实际例子相结合的讲授方式。在公式推导的过程中,尤其要强调公式的物理含义,同时给出几个有趣的例子,在增强记忆加深理解的同时提高学生的学习兴趣。

前沿型教学指的是正在发展中的模式识别原理和方法。前沿型内容包括:特征提取和选择、聚类分析、神经网络、支撑矢量机、随机方法等内容。这部分内容或者是数学基础超出了本科生的能力范围,或者处于发展前沿,很多内容正处于探讨阶段。对于前沿型的内容,可以忽略公式推导过程,直接讲授推导的结论以及结论的物理含义,同样结合实际例子加深学生的理解。对于发展中的模式识别方法可以适当介绍该领域的发展前沿,在开拓视野的同时激发学生的科研兴趣,引导部分学生从事感兴趣的科学领域的研究。

2实例先导的教学方法

模式识别方法是为了解决信息处理中面临的识别问题而提出的。在讲授方法之前,首先要明确将要介绍的模式识别方法的应用背景和使用范围,而不是像我们通常做的那样,先介绍方法的理论基础和流程,最后再给出一个例子,或者通过课后练习和作业的形式让学生掌握课程介绍的理论和方法的应用。针对本科模式识别课程的特点,我们在教学实践中摸索出了一套以实例为先导的教学方法,并与上机实验和课程设计相结合,大大提高了学生的学习兴趣和动手能力,取得了良好的教学效果。

实例先导的教学方法是在介绍每一章或者相关的几章内容之前首先用一个实际的例子引出要学习的内容,在相关内容的学习结束之后给出解决实例问题的模式识别方法。例如:在讲授贝叶斯决策理论之前,给出根据长度和光泽度等数值特征识别鲑鱼和鲈鱼的例子[4];在讲授决策树之前,给出根据颜色,形状、尺寸等非度量特征识别水果的例子等等。通过学习,找到了解决这类问题的一般方法,同时学生也通过实例记住并理解了该方法的适用范围。又例如在讲授特征的选择与提取这一章时,先不讲特征空间的映射和变换,而是从几个实例出发,说明并不是特征越多越好,而是要选择合适的特征向量;特征的组合变换可以使复杂的分类问题转化为简单的问题等。从而让学生更好地理解特征选择和提取的目的和重要性。

在接触到实际的模式识别问题时,会引发学生的思考。在授课过程中,教师可以针对具体问题组织学生进行讨论,看是否能够利用已学过的模式识别方法解决该问题。若可以解决,则引导学生分析用已学方法解决该问题时存在的不足,从而引出下面将要介绍的新方法。这样,在介绍新方法的同时,学生会很自然地将新方法与旧的方法进行比较,分析各种方法的优劣,有利于学生对教学内容的深入理解和掌握。这种方法在讲授解决同一类模式识别问题的不同方法时是适用的。如在讲授贝叶斯决策时,可以通过对比的方式介绍几种决策规则的特点,又如在讲授线性判别方法中各种形式的感知器算法时,也可以对比学习各种算法的优劣。若该模式识别问题不能用已学的方法解决,则引导学生分析该模式识别问题的特点,思考为何必须引入新的模式识别方法来解决该问题,学生是否能够提出自己的解决方案。在分析和思考之后,教师再将解决该问题的思路引入到下面将要介绍的新方法上。这种方法在讲授解决不同类型的模式识别问题时是适用的。如在讲授非度量模式识别方法时,面对非度量语义属性的模式识别问题是前面介绍的方法无法解决的,要引入非度量模式识别方法加以解决。

因此我们建议在教材的编写上可以尝试采用实例先导的方法。首先在引言部分给出一个实际例子,然后在介绍方法的部分结合理论分析给出解决实例问题的方法。这种方法有利于提高学生的学习兴趣,增强记忆,加深理解。

3实践能力和科研兴趣的培养

模式识别是一门理论和实践紧密结合的科学,该学科的发展日新月异,在计算机和信息处理领域的地位越来越重要。因此,在模式识别课程的教学过程中要注重学生实践能力和科研兴趣的培养。在教学实践中,我们采用了上机实验和科学报告相结合的教学方式。

掌握各种模式识别方法的原理和流程是本科模式识别教学的第一个阶段。在此基础上,我们要求学生在计算机上实现模式识别方法并用于解决实际的模式识别问题。在上机实现的过程中,学生不仅需要掌握模式识别问题在计算机中的表示方法和识别结果的展示形式,尤其重要的是学生需要对模式识别方法的每一个细节都要深入理解和掌握才能将算法实现。在上机教学中,我们采用了Matlab编程环境实现课程中介绍的模式识别方法。Matlab的编程语言简单高效,而且提供了功能强大的图形展示功能[5]。例如在贝叶斯决策和线性分类器的上机实验中,学生可以利用画图函数用不同的颜色和符合标记不同类别的样本,可以轻松地画出决策面,这种可视化的分类结果展示形式不仅提高了学生的学习兴趣,而且加深了学生对模式识别方法及其特点的理解。

在学生成绩考核中,除了笔试成绩我们还增设了上机作业成绩和科学报告成绩两个部分。上机作业的内容是要求学生从若干个上机题目中选择有兴趣的实现一个简单的模式识别系统。例如设计实现贝叶斯分类器、线性分类器、神经网络分类器、决策树等。科学报告可以有两种形式,要求学生或者在模式识别领域的主流英文期刊上选择感兴趣的英文文献,将其翻译为中文;或者就模式识别领域的一个感兴趣的话题谈谈自己的看法和主张。通过上机作业和科学报告的形式,学生的动手能力得到了良好的锻炼。不仅提高了学生的学习热情,而且引导学生积极思考,不少同学在科学报告中提出了自己的学术看法和主张,有些内容颇具独到的见解。

在学生成绩考核中,除了笔试成绩我们还增设了上机作业成绩和科学报告成绩两个部分。上机作业的内容是要求学生从若干个上机题目中选择有兴趣的实现一个简单的模式识别系统。例如设计实现贝叶斯分类器、线性分类器、神经网络分类器、决策树等。科学报告可以有两种形式,要求学生或者在模式识别领域的主流英文期刊上选择感兴趣的英文文献,将其翻译为中文;或者就模式识别领域的一个感兴趣的话题谈谈自己的看法和主张。通过上机作业和科学报告的形式,学生的动手能力得到了良好的锻炼。不仅提高了学生的学习热情,而且引导学生积极思考,不少同学在科学报告中提出了自己的学术看法和主张,有些内容颇独到的见解。

4结语

本科模式识别教学由于学生的数学基础有限而面临着两难的境地。既要把原理和方法讲清楚,又不能过多的涉及复杂的数学推导,这给教学带来很大困难。在教学实践中,我们把教学内容划分为基础型、前沿型两类,并提出了弱化公式推导,强调公式的物理含义,以及结合实例增强记忆的教学方法。为了提高学生的学习兴趣,加深理解,我们提出了实例先导的教学方法。用实际例子引导学生思考,加深学生对模式识别方法应用背景和适用范围的理解。模式识别是实践性很强的科学,并且该学科的发展十分迅速。在教学实践中,我们十分重视学生动手能力和科研兴趣的培养。通过上机作业和科学报告的形式引导学生积极动手,积极思考。

参考文献:

[1] 边肇祺,张学工. 模式识别[M]. 2版. 北京:清华大学出版社. ,2002:9-303.

[2] 顾波. 模式识别本科教学方法浅谈[J]. 中国科教创新导刊.,2010(4):68.

[3] Andrew R. Webb. 统计模式识别[M]. 2版. 王萍,等,译. 北京:电子工业出版社,2004:1-10.

[4] Richard O. Duda,Peter E. Hart,David G. Stork. 模式分类[M]. 2版. 李宏东,姚天翔,等,译. 北京:机械工业出版社. ,2003.

[5] 杨淑莹. 模式识别与智能计算:Matlab技术实现[M]. 北京:电子工业出版社,2008:1-300.

Teaching Practices on Undergraduate Patten Recognition Course andCurriculum Reforming

QI Yu-tao1,2, LIU Fang 1,2, JIAO Li-cheng 2

(1. School of Computer Science and Technology, Xidian University, Xi’an 710071, China; 2. Institute of Intelligent Information Processing, Xidian University, Xi’an 710071, China)

Abstract:As the limit of mathematics, the teaching of undergraduate Patten Recognition course is in a dilemma. With the help of teaching practices, the author divides the content of course into two types: the basic type and the developing type, according to which, a teaching thought of weakening equation derivation and strengthening equation explanation is proposed. In order to bring up the students’ study interest and develop the understanding, a case guided teaching method is presented. Meanwhile, some advices on how to develop students’ practical ability and reaching interests are also given.

上一篇:计算机审计质量范文 下一篇:质量控制措施研究范文