图形图像实训总结范文

时间:2023-11-25 15:36:49

图形图像实训总结

图形图像实训总结篇1

关键词:支持向量回归;超分辨率复原

中图分类号:TN911.73 文献标识码:A 文章编号:1007-9599 (2012) 15-0000-01

图像的超分辨率复原技术是通过超分辨率算法处理一幅或者一组序列图像获得高质量高分辨率的图像。本文介绍了一种基于SVR的空域超分辨率图像复原算法,该算法是基于学习的算法,并且获得了较好的实验效果。

1 SVR

支持向量机(Support Vector Machine)是Cortes和Vapnik首先提出的,它适用于解决小样本、非线性和高维模式识别等问题,并且能够应用在函数拟合等其他的机器学习问题中。SVR则是支持向量机的理论在函数拟合问题上的应用。支持向量机方法的理论基础是统计学习理论的VC维理论和结构风险最小原理,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折中,以期获得更好的泛化能力。

2 基于SVR的空域超分辨率算法

将SVR用于超分辨率技术中,可应用在空域中。超分辨率技术就是通过算法利用低分辨率图像获得真实的高分辨率图像。从某种意义上来说,超分辨率技术相当于插值技术,即对低分辨率图片进行某种插值,从而获得高分辨率图片。基于SVR的超分辨率图像就是利用SVR来学习高分辨率图片中的填充像素值与低分辨率图片中的小块之间的关系,从而预测出高分辨率图像中像素的值。这种关系具体来说,就是从低分辨率图像中获得N×N的小块,然后找出该小块中心像素在高分辨率图像中所对应的扩展出来的四个像素,在小块与高分辨图片中这扩展出来的四个像素之间的关系作为学习模型的输入。

(a):低分辨率图片;(b):高分辨率图片

其中N×N的低分辨率图片中的3×3的灰色区域与高分辨率图片中的6×6的灰色区域相对应。低分辨率图像中的像素点x对应的是高分辨率中的x1,x2,x4,x4四个像素点,这四个像素点是未知的,也就是超分辨率技术所要求解的问题。作为SVR训练的输入为低分辨率图像中3×3的矩阵,与其对应的label值为高分辨图像中蓝色方块对应的2×2的区域的值,由于共有4个值,所以要训练出4个模型用于对这四个值进行估计。

用公式可以这样描述,输入的数据可以表示成 ,其中 为 的小块, 则表示将一个矩阵所有的列向量表示成为一个行向量,在图1所示的条件下, 为3,则 是一个长度为9的向量,输出的label值为 ,而 的值是复原后高分辨率图像中蓝色方块所在的红色格子内的四个像素值。

由于这是一个多类的问题,我们可以将问题转化为多个一类的问题,即我们将 变形为 ;而输入形式不变。

在该算法中,核函数的选择特别关键。我们一般采用的是径向基核函数。

3 实验

本次实验是在Matlab环境中,利用Libsvm3.0版本。

本次实验以512×512的图片“vase.tif”作为原始高分辨率图片。其中,我们从中截取一部分作为SVR的输入集,由此来获得高分辨率的图像。将512×512作为理想的高分辨率图像尺寸,对其依次截取,获得尺寸分别为384×384,200×200,112×112,60×60的实验图片。

首先对60×60的图片进行下采样,获得30×30的低分辨率图像,以低分辨率图像中3×3的小块的集合作为训练数据,以原图像中相应的小块所对应的高分辨率图像点周围的三个像素作为三个训练值集合。训练数据与训练值共构成训练集。用SVR对此训练集的输入进行训练,获得训练模型。之后再对待测试的其他尺寸图像进行参数为2的下采样,获得相应的低分辨率图像,之后将这些低分辨率图像作为测试集,利用之前训练好的模型进行预测,获得高分辨率图像。

实验结果如表1所示。

根据实验图像来看,经过SVR空域实验预测出的高分辨率图像视觉效果很好,而且随着训练集与测试集的比例的缩小,并不影响图片的质量。通过表1可以得出SVR空域超分辨率算法具有较高的保真度,而且适用于较小的样本集。

4 总结与展望

本文介绍了在空域的基于SVR模型的图像超分辨率算法,获得了较好的实验结果。但是该算法在参数设置和运算速度等方面需要进一步改进。

图形图像实训总结篇2

《PhotoShop》教学中

是怎样运用“任务驱动”教学法的。

在《PhotoShop》这门课程中运用“任务驱动”教学法,便于学生循序渐进地学习。教师在这门课程的总体学习目标的框架上,可以将其细分为一个个子目标,再将每一个子目标细化成一个个容易完成的任务,通过这些任务来体现总的学习目标。

对于《PhotoShop》这门课程,根据课程的总体目标,可将其分解为:(1)《PhotoShop》概述;(2)《PhotoShop》的基础;(3)《PhotoShop》的进阶;(4)《PhotoShop》的综合应用。然后将这些子目标细化成一个个任务,在这些任务的引领下,学生自发地学习计算机相关知识,完成学习任务。

对于《PhotoShop》概述,应重点放在图像基本概念的理解、图像文件的基本操作、转换图像的色彩模式上。教学时,首先让学生欣赏图像作品,了解平面图的设计流程、常规设置;图像的基本概念、常用图形格式及主要参数;图像文件的基本操作;单位与标尺、参考线的使用。然后给出任务:1.图像文件的基本操作,如文件的打开、新建、保存等;2.如何将图像文件格式进行转换。

对于《PhotoShop》的基础,教学时,教师在总机上演示,学生在学生机上按以下任务进行同步操作:

一是图像大小的调整、图像的裁切;如何创建选区、选区工具的应用。运用实训案例:1.“骑牛架云”实训。掌握基本选区工具的使用,熟悉选区的建立、多个图像合成。2.“中国工商银行”标志制作实训。掌握图像的建立及基本编辑,选区工具的使用及选区的描边、标尺与网格线的应用。

二是如何使用绘图工具、渐变工具、图像处理工具、修复画笔工具。

三是图层的基本操作。如,图层的新建、移动、删除、命名;如何链接、合并图层,调整图层的透明度,使用图层组、图层样式及图层混合模式等。

四是文字工具的应用;图层蒙版的应用;文字图层混合。可采用实训案例“枫叶的特效”使学生掌握蒙版的应用。

五是路径的创建、编辑、复制;用钢笔工具创建图形轮廓;填充路径与路径描边。通过实训案例“文字环绕路径”效果使学生掌握文字与路径的应用、路径的描边及应用自由变换工具旋转对象。

对于《PhotoShop》的进阶,在教学时,先展示事先已经进行处理过的图像文件,通过这些优美、惊奇的画面,吸引学生,让学生产生想去了解更深层次的PhotoShop知识的欲望,再将目标分解成一个个任务融入实训练习中,让学生去完成任务。

例如,制作“水晶球”实训练习,我先将制作好的“水晶球”展示给学生看,漂亮的“水晶球”里还有一个手镯,这让“水晶球”带着魔法视觉效果。对此,学生产生强烈的学习欲望,制作过程中自觉完成以下任务:一是选区工具的应用;二是自由变形工具的应用;三是“扭曲”滤镜、“模糊”滤镜的应用;第四个任务是色彩调整的操作。正是通过这一个个任务,学生学会了自己去分析情景、理解知识、完成任务。这样,学生对PhotoShop知识也更加理解,而且能够运用自如。

对于《PhotoShop》的综合应用,在教学时,我让学生综合应用已学知识完成封面设计、建筑装饰、广告设计等实训练习。笔者注重学生设计训练,让学生自行设计,发挥学生想象力,让学生把所学的PhotoShop知识运用到设计之中去完成任务,然后再展示自己的设计,让同学进行评价。通过作品评价,学生也可以从其他同学作品中取长补短, 提高自己的操作能力和设计水平。

根据教学效果对教学进行评价是《PhotoShop》课程引入“任务驱动”教学的一个重要环节,教师要对每个学生完成任务的情况,进行有针对性的评价,既要对任务完成情况进行评价,也要对学生在完成任务过程中的各种学习能力进行评价。学生每独立完成一项任务,都会获得一定的成就感,这时教师的及时表扬、鼓励,可以激发学生更多的学习兴趣,增强自信,使其在不断完善自己的知识结构的同时,也提高了对自身的认识与评价,让自己在一种良好的心理状态下不断学习、不断进步。

图形图像实训总结篇3

图像分类模块本文中采用的分类器是叠加(Stacking)集成分类器:将若干个弱分类器集成为一个强分类器。分别为图像特征、纹理特征和形状特征分别设计了一个基于SVM[5]的弱分类器,然后使用基于Stacking[6]的集成方法将上述的多个分类器集成为一个新的强分类器。支持向量机(SVMs)方法介绍支持向量机是一种基于统计学习理论的模式识别方法,在解决小样本、非线性及高维模式识别中表现出许多特有的优势。假设预先有一个训练集:(x1,y1),…,(xm,ym),其中即xi∈Rd即xi为d维特征值向量空间,而yi∈{-1,+1}代表类别标签。支持向量机的原理是通过一个非线性映射函数Φ∶RdHf(d<f),将原始线性不可分的特征值输入空间转换成一个线性可分的特征值空间;然后,寻找一个最优超平面将训练样例隔开。如图2所示(图2征值空间为2维,即d=2,最优超平面为直线),实心正方形和空心圆点分别代表两类样本,右图中的实心直线为分类线,而2条虚线分别为通过各类中距离分类线最近的样本且平行于分类线的直线,它们之间的距离叫做分类间隔(margin)。所谓的最优分类线就是能够正确将两类分隔开而且使分类间隔最大化的直线。所有位于分类线一侧的训练样本标记为-1,位于另一侧的标记为1。距离最优分类超平面最近的那些训练样本被称为支持向量,从图2中可以看出,支持向量相对于训练样本总体数量上要少得多,特别是当训练样本容量比较大的时候。这些支持向量决定了最优分类超平面。支持向量机的基本思想可以概括为:首先通过非线性变换将输入空间变换到一个高维空间,然后在这个新的空间中求取最优线性超平面,而这种非线性变换是通过定义适当的内核函数实现的。图像视觉特征值颜色特征。颜色是在图像检索中应用得最为广泛的视觉特征,主要原因在于颜色往往和图像中所包含的物体或场景十分相似。此外,与其他视觉特征相比,颜色特征对图像本身的尺寸、方向、视角的依赖性较小,从而具有较高的鲁棒性。图像颜色特征的表达涉及到多个方向。首先,存在许多不同的颜彩空间;其次,需要采用一定的量化方法将颜色特征表达为向量的形式;最后,还要定义一种相似度标准用来衡量不同图像之间在颜色上的相似性。首先抽取出图像的RGB颜色特征向量。上述的10个颜色足够表示图像的颜色信息,而且采用以上的颜色划分方式和人类的颜色认知习惯很接近。

通过图像分类模块,可以得到Web图像I的一个概念集合K=(K1,K2,…,Kn)。语义相似处理模块传统的图像自动注释方法虽然不需要人工参与或者是很少的人工参与,大大缩短了图像注释过程的时间,但是,由于没有采用有效的方法来确认筛选出来的文本哪部分是真正和图像内容相关的,所以提取出的图像注释文本中依旧存在很多的干扰信息。本文针对传统Web图像自动注释的缺点,提出一种利用自然语言处理语义相似度计算的方法,即基于WordNet计算语义相似性。WordNet[7]是一个词典,它的最小组成部分是同义词组成的词素,同时还包括了注释。如果一个词有多个含义,那么在WordNet中将有多个对应的词素。WordNet将词分成4大类:名词、动词、形容词和副词,然后使用各种关系将这些词联系起来,例如同义关系、反义关系、类属联系(IS-A联系)、属于关系、包含关系、部分与整体关系等。这些关系形成了词与词之间最基本的语义关系。本文中主要考虑的是名词之间的语义联系和动词之间的语义联系,还有少量的形容词和名词之间的语义联系,而其中最主要的联系是类属联系,它占据了语义关系总量的70%。目前已有不少基于WordNet计算语义相似性的方法被提出,主要分为三大类:基于信息量计算[8]、基于路径计算[9]和基于WordNet中词素的注释计算[10]。研究结果表明,基于信息量计算的JCN[11]算法具有较高的精确度,在语义相似计算模块中本文采用了这个算法的一个变体。JCN算法中使用了信息量这个概念。信息量[8]是用来度量一个层次结构中各个组成部分的度量单位。通常一个概念越具体,那么它包含的信息量就越多;相反,一个概念越抽象,那么它包含的信息量就越少。例如,“老人”提供的信息量相对于“人”这个概念来说丰富得多。本文中利用WordNet来计算一个具体的概念包含的信息量(IC),计算方法下:IC(c)=-log(P(c))(3)式(3)中,符号c代表一个概念(WordNet中的一个单词),P(c)是概念c和所有概念c包含的子概念出现的频率。从式(3)可以看出,在WordNet的关系结构中,越处于上层的概念出现的概率越大,相应的其包含的信息量就越少。在JCN算法中还使用了2个概念之间的最小共同体(lowestcommonsubsu-mer)这个概念,它定义为2个概念的WordNet结构中共享的最底层的节点。

为了测试本文中提出的图像自动注释方法,设计了一个小型的图像检索模型来模拟图像检索测试。在实验中使用了包含图像的网页共10000张。用户模拟输入一个查询(只实现了单关键词查询),然后图像检索系统根据图像的注释进行传统的文本查询,查找出和查询条件匹配的图像,然后返回结果给用户。在实验中采用了标准11点精确度-召回率图,即在召回率为0,10%,20%,…,100%这11个点采样计算平均查询的精确度。在召回率为0处的查询精确度定义为将查询结果中第一个正确结果之前(包括正确结果本身)的结果作为最后的查询结果,计算得出的查询精确度;召回率为10%的查询精确度定义为将查询结果中包含前面10%正确结果的结果作为最后的查询结果,计算得出的查询精确度。其他的定义类似于召回率为0和10%的精确度定义。实验中的图像注释方法除了本文提出的之外,还采用了传统的图像注释方法作为图像检索结果的测试基准。图4列出了实验结果。本文提出的基于分类的混合图像内容自动注释方法要好于传统的基于文本抽取技术方法,当召回率接近60%的时候,本文提出的方法的精确度接近传统的方法,主要原因是图像分类中一些分类错误导致的。

本文提出了一个比较新颖的图像内容注释方法,综合利用了文本抽取技术、数字图像处理技术、机器学习集合和自然语言语义处理技术,提高了现存的图像注释方法的精确度。当时从实验结果可以看出,由于图像分类结果的错误导致了最后图像注释结果的一些错误。而且本方法的使用限于Web图像的注释,即需要图像的周围有比较丰富的伴随文本,因而对于孤立的图像不能实现图像注释。这个缺陷解决的可能方向是首先在网络上找出和图像相近似的一些图像,在利用这些图像的周围文本完成图像注释。

作者:郑欣 徐军莉 单位:江西科技学院

图形图像实训总结篇4

(江苏科技大学电子信息学院,江苏镇江212003)

摘要:在实际交通环境中,由于运动模糊、背景干扰、天气条件以及拍摄视角等因素,所采集的交通标志的图像质量往往不高,这就对交通标志自动识别的准确性、鲁棒性和实时性提出了很高的要求。针对这一情况,提出一种基于深层卷积神经网络的交通标志识别方法。该方法采用深层卷积神经网络的有监督学习模型,直接将采集的交通标志图像经二值化后作为输入,通过卷积和池采样的多层处理,来模拟人脑感知视觉信号的层次结构,自动地提取交通标志图像的特征,最后再利用一个全连接的网络实现交通标志的识别。实验结果表明,该方法利用卷积神经网络的深度学习能力,自动地提取交通标志的特征,避免了传统的人工特征提取,有效地提高了交通标志识别的效率,具有良好的泛化能力和适应范围。

关键词 :交通标志;识别;卷积神经网络;深度学习

中图分类号:TN911.73?34;TP391.41 文献标识码:A 文章编号:1004?373X(2015)13?0101?06

收稿日期:2015?01?09

基金项目:国家自然科学基金面上项目(61371114)

0 引言

随着智能汽车的发展,道路交通标志的自动识别[1?3]作为智能汽车的基本技术之一,受到人们的高度关注。道路交通标志识别主要包括两个基本环节:首先是交通标志的检测,包括交通标志的定位、提取及必要的预处理;其次是交通标志的识别,包括交通标志的特征提取和分类。

如今,交通标志的识别方法大多数都采用人工智能技术,主要有下述两类形式[4]。一种是采用“人工特征+机器学习”的识别方法,如基于浅层神经网络、支持向量机的特征识别等。在这种方法中,主要依靠先验知识,人工设计特征,机器学习模型仅负责特征的分类或识别,因此特征设计的好坏直接影响到整个系统性能的性能,而要发现一个好的特征,则依赖于研究人员对待解决的问题的深入理解。另一种形式是近几年发展起来的深度学习模型[5],如基于限制波尔兹曼机和基于自编码器的深度学习模型以及卷积神经网络等。在这种方法中,无需构造任何的人工特征,而是直接将图像的像素作为输入,通过构建含有多个隐层的机器学习模型,模拟人脑认知的多层结构,逐层地进行信息特征抽取,最终形成更具推广性和表达力的特征,从而提升识别的准确性。

卷积神经网络作为深度学习模型之一,是一种多层的监督学习神经网络,它利用一系列的卷积层、池化层以及一个全连接输出层构建一个多层的网络,来模仿人脑感知视觉信号的逐层处理机制,以实现视觉特征信号的自动提取与识别。本文将深层卷积神经网络应用于道路交通标志的识别,通过构建一个由二维卷积和池化处理交替组成的6层网络来逐层地提取交通标志图像的特征,所形成的特征矢量由一个全连接输出层来实现特征的分类和识别。实验中将加入高斯噪声、经过位移、缩放和旋转处理的交通标志图像以及实际道路采集交通标志图像分别构成训练集和测试集,实验结果表明,本文所采用的方法具有良好的识别率和鲁棒性。

1 卷积神经网络的基本结构及原理

1.1 深度学习

神经科学研究表明,哺乳动物大脑皮层对信号的处理没有一个显示的过程[5],而是通过信号在大脑皮层复杂的层次结构中的递进传播,逐层地对信号进行提取和表述,最终达到感知世界的目的。这些研究成果促进了深度学习这一新兴研究领域的迅速发展。

深度学习[4,6?7]的目的就是试图模仿人脑感知视觉信号的机制,通过构建含有多个隐层的多层网络来逐层地对信号特征进行新的提取和空间变换,以自动学习到更加有效的特征表述,最终实现视觉功能。目前深度学习已成功地应用到语音识别、图像识别和语言处理等领域。在不同学习框架下构建的深度学习结构是不同的,如卷积神经网络就是一种深度的监督学习下的机器学习模型。

1.2 卷积神经网络的基本结构及原理

卷积神经网络受视觉系统的结构启发而产生,第一个卷积神经网络计算模型是在Fukushima 的神经认知机中提出的[8],基于神经元之间的局部连接和分层组织图像转换,将有相同参数的神经元应用于前一层神经网络的不同位置,得到一种平移不变神经网络结构形式。后来,LeCun 等人在该思想的基础上,用误差梯度设计并训练卷积神经网络[9?10],在一些模式识别任务上得到优越的性能。

卷积神经网络本质上是一种有监督的深度学习算法,无需事先知道输入与输出之间精确的数学表达式,只要用已知的模式对卷积神经网络加以训练,就可以学习到输入与输出之间的一种多层的非线性关系,这是非深度学习算法不能做到的。卷积神经网络的基本结构是由一系列的卷积和池化层以及一个全连接的输出层组成,可以采用梯度下降法极小化误差函数对网络中的权值和阈值参数逐层反向调节,以得到网络权值和阈值的最优解,并可以通过增加迭代次数来提高网络训练的精度。

1.2.1 前向传播

在卷积神经网络的前向传播中,输入的原始图像经过逐层的卷积和池化处理后,提取出若干特征子图并转换成一维特征矢量,最后由全连接的输出层进行分类识别。

在卷积层中,每个卷积层都可以表示为对前一层输入图像的二维卷积和非线性激励函数,其表达式可用式(1)表示:

式中:Yj 表示输出层中第j 个输出;Y l + 1i 是前一层(l + 1层)

的输出特征(全连接的特征向量);n 是输出特征向量的长度;Wij 表示输出层的权值,连接输入i 和输出j ;bj表示输出层第j 个输出的阈值;f (?) 是输出层的非线性

1.2.2 反向传播

在反向传播过程中,卷积神经网络的训练方法采用类似于BP神经网络的梯度最速下降法,即按极小化误差的方法反向传播调整权值和阈值。网络反向传播回来的误差是每个神经元的基的灵敏度[12],也就是误差对基的变化率,即导数。下面将分别求出输出层、池采样层和卷积层的神经元的灵敏度。

(1)输出层的灵敏度

对于误差函数式(6)来说,输出层神经元的灵敏度可表示为:

在前向传播过程中,得到网络的实际输出,进而求出实际输出与目标输出之间的误差;在反向传播过程中,利用误差反向传播,采用式(17)~式(20)来调整网络的权值和阈值,极小化误差;这样,前向传播和反向传播两个过程反复交替,直到达到收敛的要求为止。

2 深层卷积神经网络的交通标志识别方法

2.1 应用原理

交通标志是一种人为设计的具有特殊颜色(如红、黄、白、蓝、黑等)和特殊形状或图形的公共标志。我国的交通标志主要有警告、禁令、指示和指路等类型,一般采用颜色来区分不同的类型,用形状或图形来标示具体的信息。从交通标志设计的角度来看,属于不同类型(不同颜色)的交通标志在形状或图形上有较大的差异;属于相同类型(相同颜色)的标志中同类的指示信息标志在形状或图形上比较接近,如警告标志中的平面交叉路口标志等。因此,从机器视觉的角度来分析,同类型中同类指示信息的标志之间会比不同类型的标志之间更易引起识别错误。换句话说,相比于颜色,形状或图形是正确识别交通标志的关键因素。

因此,在应用卷积神经网络识别交通标志时,从提高算法效率和降低错误率综合考虑,将交通标志转换为灰度图像并作二值化处理后作为卷积神经网络的输入图像信息。图2给出了应用卷积神经网络识别交通标志的原理图。该网络采用了6层交替的卷积层和池采样层来逐层提取交通标志的特征,形成的特征矢量由一个全连接的输出层进行识别。图中:W1i(i=1,2,…,m1),W1(j j=1,2,…,m2),…,W1k(k=1,2,…,m(n?1))分别表示卷积层L1,L3,…,Ln - 1 的卷积核;Input表示输入的交通标志图像;

Pool表示每个池采样层的采样池;map表示逐层提取的特征子图;Y 是最终的全连接输出。

交通标志识别的判别准则为:对于输入交通标志图像Input,网络的输出矢量Y = [y1,y2 ,…,yC ],有yj = Max{y1,y2 ,…,yC},则Input ∈ j,即判定输入的交通标志图像Input为第j 类交通标志。

2.2 交通标志识别的基本步骤

深层神经网络识别交通标志主要包括交通标志的训练与识别,所以将交通标志识别归纳为以下4个步骤:(1) 图像预处理:利用公式Gray= 0.299R +0.587G + 0.114B 将彩色交通标志图像转换为灰度图像,再利用邻近插值法将交通标志图像规格化,最后利用最大类间方差将交通标志图像二值化。

(2)网络权值和阈值的初始化:利用随机分布函数将权值W 初始化为-1~1之间的随机数;而将阈值b 初始化为0。

(3)网络的训练:利用经过预处理的交通标志图像构成训练集,对卷积神经网络进行训练,通过网络前向传播和反向传播的反复交替处理,直到满足识别收敛条件或达到要求的训练次数为止。

(4)交通标志的识别:将实际采集的交通标志图像经过预处理后,送入训练好的卷积神经网络中进行交通标志特征的提取,然后通过一个全连接的网络进行特征分类与识别,得到识别结果。

3 实验结果与分析

实验主要选取了我国道路交通标志的警告标志、指示标志和禁令标志三类中较常见的50幅图像。考虑到在实际道路中采集到的交通标志图像会含有噪声和出现几何失真以及背景干扰等现象,因此在构造网络训练集时,除了理想的交通标志以外,还增加了加入高斯噪声、经过位移、旋转和缩放处理和实际采集到的交通标志图像,因此最终的训练样本为72个。其中,加入的高斯噪声为均值为0,方差分别为0.1,0.2,0.3,图像的位移、旋转、缩放的参数分别随机的分布在±10,±5°,0.9~1.1的范围内。图3给出了训练集中的交通标志图像的示例。图4是在实际道路中采集的交通标志图像构成的测试集的示例。

在实验中构造了一个输入为48×48个神经元、输出为50 个神经元的9 层网络。网络的输入是像素为48 × 48 的规格化的交通标志图像,输出对应于上述的50种交通标志的判别结果。网络的激活函数采用S型函数,如式(2)所示,其输出范围限制在0~1之间。

图6是交通标志的训练总误差EN 曲线。在训练开始的1 500次,误差能迅速地下降,在迭代2 000次以后是一个平稳的收敛过程,当迭代到10万次时,总误差EN可以达到0.188 2。

在交通标志的测试实验中,为了全面检验卷积神经网络的识别性能,分别针对理想的交通标志,加入高斯噪声、经过位移、旋转和比例缩放以及采集的交通标志图像进行实验,将以上测试样本分别送入到网络中识别,表2给出了测试实验结果。

综合分析上述实验结果,可以得到以下结论:(1)在卷积神经网络的训练学习过程中,整个网络的误差曲线快速平稳的下降,体现出卷积神经网络的训练学习具有良好的收敛性。

(2)经逐层卷积和池采样所提取的特征具有比例缩放和旋转不变性,因此对于旋转和比例缩放后的交通标志能达到100%的识别率。

(3)与传统的BP网络识别方法[11]相比较,卷积神经网络能够达到更深的学习深度,即在交通标志识别时能够得到更高的所属类别概率(更接近于1),识别效果更好。

(4)卷积神经网络对实际采集的交通标志图像的识别率尚不能达到令人满意的结果,主要原因是实际道路中采集的交通标志图像中存在着较严重的背景干扰,解决的办法是增加实际采集的交通标志训练样本数,通过网络的深度学习,提高网络的识别率和鲁棒性。

4 结论

本文将深层卷积神经网络应用于道路交通标志的识别,利用卷积神经网络的深层结构来模仿人脑感知视觉信号的机制,自动地提取交通标志图像的视觉特征并进行分类识别。实验表明,应用深层卷积神经网络识别交通标志取得了良好的识别效果。

在具体实现中,从我国交通标志的设计特点考虑,本文将经过预处理二值化的图像作为网络的输入,主要是利用了交通标志的形状信息,而基本略去了颜色信息,其优点是在保证识别率的基础上,可以简化网络的结构,降低网络的计算量。在实际道路交通标志识别中,将形状信息和颜色信息相结合,以进一步提高识别率和对道路环境的鲁棒性,是值得进一步研究的内容。

此外,本文的研究没有涉及到道路交通标志的动态检测,这也是今后可以进一步研究的内容。

参考文献

[1] 刘平华,李建民,胡晓林,等.动态场景下的交通标识检测与识别研究进展[J].中国图象图形学报,2013,18(5):493?503.

[2] SAHA S K,DULAL C M,BHUIYAN A A. Neural networkbased sign recognition [J]. International Journal of ComputerApplication,2012,50(10):35?41.

[3] STALLKAMP J,SCHLIOSING M,SALMENA J,et al. Man vs.computer:benchmarking machine learning algorithms for traf?fic sign recognition [J]. Neural Network,2012,32(2):323?332.

[4] 中国计算机学会.深度学习:推进人工智能梦想[EB/OL].[2013?06?10].http://ccg.org.cn.

[5] 郑胤,陈权崎,章毓晋.深度学习及其在目标和行为识别中的新进展[J].中国图象图形学报,2014,19(2):175?184.

[6] FUKUSHIMA K. Neocognition:a self ? organizing neural net?work model for a mechanism of pattern recognition unaffectedby shift in position [J]. Biological Cybernetics,1980,36(4):193?202.

[7] LECUN Y,BOTTOU L,BENGIO Y,et al. Gradient ? basedlearning applied to document recognition [J]. IEEE Journal andMagazines,1989,86(11):2278?2324.

[8] LECUN Y,BOTTOU L,BENGIO Y,et al. Backpropagationapplied to handwritten zip code recognition [J]. Neural Compu?tation,1989,1(4):541?551.

[9] CIRESAN D,MEIER U,MAsci J,et al. Multi?column deepneural network for traffic sign classification [J]. Neural Net?works,2012,32(2):333?338.

[10] NAGI J,DUCATELLE F,CARO D,et al. Max?pooling con?volution neural network for vision?based hand gesture recogni?tion [C]// 2011 IEEE International Conference on Signal andImage Processing Application. Kuala Lumpur:IEEE,2011,342?347.

[11] 杨斐,王坤明,马欣,等.应用BP神经网络分类器识别交通标志[J].计算机工程,2003,29(10):120?121.

[12] BUVRIE J. Notes on convolutional neural networks [EB/OL].[2006?11?12]. http://cogprints.org/5869/.

[13] 周开利,康耀红.神经网络模型及其Matlab 仿真设计[M].北京:清华大学出版社,2005.

[14] 孙志军,薛磊,许阳明,等.深度学习研究综述[J].计算机应用研究,2012,29(8):2806?2810.

[15] 刘建伟,刘媛,罗雄麟.深度学习研究进展[J].计算机应用研究,2014(7):1921?1930.

作者简介:黄琳(1989—),女,江苏海门人,硕士。研究方向为图像处理与计算机视觉。

图形图像实训总结篇5

关键词:信息与计算科学;实践环节;课程体系

中图分类号:G642文献标识码:A文章编号:1009-3044(2007)16-31163-01

Discussion on the Practical Link Curricular System of Information and Calculation Science in Our University

REN Min-hong, GUO Tian-yin

(Department of Computer Science & Technology,Shaanxi University of Technology, Hanzhong 723003, China)

Abstract:Based on the actual situation of the university,the practical link curricular system of information and calculation science is presented under the principle of combining theory and practice. It conforms with professional specification and our university location and plays a very important role in educating application specialized talented person.

Key words:information and calculation science; practical link; curricular system

1 引言

信息与计算科学专业是1998年国家教育部进行专业改革与调整后增设的新型复合型专业,它由信息科学、计算科学、运筹与控制科学等交叉渗透形成。由于发展时间短,该专业暴露出许多问题,诸如专业定位不明确、课程体系紊乱、实践教学环节不完善等。特别是实践教学环节,哪些课程应该开出实验?开出什么样的实验?应该设立哪些课程设计?设计什么?认识实习应该到什么样的单位实习?生产实习应该到什么样的单位实习?实习什么?这些问题所有开设此专业的院校都在探索实践中。

2 我院信息与计算科学专业实际情况

我院是依托计算机科学与技术系开办此专业的,有着浓厚的工科氛围。在专业建设中充分发挥计算机科学与技术专业的教师资源和实验资源,确定了既符合《信息与计算科学专业教学规范》,又符合我院实际情况的两个专业方向:图形图像处理和信息管理与信息处理。

本专业属理科类专业,总学时2800学时,培养计划中公共课(含两课、基础课、面向学科大类开设的课)必修占49.35%,选修占5%;学科基础课必修占27.85%,选修占4.86%;专业方向课必修占9.29%,选修占3.64%。

3 实践环节课程体系

我院属于二类本科院校,办学定位是扎根秦巴,服务基层。实践环节特别重要,为培养学生动手能力提供了保证。实践环节课程体系的好坏直接关系着“培养应用型人才”目标的实现。信息与计算科学专业的实践环节由课内实验、课程设计、实习和毕业设计等环节构成。

3.1 课内实验

3.1.1 数学类实验

数学类课程有:数学分析、高等代数、空间解析几何、常微分方程、离散数学、复变函数与积分变换、数值分析、运筹学、数据分析。概率论与数理统计开设10学时实验,数值分析开设8学时实验,运筹学开设14学时实验,数据分析开设14学时实验。总计46学时实验,占数学类课程总学时的5.91%。其目的一是通过实验课,掌握常用的数学软件(如Matlab、SAS等)的使用,加深对相关数学概念的理解;二是训练学生用数学工具解决实际问题的能力;三是以相应的数学问题为背景,要求学生自己编写程序,训练学生的算法设计与编程能力。

3.1.2 计算机类实验

计算机类公共课程和学科基础课程有:信息技术基础、C语言程序设计、面向对象的程序设计(VC++)、网站建设与网页设计、数据结构与算法、数据库原理与应用、软件工程、微型计算机原理、网络数据库编程技术、计算机网络原理、编译原理、操作系统。信息技术基础开设40学时实验,C语言程序设计开设20学时实验,面向对象的程序设计(VC++)开设20学时实验,网站建设与网页设计开设24学时实验,数据结构与算法开设24学时实验,数据库原理与应用开设20学时实验, 软件工程开设6学时实验, 微型计算机原理开设20学时实验, 网络数据库编程技术开设28学时实验, 计算机网络原理开设10学时实验,编译原理开设6学时实验, 操作系统开设6学时实验。总计204学时实验,占计算机类公共课程和学科基础课程总学时的35.05%。该类课程实验使学生加深理解计算机类基础课程的基本概念,打好软件设计和开发的基础。

图形图像处理方向课有:信息论与编码、计算智能、数字图像技术、计算机动画设计技术、计算机图形学、静态图像处理工具、数据压缩与存储、OpenGL编程技术、计算机辅助设计技术。信息论与编码开设6学时实验,计算智能开设10学时实验,数字图像技术开设10学时实验,计算机动画设计技术开设20学时实验,计算机图形学开设10学时实验,静态图像处理工具开设10学时实验,数据压缩与存储开设10学时实验,OpenGL编程技术开设10学时实验,计算机辅助设计技术开设10学时实验。总计96学时实验,占图形图像处理方向课总学时的24.24%。该类课程实验培养学生图形图像处理能力。

信息管理与信息处理方向课有:信息论与编码、人工智能、信息系统开发工具、信息系统分析与设计、算法设计与分析、信息系统案例分析、ERP技术、信息管理学基础、信息安全与密码、数据挖掘。信息论与编码开设6学时实验,人工智能开设10学时实验,信息系统开发工具开设20学时实验,信息系统分析与设计开设10学时实验,算法设计与分析开设10学时实验,信息系统案例分析开设10学时实验,ERP技术开设20学时实验,信息管理学基础开设4学时实验,信息安全与密码开设4学时实验,数据挖掘开设4学时实验,总计98学时实验,占图形图像处理方向课总学时的22.48%。该类课程实验培养开发和使用管理信息系统的能力。

3.2 课程设计

课程设计有:数据库开发与设计课程设计、数据分析课程设计、图形图像处理课程设计、信息系统分析与设计课程设计。

数据库开发与设计课程设计进行2周,主要训练学生的数据库设计和开发能力。数据分析课程设计进行2周,主要训练学生数据分析能力和SAS软件的使用能力。图形图像处理课程设计针对图形图像处理方向开设,进行2周,主要训练学生的图形图像处理综合能力。信息系统的分析与设计课程设计针对信息管理与信息处理方向开设,进行2周,主要训练学生的开发和使用管理信息系统的综合能力。

3.3 实习

实习有:认识实习、生产实习。认识实习是对专业知识的认知实习,可选择大中型企业和科研机构作为实习单位,因为大中型企业的信息管理化程度较高,在科研机构可以让学生感受到科学计算的应用和计算机在科学计算中的应用。生产实习是专业实习,也可选择大中型企业和科研机构作为实习单位。在实习中让学生了解企业信息管理系统的运作模式和科学计算的应用。

3.4 其它实践环节

其它实践环节有:军训、计算机技能训练、公益劳动、科研实践、就业实践和毕业设计。

军训是我院各专业都开设的实践环节,一般由学生处负责实施,在第一学期新生报到后进行,进行2周,主要训练学生的军事技能,锻炼学生“不怕苦、不怕累”的精神和毅力。计算机技能训练在第一学期进行,进行1周,主要训练学生的常用软件的使用能力。公益劳动在第二学期第1周进行,可安排一些工农业生产劳动和各种服务性劳动,如植树造林,打扫卫生,帮助烈军属和残疾人等,主要锻炼学生热爱劳动、关心他人的观念。科研实践在第五学期进行,进行2周,主要锻炼学生的科研能力。就业实践在第六学期暑假进行,让学生在暑假里参加人才招聘会,在招聘单位参加专业实习。目的是让学生熟悉招聘环节,锻炼招聘时随机应变的能力。就业实践结束后学生应提交就业实践报告。毕业设计是本科阶段最后一个实践环节,也是比较重要的实践环节,在第八学期进行,进行14周。通过毕业设计,培养学生综合运用所学基础课和专业课的基本理论、基础知识和基本技能,来分析和解决信息和科学计算方面技术问题的能力。巩固、扩大和深化学生在各门课程和各个实践性环节中所学的知识和技能。使学生受到各个方面的综合训练。毕业设计题目一般由指导教师自定,学生根据自己的实际情况选题。

4 试点

文中提出的信息与计算科学专业实践环节课程体系,在我院2003级和2004级中进行了试点,获得了良好的效果。我院信息与计算科学专业从2002年开始招生,2002级采用信息与计算科学专业第一版培养计划,理论多,实践少,也没有专业方向,学生反映实践少,动手能力差,遇到实际问题无从下手,没有专业方向,没有针对性。2003级和2004级采用信息与计算科学专业第二版培养计划,采用文中提出的实践环节课程体系,学生反映较好,普遍认为动手能力得到提高,专业方向明确。

5 结束语

我院的信息与计算科学专业依托计算机科学与技术系开办,工科氛围浓厚,文中提出的信息与计算科学专业实践环节课程体系体现了这一点,也体现了我院的办学定位。当然,该课程体系也存在一些问题和不足,这将在以后的运行中逐步完善。

参考文献:

[1]李林, 曹晓东,等. 一般工科院校信息与计算科学专业建设中的几个问题[J]. 理工高教研究, 2003,22(4):127-128.

[2]郭天印, 任民宏. 关于制定信息与计算科学专业人才培养模式的思考与体会[J]. 大学时代, 2006,(3):103-105.

[3]郭天印, 李金祥. 信息与计算科学专业建设与展望[J]. 教育科学研究(内刊), 2003,30(1):60-64.

[4]罗群, 郭军, 田宝玉, 等. “理工融合”理念下北邮信息与计算科学专业培养方案的制定和实践[J]. 北京邮电大学学报(社会科学), 2004,6(1):68-70.

图形图像实训总结篇6

关键词:地理;复习;对策

中图分类号:G632 文献标识码:B 文章编号:1002-7661(2015)01-252-01

高考取胜在文综,文综取胜在地理。地理学科常常被学生称为“文科中的理科”,是制约文科生在高考中取得高分的瓶颈,也是考生能否进入理想大学的“分水岭”。高考地理考查的内容繁杂,如何在有限的时间里指导学生做到科学复习,提高复习的针对性和时效性,是每位地理教师都应该认真思考和研究的。笔者在教学实践中做了一些积极的尝试,现总结如下:

一、浓缩“精华”,淡化“边缘”,重抓主干知识,做好地理知识的深化与提高

复习时一定要重抓主干知识,把握好复习的重点,对非主干的边缘知识少花时间,少投入精力。

自然地理一直都是地理高考考查的主体,是考生失分的“重灾区”,也是考生能否获得理想分值和进入理想大学的“敲门砖”。建议在自然地理复习中,一些重点基础知识,如地球运动、大气运动、气候、洋流、等值线等内容,地理原理和规律性都较强,复习重点放在对自然地理的成因分析、特征归纳、规律描述上,并配针对性的练习进行训练。

区域地理是地理高考试题的重要载体。区域地理的复习要侧重区域认识方法、区域特征与区域比较、区域空间定位,重点引导学生了解区域的水热位置、范围、地形,然后推理分析得出气候特点,进而得出当地的植被、水文、土壤的分布规律;再通过这些自然特征推导出该区域的农业、工业、人口、城市、国土整治等社会经济特征。从而为自然地理空间过程的理解奠定基本格局,为人文地理及国土整治和区域可持续发展的提供分析、比较的地理背景。比如分析尼罗河流量变化的特点及其变化对农业生产的影响,我们只要把握尼罗河流量的季节变化取决于流域的降水季节变化,取决于流域的气候特点,尼罗河流经热带草原和热带荒漠气候区,流域径流和气候的变化影响流域的农业生产。

人文地理重在典型案例的剖析,案例学习是我们学习人文地理的最好方法,比如人口问题近两年来高考都是考的典型的案例深圳,上海,这个就需要我们在平时的学习中注意这些典型案例的特殊性,比如深圳市是一个人口迁入型城市,青壮年人口所占比重比较大,上海是一个国际化大都市,是我国人口最多的城市,掌握了这些,我们做这类题就容易了。

二、精讲精练、重点突破、构建答题框架,实现知识与能力的相互转换

“一听就懂,一看就会,一做就错”的现象在许多高三学生中普遍存在。为什么会产生这种情况呢?原因就在于考生并未将知识转化为能力。知识是能力的载体,能力的形成必须经过反复的训练,才能实现知识的有效内化与灵活运用。题海战术是很多考生应考的武器,但效果也并不明显。我觉得地理复习切忌片面追求做题的数量,教师千万不能把资料中的整套原题作为学生的练习题,一定要进行优化组合,精选其中有用、有效的题来训练,做一套有价值的“好”题比做10套价值不大的“歪”题更管用、更有效。根据学生的知识结构、能力层次,提倡教师自己改编和创编新题,围绕学生的知识盲点和能力缺陷,设计需要补充的内容和强化训练的重点,还可设置一些“陷阱”让学生跳,让学生在一次次的教训中由“恍然大悟”到“大彻大悟”。创编新题可以从记录学生屡次考试的问题人手,如学生在区域定位方面有缺陷,就多设计区域定位训练题;如学生在区位因素分析方面比较薄弱,就采取案例教学的方式,让学生先学基本的“套路”,再提供“陌生”的区域让学生练习(剖析案例――总结方法――推出新案例――学生训练)。

在复习过程中尽量多设计问题系列,形成组题,尽量延长知识链、拓宽知识面。努力挖掘知识的连接点和再生点,使学生的零散知识变得系统,肤浅的知识变得深刻。力求一题多练,扩展学生的思路,让学生多见新“面孔”(新材料、新图像),感受新变化,训练学生的迁移能力。如等值线的训练,尽量涵盖多种类型,控制好练习题的难度,设置恰当的能力层次,既要防止低层次的重复训练,又要防止高难度的过高标准训练;既要让低分段学生看到“希望”,又要让高分段的学生觉得总有“缺撼”。

三、重视图像、挖掘信息、实现图文转换,培养地理基本思维方法

教学中教师要激发学生的用图兴趣,培养用图习惯,教给学生读图方法,进而培养和锻炼学生的综合思维能力。教师要善于抓住地图教学的契机,引导学生在课堂上进行探究,深层次挖掘教材插图的隐性信息,形成图像分析的基本过程、方法。在复习中要坚持图文结合的原则,教会学生熟练掌握阅读和使用各类地理图像的正确方法,掌握一些地理图像的绘制技巧,加大图文转换、图图转换、图表转换、文表转换的训练力度,提高学生对地理图像信息的获取、综合和处理能力,增强思维的灵活性和变通性,教给学生各类图像的判读步聚和技巧,培养学生图像信息获取能力和读图分析问题的能力,使学生形成良好地理思维品质。

四、规范答题,讲求策略、重视解题技巧,培养考生论证和探讨问题的能力

高考答题是按点给分,因此在复习过程中教师要有意识对学生进行答题训练,通过设计一些经典型例题和案例,采取师生共同“破解”的教学方式,同析同解,共同探索破题的切人点、寻找突破口,形成正确的解题思路,提炼解题方法。通过解一题,得一法,会一类、通一片,让学生触类旁通,“举一反三”。要求学生平时答题时做到:采点广,尽量涵盖到方方面面,力求答案的完整;瞄点准,努力趋近“标准”答案。然后,教师再展示“标准”答案,是否“踩点”或“踩了哪些点”让学生作对比。要特别强化学生对地理问题进行深度分析、全面概括、集中归纳、要点解答、规范描述(层次化、术语化)的摸拟训练。训练学生注意问题的隐性提示(暗示)。

图形图像实训总结篇7

关键词: 交通标志; 识别; 卷积神经网络; 深度学习

中图分类号: TN911.73?34; TP391.41 文献标识码: A 文章编号: 1004?373X(2015)13?0101?06

Abstract: In actual traffic circumstance, the image quality of collected traffic signs is worse due to motion blur, background disturbances, weather conditions, and shooting angle. The higher requirements are proposed for accuracy, robustness and in real?time of traffic signs auto?recognition. In this situation, the traffic signs recognition method based on deep?layer convolution neural network is presented. The method adopts supervised learning model of deep?layer convolution neural network. Taking the collected traffic sign images through binarization as the inputs. The inputs are conducted multilayer process of convolution and pooling?sampling, to simulate hierarchical structure of human brain perception visual signals, and extract the characteristics of the traffic sign images automatically. Traffic signs recognition is realized by using a full connected network. The experimental results show that the method can extract the characteristics of traffic signs automatically by using deep learning ability of the convolution neural network. The method has good generalization ability and adaptive range. By using this method, the traditional artificial feature extraction is avoided, and the efficiency of traffic signs recognition is improved effectively.

Keywords: traffic sign; recognition; convolution neural network; deep learning

0 引 言

随着智能汽车的发展,道路交通标志的自动识别[1?3]作为智能汽车的基本技术之一,受到人们的高度关注。道路交通标志识别主要包括两个基本环节:首先是交通标志的检测,包括交通标志的定位、提取及必要的预处理;其次是交通标志的识别,包括交通标志的特征提取和分类。

如今,交通标志的识别方法大多数都采用人工智能技术,主要有下述两类形式[4]。一种是采用“人工特征+机器学习”的识别方法,如基于浅层神经网络、支持向量机的特征识别等。在这种方法中,主要依靠先验知识,人工设计特征,机器学习模型仅负责特征的分类或识别,因此特征设计的好坏直接影响到整个系统性能的性能,而要发现一个好的特征,则依赖于研究人员对待解决的问题的深入理解。另一种形式是近几年发展起来的深度学习模型[5],如基于限制波尔兹曼机和基于自编码器的深度学习模型以及卷积神经网络等。在这种方法中,无需构造任何的人工特征,而是直接将图像的像素作为输入,通过构建含有多个隐层的机器学习模型,模拟人脑认知的多层结构,逐层地进行信息特征抽取,最终形成更具推广性和表达力的特征,从而提升识别的准确性。

卷积神经网络作为深度学习模型之一,是一种多层的监督学习神经网络,它利用一系列的卷积层、池化层以及一个全连接输出层构建一个多层的网络,来模仿人脑感知视觉信号的逐层处理机制,以实现视觉特征信号的自动提取与识别。本文将深层卷积神经网络应用于道路交通标志的识别,通过构建一个由二维卷积和池化处理交替组成的6层网络来逐层地提取交通标志图像的特征,所形成的特征矢量由一个全连接输出层来实现特征的分类和识别。实验中将加入高斯噪声、经过位移、缩放和旋转处理的交通标志图像以及实际道路采集交通标志图像分别构成训练集和测试集,实验结果表明,本文所采用的方法具有良好的识别率和鲁棒性。

1 卷积神经网络的基本结构及原理

1.1 深度学习

神经科学研究表明,哺乳动物大脑皮层对信号的处理没有一个显示的过程[5],而是通过信号在大脑皮层复杂的层次结构中的递进传播,逐层地对信号进行提取和表述,最终达到感知世界的目的。这些研究成果促进了深度学习这一新兴研究领域的迅速发展。

深度学习[4,6?7]的目的就是试图模仿人脑感知视觉信号的机制,通过构建含有多个隐层的多层网络来逐层地对信号特征进行新的提取和空间变换,以自动学习到更加有效的特征表述,最终实现视觉功能。目前深度学习已成功地应用到语音识别、图像识别和语言处理等领域。在不同学习框架下构建的深度学习结构是不同的,如卷积神经网络就是一种深度的监督学习下的机器学习模型。

1.2 卷积神经网络的基本结构及原理

卷积神经网络受视觉系统的结构启发而产生,第一个卷积神经网络计算模型是在Fukushima的神经认知机中提出的[8],基于神经元之间的局部连接和分层组织图像转换,将有相同参数的神经元应用于前一层神经网络的不同位置,得到一种平移不变神经网络结构形式。后来,LeCun等人在该思想的基础上,用误差梯度设计并训练卷积神经网络[9?10],在一些模式识别任务上得到优越的性能。

卷积神经网络本质上是一种有监督的深度学习算法,无需事先知道输入与输出之间精确的数学表达式,只要用已知的模式对卷积神经网络加以训练,就可以学习到输入与输出之间的一种多层的非线性关系,这是非深度学习算法不能做到的。卷积神经网络的基本结构是由一系列的卷积和池化层以及一个全连接的输出层组成,可以采用梯度下降法极小化误差函数对网络中的权值和阈值参数逐层反向调节,以得到网络权值和阈值的最优解,并可以通过增加迭代次数来提高网络训练的精度。

1.2.1 前向传播

在卷积神经网络的前向传播中,输入的原始图像经过逐层的卷积和池化处理后,提取出若干特征子图并转换成一维特征矢量,最后由全连接的输出层进行分类识别。

在卷积层中,每个卷积层都可以表示为对前一层输入图像的二维卷积和非线性激励函数,其表达式可用式(1)表示:

[Ylj=f i=1Ml-1Yl-1i?Wlij+blj] (1)

式中:[Ylj]是第l层中第[j]个卷积特征子图的输出;[Ml-1]是前一层([l-1]层)的输出[Yl-1j]的总数;[Wlij]是第[l]层中第[j]个卷积的权值;[blj]是第[l]层中第[j]个卷积的阈值;符号“*”表示二维卷积运算;[f(?)]是非线性激励函数,其表达式如下:

[f(x)=11+e-x] (2)

式中:[x]是函数的输入。对于一幅[Nl-1x*Nl-1y] 的输入图像[Yl-1i]和[Klx*Kly]的卷积权值[Wlij,]输出[Ylj]的大小为[Nl-1x-Klx+1,Nl-1y-Kly+1。]

在池采样层中,每个池采样层通过一个非重叠的[kx×ky]矩形区对上一卷积层输出的特征子图进行采样(求矩形区内像素的均值或最大值)。经过池采样后输出的特征子图在两个维度上分别缩小[kx]和[ky]倍,其表达式为:

[Yl+1j=down(Ylj)] (3)

式中:[Yl+1j]表示第[l+1]层中第[j]个池采样的输出;[Ylj]是前一层(l层)的输出特征子图;down()实现对[Ylj]的池采样。图1给出了上述卷积和池采样的示意图。

在输出层中,首先利用一个全连接层将输入的特征子图转换为一个一维的特征矢量,然后再应用一个BP神经网络完成特征矢量的分类识别。BP神经网络输出层的每一个神经元的输出值对应于输入图像所属不同交通标志图像的概率,表达式为:

[Yj=fi=1nWij×Yl+1i+bj] (4)

式中:[Yj]表示输出层中第[j]个输出;[Yl+1i]是前一层([l+1]层)的输出特征(全连接的特征向量);[n]是输出特征向量的长度;[Wij]表示输出层的权值,连接输入[i]和输出[j];[bj]表示输出层第[j]个输出的阈值;[f(?)]是输出层的非线性激活函数。

对于一个有[C]种不同的交通标志和共计[N]个样本的情况,整个网络的误差平方代价函数[11]为:

[EN=12n=1Nk=1Ctnk-ynk2=12n=1NTn-Yn2] (5)

式中:[T=[t1, t2, …, tC]]为网络的理想输出目标矢量;[Y=[y1, y2, …, yC]]为网络的实际输出矢量;[tk=0,1,][yk∈[0,1],][k=1,2,…,C。]

当只考虑第[n]个单个样本时,网络的误差平方代价函数可以表示为:

[En=12k=1Ctnk-ynk2=12Tn-Yn2] (6)

1.2.2 反向传播

在反向传播过程中,卷积神经网络的训练方法采用类似于BP神经网络的梯度最速下降法,即按极小化误差的方法反向传播调整权值和阈值。网络反向传播回来的误差是每个神经元的基的灵敏度[12],也就是误差对基的变化率,即导数。下面将分别求出输出层、池采样层和卷积层的神经元的灵敏度。

(1) 输出层的灵敏度

对于误差函数式(6)来说,输出层神经元的灵敏度可表示为:

[δ=-fu×T-Y] (7)

[u=W×Yl+1+b] (8)

式中:[T]表示目标输出;[Y]表示网络的实际输出;[Yl+1]表示上一层(池采样层)的输出;[W,b]分别是输出层的权值和阈值。那么输出层的权值和阈值的导数为:

[?E?W=Yl+1×δT] (9)

[?E?b=δ] (10)

(2) 池采样层的灵敏度

池采样层没有权值和阈值,所以不存在权值和阈值的导数,只需要求出该层的灵敏度。

① 若池采样层的下一层为全连接的输出层,那么池采样层的灵敏度为:

[δl+1i=WijTδj] (11)

式中:[δil+1]表示输出层的第[j]个灵敏度;[Wij]表示输出层的权值。

② 若池采样层的下一层是卷积层,那么假设第[l+1]层为池采样层,第[l+2]层为卷积层,且卷积层的灵敏度为[δl,]有[M]个特征图。第[l+1]层中的每个特征的灵敏度等于第[l+2]层所有特征核的贡献之和,那么池采样层的灵敏度为:

[δl+1i=j=1Mδl+2j?Wl+2ij] (12)

式中:“[?]”表示卷积;[δil]表示第[l]层第[i]个特征映射的灵敏度;[δjl+1]表示第[l+1]层第[j]个特征映射的灵敏度;[Wl+1ij]表示第[l+1]层的权值,连接第[i]个特征灵敏度与第[j]个特征灵敏度。

(3) 卷积层的灵敏度

假设第[l]层为卷积层,第[l+1]层为池采样层,且池采样层的灵敏度为[δl+1,]那么卷积层的灵敏度为:

[δlj=up((δl+1j))] (13)

[up(δl+1j)δl+1j?1kx×ky] (14)

式中:up(・)表示池采样第[l+1]层的灵敏度特征映射;[δjl]表示第[l]层第[j]个特征映射的灵敏度;[δjl+1]表示第[l+1]层第[j]个特征映射的灵敏度;[kx×ky]表示采样池的大小。

现在对于一个给定的特征映射,就可以计算出卷积层的权值和阈值的导数:

[?E?Wlij=u,v(δlj)uv(Yl-1i)uv] (15)

[?E?blj=u,v(δlj)u,v] (16)

式中:[Yl-1i]是第[l-1]层与权值[Wlij]作卷积的特征映射;输出卷积映射的[(u,v)]位置的值是由第[l-1]层的[(u,v)]位置的特征映射与权值[Wlij]卷积的结果。

1.3 网络权值和阈值的调整

所有层的权值和阈值的导数都可以用上述方法求得,然后再依据梯度下降法[13]调整权值和阈值,如下:

[ΔWijk+1=ηΔWijk+α(1-η)?E?Wijk] (17)

[Wijk+1=Wijk+ΔWij(k+1)] (18)

[Δbjk+1=ηΔbjk+α(1-η)?E?bjk] (19)

[bjk+1=bjk+Δbj(k+1)] (20)

其中:[k]表示迭代次数;[ΔWij,][Δbj]分别表示权值和阈值的调整值;[Wij,][bj]分别表示权值和阈值调整后的值;[α]为学习效率;[η]为动量因子。

在前向传播过程中,得到网络的实际输出,进而求出实际输出与目标输出之间的误差;在反向传播过程中,利用误差反向传播,采用式(17)~式(20)来调整网络的权值和阈值,极小化误差;这样,前向传播和反向传播两个过程反复交替,直到达到收敛的要求为止。

2 深层卷积神经网络的交通标志识别方法

2.1 应用原理

交通标志是一种人为设计的具有特殊颜色(如红、黄、白、蓝、黑等)和特殊形状或图形的公共标志。我国的交通标志主要有警告、禁令、指示和指路等类型,一般采用颜色来区分不同的类型,用形状或图形来标示具体的信息。从交通标志设计的角度来看,属于不同类型(不同颜色)的交通标志在形状或图形上有较大的差异;属于相同类型(相同颜色)的标志中同类的指示信息标志在形状或图形上比较接近,如警告标志中的平面交叉路口标志等。因此,从机器视觉的角度来分析,同类型中同类指示信息的标志之间会比不同类型的标志之间更易引起识别错误。换句话说,相比于颜色,形状或图形是正确识别交通标志的关键因素。

因此,在应用卷积神经网络识别交通标志时,从提高算法效率和降低错误率综合考虑,将交通标志转换为灰度图像并作二值化处理后作为卷积神经网络的输入图像信息。图2给出了应用卷积神经网络识别交通标志的原理图。该网络采用了6层交替的卷积层和池采样层来逐层提取交通标志的特征,形成的特征矢量由一个全连接的输出层进行识别。图中:[W1i](i=1,2,…,m1),W1j(j=1,2,…,m2),…,[W1k](k=1,2,…,m(n?1))分别表示卷积层[L1,L3,…,Ln-1]的卷积核;Input表示输入的交通标志图像;Pool表示每个池采样层的采样池;map表示逐层提取的特征子图;[Y]是最终的全连接输出。

交通标志识别的判别准则为:对于输入交通标志图像Input,网络的输出矢量[Y=[y1,y2,…,yC],]有[yj=Max{y1,][y2,…,yC},]则[Input∈j,]即判定输入的交通标志图像Input为第[j]类交通标志。

2.2 交通标志识别的基本步骤

深层神经网络识别交通标志主要包括交通标志的训练与识别,所以将交通标志识别归纳为以下4个步骤:

(1) 图像预处理:利用公式Gray=[0.299R+][0.587G+0.114B]将彩色交通标志图像转换为灰度图像,再利用邻近插值法将交通标志图像规格化,最后利用最大类间方差将交通标志图像二值化。

(2) 网络权值和阈值的初始化:利用随机分布函数将权值[W]初始化为-1~1之间的随机数;而将阈值[b]初始化为0。

(3) 网络的训练:利用经过预处理的交通标志图像构成训练集,对卷积神经网络进行训练,通过网络前向传播和反向传播的反复交替处理,直到满足识别收敛条件或达到要求的训练次数为止。

(4) 交通标志的识别:将实际采集的交通标志图像经过预处理后,送入训练好的卷积神经网络中进行交通标志特征的提取,然后通过一个全连接的网络进行特征分类与识别,得到识别结果。

3 实验结果与分析

实验主要选取了我国道路交通标志的警告标志、指示标志和禁令标志三类中较常见的50幅图像。考虑到在实际道路中采集到的交通标志图像会含有噪声和出现几何失真以及背景干扰等现象,因此在构造网络训练集时,除了理想的交通标志以外,还增加了加入高斯噪声、经过位移、旋转和缩放处理和实际采集到的交通标志图像,因此最终的训练样本为72个。其中,加入的高斯噪声为均值为0,方差分别为0.1,0.2,0.3,图像的位移、旋转、缩放的参数分别随机的分布在±10,±5°,0.9~1.1的范围内。图3给出了训练集中的交通标志图像的示例。图4是在实际道路中采集的交通标志图像构成的测试集的示例。

在实验中构造了一个输入为48×48个神经元、输出为50个神经元的9层网络。网络的输入是像素为[48×48]的规格化的交通标志图像,输出对应于上述的50种交通标志的判别结果。网络的激活函数采用S型函数,如式(2)所示,其输出范围限制在0~1之间。

表1给出网络的结构参数,包括每一层的特征数、神经元数、卷积核尺寸和均值采样尺寸等。

图5给出一幅交通标志图像在卷积层和均值采样层的特征子图的示例。

图6是交通标志的训练总误差[EN]曲线。在训练开始的1 500次,误差能迅速地下降,在迭代2 000次以后是一个平稳的收敛过程,当迭代到10万次时,总误差[EN]可以达到0.188 2。

在交通标志的测试实验中,为了全面检验卷积神经网络的识别性能,分别针对理想的交通标志,加入高斯噪声、经过位移、旋转和比例缩放以及采集的交通标志图像进行实验,将以上测试样本分别送入到网络中识别,表2给出了测试实验结果。

综合分析上述实验结果,可以得到以下结论:

(1) 在卷积神经网络的训练学习过程中,整个网络的误差曲线快速平稳的下降,体现出卷积神经网络的训练学习具有良好的收敛性。

(2) 经逐层卷积和池采样所提取的特征具有比例缩放和旋转不变性,因此对于旋转和比例缩放后的交通标志能达到100%的识别率。

(3) 与传统的BP网络识别方法[11]相比较,卷积神经网络能够达到更深的学习深度,即在交通标志识别时能够得到更高的所属类别概率(更接近于1),识别效果更好。

(4) 卷积神经网络对实际采集的交通标志图像的识别率尚不能达到令人满意的结果,主要原因是实际道路中采集的交通标志图像中存在着较严重的背景干扰,解决的办法是增加实际采集的交通标志训练样本数,通过网络的深度学习,提高网络的识别率和鲁棒性。

4 结 论

本文将深层卷积神经网络应用于道路交通标志的识别,利用卷积神经网络的深层结构来模仿人脑感知视觉信号的机制,自动地提取交通标志图像的视觉特征并进行分类识别。实验表明,应用深层卷积神经网络识别交通标志取得了良好的识别效果。

在具体实现中,从我国交通标志的设计特点考虑,本文将经过预处理二值化的图像作为网络的输入,主要是利用了交通标志的形状信息,而基本略去了颜色信息,其优点是在保证识别率的基础上,可以简化网络的结构,降低网络的计算量。在实际道路交通标志识别中,将形状信息和颜色信息相结合,以进一步提高识别率和对道路环境的鲁棒性,是值得进一步研究的内容。此外,本文的研究没有涉及到道路交通标志的动态检测,这也是今后可以进一步研究的内容。

参考文献

[1] 刘平华,李建民,胡晓林,等.动态场景下的交通标识检测与识别研究进展[J].中国图象图形学报,2013,18(5):493?503.

[2] SAHA S K, DULAL C M, BHUIYAN A A. Neural network based sign recognition [J]. International Journal of Computer Application, 2012, 50(10): 35?41.

[3] STALLKAMP J, SCHLIOSING M, SALMENA J, et al. Man vs. computer: benchmarking machine learning algorithms for traffic sign recognition [J]. Neural Network, 2012, 32(2): 323?332.

[4] 中国计算机学会.深度学习:推进人工智能梦想[EB/OL].[2013?06?10].http://.cn.

[5] 郑胤,陈权崎,章毓晋.深度学习及其在目标和行为识别中的新进展[J].中国图象图形学报,2014,19(2):175?184.

[6] FUKUSHIMA K. Neocognition: a self?organizing neural network model for a mechanism of pattern recognition unaffected by shift in position [J]. Biological Cybernetics, 1980, 36(4):193?202.

[7] LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient?based learning applied to document recognition [J]. IEEE Journal and Magazines, 1989, 86(11): 2278?2324.

[8] LECUN Y, BOTTOU L, BENGIO Y, et al. Backpropagation applied to handwritten zip code recognition [J]. Neural Computation, 1989, 1(4) : 541?551.

[9] CIRESAN D, MEIER U, MASCI J, et al. Multi?column deep neural network for traffic sign classification [J]. Neural Networks, 2012, 32(2): 333?338.

[10] NAGI J, DUCATELLE F, CARO D, et al. Max?pooling convolution neural network for vision?based hand gesture recognition [C]// 2011 IEEE International Conference on Signal and Image Processing Application. Kuala Lumpur: IEEE, 2011, 342?347.

[11] 杨斐,王坤明,马欣,等.应用BP神经网络分类器识别交通标志[J].计算机工程,2003,29(10):120?121.

[12] BUVRIE J. Notes on convolutional neural networks [EB/OL]. [2006?11?12]. http:///5869/.

[13] 周开利,康耀红.神经网络模型及其Matlab仿真设计[M].北京:清华大学出版社,2005.

[14] 孙志军,薛磊,许阳明,等.深度学习研究综述[J].计算机应用研究,2012,29(8):2806?2810.

图形图像实训总结篇8

关键词:学习方法 创造性思维 图象图景教学

在教学中很多学生反映高中物理一学就会、一用就错、一放就忘,学生对所学知识了解不深刻、掌握不全面,已经习惯了程序化的模式,习惯于简化了的物理对象及物理模型,习惯于抽象的逻辑推理及数学运算,而遇到实际问题就束手无策。针对这种现象,我认为应该对学生在学习心理上加强疏导,在学习方法上加强指导,在教学方法上加强研究,发展学生的创造性思维,使学生想象得出情景、找得到突破口,提高学生解决问题的应用能力。

具体来说,要做到以下几点:

一、加强学法指导,培养自学能力

1.指导学生阅读教材。

阅读物理课本应潜心研读,挖掘提炼,包括课本中的图像、插图、阅读材料、注释都不放过。更重要的是要边读边思考,对重要内容要反复推敲,对重要概念和规律要在理解的基础上熟练记忆。

2.指导学生听课。

上课时要全神贯注听教师的讲解、听同学的发言,要边听边想、边听边忆。要注意听各知识点间的相互联系,听公式、定律的适用范围,听解题的方法和思路,还要动手做好笔记。

3.指导学生课后及时归纳总结。

总结要抓住知识主线,抓住重点、难点和关键,抓住典型问题的解答方法和思路。

二、发展学生的创造性思维

创造思维的核心是发散思维,物理教学中要注重概念、推理、判断等一系列逻辑思维过程的分析,在潜移默化中提高学生的逻辑思维能力。尽管物理学中的概念通常很抽象,但是通过巧妙的构思可以化抽象为形象。

例如:烧杯中盛的是水,水中漂浮着一个小盒,盒中有铜、木两个小球,把铜球放入水中,水面怎样变化?把木球放入水中,水面又会怎样变化?为了培养学生的发散思维能力,我进一步提出了几个问题:如果烧杯的水面上漂浮着一块冰,当冰完全融化后,水面怎样变化?如果冰中有气泡,冰融化后,水面怎样变化?如冰中有一石块,冰融化后,水面怎样变化?如果冰漂浮在盐水面上,冰融化后,水面又怎样变化?通过上述习题训练使学生加深了对知识的理解,提高了思维能力。

三、重视图像图景教学的策略

在物理教学中必须重视图像图景的教学,加强学生应用能力的培养,提高解决实际问题的能力,加强抽象的物理规律与形象的实际情境的紧密联系,提高学习的效率,更好地掌握所学知识。

1、充分展示知识发生发展的过程,帮助学生建立准确的物理模型。

要充分利用实验、图形图片、电视录像、多媒体课件等手段再现知识发生、发展的变化过程,用图文并茂的方式向学生提供信息,降低学生学习的难度,并将物理学研究问题的方法和物理思想寓于情境的建立和分析过程中,促进学生开展分析问题的思维活动,自然地“悟”出其中的道理和规律,从而潜移默化,使学生掌握分析物理过程、建立正确的物理情境和模型的方法,建立准确的物理模型。

2、重视解决实际问题的思维程序训练和学生学习习惯的培养。

解决实际问题的思维程序大体可分六步,即“审题文字信息(排除干扰因素)抽象出物理对象和物理情境寻找问题所满足的定量和定性的规律建立模型求解”。

第一步,从实际问题中提取与问题有关的文字信息,并用相应的图形或符号表示,使复杂的变化过程代码化。

第二步,确定物理对象,建立物理情境,运用示意图帮助理解题意,寻找变化规律,建立各物理量的联系。要边审题、边画图,并一一把条件和问题用字母符号注在图上,使问题能在脑中形成完整的表象,不致于因忘记条件或问题而中断解题过程的思维去重新审题。同时,示意图能使解答问题所必需的条件同时呈现在视野内,图像成为思维的载体,视图凝思实际上是视觉思维参与了解题的过程。

再后建立模型关系,立式求解。

实际上,由文字到示意图的思维跨度非常大,因此在教学方法和学生学习方法指导上,应加强图像图景的教学。一方面,在平时教学中,要重视教学中示意图画法的训练,教会学生如何通过审题画示意图,从易到难,逐步消除思维障碍。这一过程教师不得包办代替学生的思维过程。另一方面,在学生的学习练习过程中,要重视画图习惯的培养。画图习惯的培养需要一个过程,从严要求,形成习惯。同时要重视课本插图的观察和思考。新教材的图片更为丰富,要注意指导学生如何画图、看图,建立文字和图像的联系,养成读图释义、审题画图的习惯,不断训练学生的物理形象思维和抽象思维,建立正确的物理模型,这是提高学生解决实际问题能力的有效教学策略。

上一篇:电路设计实训总结范文 下一篇:砌筑抹灰实训总结范文