计算机视觉总结范文

时间:2023-12-18 16:27:56

计算机视觉总结

计算机视觉总结篇1

关键词:图像处理 计算机视觉 立体视觉

在实际工程实践中,由于受现场条件和测试技术本身的限制,结构动位移的测试往往存在一定的困难和挑战,这也使动位移并未成为结构动力性能评估中一个常见的评估指标。结构动位移响应是直接反映结构在动力荷载作用下安全性和整体性的重要参考指标。随着工程结构或构件建造得越来越柔和复杂结构模型试验研究的发展,如大跨度桥梁、高层建筑、索结构等的现场测试以及结构振动台试验、风洞试验等,结构动位移的测试显得尤为重要。

计算机视觉是研究计算机模拟生物外显或宏观视觉功能的科学与技术,是一个发展十分迅速的研究领域,其研究手段涉及甚广,如图像处理、机器视觉、医学图像分析、模式识别、计算机图形学、人工智能等。当计算机通过视觉传感器(比如相机或摄像机等)试图分析三维空间的物体时通常只能给出二维图像,通过计算机分析和处理图像信息,可以重构实物的三维几何信息,包括其形状、位置、姿态、运动等。因此,通过计算机视觉技术实现结构动位移的测量是可行的。上世纪八十年代中期以来,随着计算机软、硬件技术的不断发展,在土木工程领域,国内外很多学者尝试将计算机视觉技术用于结构的几何测试,包括结构的位移(静、动位移)、裂缝、表观外形等。Aw和Koo采用数码照相机来进行预设目标的坐标测量,经过基于计算机视觉理论的光束法优化后,其测试精度为2.24mm。Nieder?st和Maas利用数码摄像机来测试混凝土梁在脱水收缩过程中的变形情况,其在相机视场为80cm时测试精度可达0.03mm。相类似地将计算机视觉技术用于结构特性的测量例子还有很多,比如混凝土管片变形检测,梁破坏试验中的变形测量,远距离桥梁变形测量,轨道梁破损状况的检测等。相比于结构静态几何特性的测试,结构动态特性的测试应用相对不多。Olaszek利用摄像机来摄录桥梁的振动情况,并以计算机视觉技术进行结构动位移重构分析,得出的动位移测试精度为1mm左右。Yoshida等采用立体视觉技术来测试一块薄板的三维振动特性。

一、单相机标定

二、基于立体视觉的两相机立体标定

三、图像点跟踪

图像点跟踪是基于立体视觉的结构位移测试手段中的重要环节。在图像(或视频)分析过程中,点跟踪的精度会直接影响位移测试的最终结果。在实际测试中,本文采用两个黑方格组成的目标模板粘贴在所测结构的表面,方格尺寸均为30×30mm,两方格的交叉角点作为图像分析的跟踪点。

四、三维点重构

针对本文采用的两相机位移测试手段,在两相机的所有标定参数和所拍摄的图像跟踪点都确定完成后,最后一个重要环节就是三维点重构,即得到实测结构上目标点的三维坐标值。三维点重构可采用计算机视觉中的非线性三角测量法进行。

计算机视觉总结篇2

关键词:计算机;视觉技术;交通工程

中图分类号:TP391 文献标识码:A 文章编号:1674-7712 (2014) 04-0000-01

一、引言

随着科技的发展,计算机替代人的视觉与思维已经成为现实,这也是计算机视觉的突出显现。那么在物体图像中识别物体并作进一步处理,是客观世界的主观反应。在数字化图像中,我们可以探寻出较为固定的数字联系,在物体特征搜集并处理时做到二次实现。这既是对物体特征的外在显现与描绘,更是对其定量信息的标定。从交通工程领域的角度来看,该种技术一般应用在交管及安全方面。监控交通流、识别车况及高速收费都是属于交通管理的范畴;而对交通重大事件的勘察及甄别则是交通安全所属。在这个基础上,笔者对计算机视觉系统的组成及原理进行了分析,并形成视觉处理相关技术研究。

二、设计计算机视觉系统构成

计算机视觉处理技术的应用是建立在视觉系统的建立基础上的。其内部主要的构成是计算机光源、光电转换相关器件及图像采集卡等元件。

(一)照明条件的设计。在测量物体的表征时,环境的创设是图像分析处理的前提,其主要通过光线反射将影像投射到光电传感器上。故而要想获得清晰图像离不开照明条件的选择。在设计照明条件时,我们通常会视具体而不同处理,不过总的目标是一定的,那就是要利于处理图像及对其进行提取分析。在照明条件的设定中,主动视觉系统结构光是较为典型的范例。

(二)数据采集的处理。如今电耦合器件(CCD)中,摄像机及光电传感器较为常见。它们输出形成的影像均为模拟化的电子信号。在此基础上,A模式与D模式的相互对接更能够让信号进入计算机并达到数字处理标准,最后再量化入计算机系统处理范围。客观物体色彩的不同,也就造就了色彩带给人信息的差异。一般地黑白图像是单色摄像机输入的结果;彩色图像则需要彩色相机来实现。其过程为:彩色模拟信号解码为RGB单独信号,并单独A/D转换,输出后借助色彩查找表来显示相应色彩。每幅图像一旦经过数字处理就会形成点阵,并将n个信息浓缩于每点中。彩色获得的图像在16比特,而黑白所获黑白灰图像则仅有8比特。故而从信息采集量上来看,彩色的图像采集分析更为繁复些。不过黑白跟灰度图像也基本适应于基础信息的特征分析。相机数量及研究技法的角度,则有三个分类:“单目视觉”、“双目”及“三目”立体视觉。

三、研究与应用计算机视觉处理技术

从对图像进行编辑的过程可以看出,计算机视觉处理技术在物体成像及计算后会在灰度阵列中参杂无效信息群,使得信息存在遗失风险。成像的噪声在一定程度上也对获取有效信息造成了干扰。故而,处理图像必须要有前提地预设分析,还原图像本相,从而消去噪音。边缘增强在特定的图像变化程度中,其起到的是对特征方法的削减。基于二值化,分割图像才能够进一步开展。对于物体的检测多借助某个范围来达到目的。识别和测算物体一般总是靠对特征的甄别来完成的。

四、分析处理三维物体技术

物体外轮扩线及表面对应位置的限定下,物体性质的外在表现则是其形状。三维物体从内含性质上来看也有体现,如通过其内含性质所变现出来的表层构造及边界划定等等。故而在确定图像特征方面,物体的三维形态是最常用的处理技术。检测三维物体形状及分析距离从计算机视觉技术角度来看,渠道很多,其原理主要是借助光源特性在图像输入时的显现来实现的。其类别有主动与被动两类。借助自然光照来对图像获取并挖掘深入信息的技术叫做被动测距;主动测距的光源条件则是利用人为设置的,其信息也是图像在经过测算分析时得到的。被动测距的主要用途体现在军工业保密及限制环境中,而普通建筑行业则主要利用主动测距。特别是较小尺寸物体的测算,以及拥有抗干扰及其他非接触测距环境。

(一)主动测距技术。主动测距,主要是指光源条件是在人为创设环境中满足的,且从景物外像得到相关点化信息,可以适当显示图像大概并进行初步分析处理,以对计算适应功率及信息测算程度形成水平提高。从技术种类上说,主动测距技术可分为雷达取像、几何光学聚焦、图像干扰及衍射等。除了结构光法外的测量方法均为基于物理成像,并搜集所成图像,并得到特殊物理特征图像。从不同的研究环境到条件所涉,以结构光法测量作为主要技术的工程需求较为普遍,其原理为:首先在光源的设计上由人为来进行环境考虑测算,再从其中获取较为全面的离散点化信息。在离散处理后,此类图像已经形成了较多的物体真是特征表象。在此基础上,信息需要不断简化与甄别、压缩。如果分析整个物体特征信息链,则后期主要体现在对于数据的简化分析。如今人们已经把研究的目光转向了结构光测量方法的应用,体现在物体形状检测等方面。

(二)被动测距技术。被动测距,对光照条件的选择具有局限性,其主要通过对于自然光的覆盖得以实现。它在图像原始信息处理及分析匹配方面技术指向较为突出。也通过此三维物体之形状及周围环境深度均被显露。在图像原始信息基础上的应用计算,其与结构光等相比繁杂程度较高。分析物体三维特性,着重从立体视觉内涵入手,适应物体自身特点而存在。不过相对来说获得图像特征才是其适应匹配的条件保障。点、线、区域及结构纹理等是物象特征的主体形式。其中物特较为基础与原始的特征是前两个特征,同时它们也是其他相关表征的前提。计算机系统技术测量基本原理为对摄像机进行构建分析,并对其图像表征进行特征匹配,以得到图像不同区间的视觉差异。

五、结束语

通过对计算机视觉技术的研究,悉知其主要的应用领域及技术组成。在系统使用的基础上深入设计,对系统主要构成环节进行分析。从而将三维复杂形态原理、算法及测量理论上升到实际应用。随着社会对于计算机的倚赖程度增加,相信该技术在建筑或者其他领域会有更加深入的研究及应用。

参考文献:

[1]段里仁.智能交通系境在我国道路空通管理中的应用[J].北方工业时报,2012(06).

[2]王丰元.计算机视觉在建筑区间的应用实例分析[J].河北电力学报,2011(04).

[3]李钊称.主动测距技术在计算机数据分析中的作用探析[J].计算机应用,2010(08).

计算机视觉总结篇3

关键词:双目立体视觉;区域相关;立体匹配;标准测试图

中图分类号:TP391文献标识码:A

文章编号:1004-373X(2009)12-068-03

Improvement of Regional Related Match Algorithm for

Binocular Stereo Vision and Its Implementation

HE Renjie

(Electronics and Information School,Northwestern Polytechnical University,Xi′an,710129,China)

Abstract:Match algorithm is one of key techniques in the binocular stereo vision system.The similarity functions,the regional related match algorithms for Binocular stereo vision are discussed and the algorithmic complexity is analyzed.Moreover,a new improved regional related match algorithm by sliding pattern plate is proposed to decrease the matching time and a test software is designed by using VC++ and OPEN-CV.A number of experiments are carried out through the two-camera system and the standard test images as well as practical sense images.The analytical and experimental results show that the improved method is effective and its matching time is decreased greatly.

Keywords:binocular stereo vision;regional related;stereo match;standard test image

0 引 言

立体视觉是计算机视觉的一个重要分支,主要研究如何借助成像技术从图像中获取场景中物体的三维信息[1-3] 。立体视觉的基本方法是从两个或者多个视点去观察同一场景,获得在不同视角下的一组图像;然后通过三角测量原理获得不同图像中对应像素间的视差,并从中获得深度信息,进而与平面信息整合形成立体图像。立体匹配是立体视觉算法中最重要也是最困难的部分。

根据匹配基元的不同,现有的立体匹配方法可大致分为三类:基于特征的匹配[4,5],基于区域的匹配[6]和基于相位的匹配[7]。

本文重点研究双目视觉立体匹配中基于区域的局部匹配算法,对基于SAD(Sum of Absolute Difference)的区域匹配算法通过模板滑动进行了改进。经分析和多次实验结果表明,该改进算法具有有效性和快速性。

1 双目立体视觉区域局部匹配的理论基础

1.1 相似性测度函数

匹配算法的实质就是估计待匹配点和候选匹配点之间的相似性程度,评价这种相似性程度度量方法有多种。由于单个像素点所包含的信息太少,因而只依据单个像素点是的信息建立度量方法可靠性较差。为了提高相似性度量方法的可靠性,一般需要在匹配点上的一个小邻域内的像素点集合中进行。

表1列出了目前几种主要的相似性测度函数[6]。其中,IL(x,y),IR(x,y)分别代表左右图像中像素坐标(x,y)处的灰度值;IL(x,y),IR(x,y)分别表示左右图中以坐标(x,y)为中心,在窗口范围U内像素灰度的平均值。由于SAD相似性测度函数在时间以及匹配质量方面较其他测度函数更具有优势,且实现较简单[8]。这里研究选择SAD作为局部相关匹配算法的相似性测度函数。

1.2 局部相关匹配算法原理

局部相关匹配算法是以基准图像中待匹配点为中心像素来创建一个大小为n×n的矩形窗,由该窗口内的像素灰度分布来表征该像素。在第二幅图像中,沿极线在视差范围内取出与基准点邻域同样大小为n×n的像素邻域,依次与匹配点的窗口进行比较,最大相似性对应的点就是最佳匹配。整个匹配过程如图1所示。

表1 几种相似性测度函数

名称公式

SAD∑(i,j)∈U|IL(x+i,y+j)-IR(x+dx+i,y+j)|

ZSAD∑(i,j)∈U|[IL(x+i,y+j)-IR(x,y)]-

[IR(x+dx+i,y+j)-IR(x+dx,y)]|

SSD∑(i,j)∈U[IL(x+i,y+j)-IR(x+dx+i,y+j)]2

ZSSD∑(i,j)∈U[IL(x+i,y+j)-IL(x,y)]-

[IR(x+dx+i,y+j)-IR(x+dx,y)]2

SSD-N∑(i,j)∈U[IL(x+i,y+j)-IR(x+dx+i,y+j)]2∑(i,j)∈UIL(x+i,y+j)2∑(i,j)∈UIR(x+dx+i,y+j)2

SCP∑(i,j)∈UIL(x+i,y+j)IR(x+dx+i,y+j)

图1 局部相关算法原理示意图

1.3 局部相关匹配算法的时间复杂度

在图1(a)中坐标为(x,y)的像素点,算法要计算图1(b)中所有相关像素的相似性。根据极线约束以及视差约束,在图1(b)中只需计算同一极线上,视差范围内的像素相似性即可,需要的计算量为:

T(x,y)=dmaxn2(1)

式中:n为正方形窗口边长;dmax为最大视差。设W为图像的宽度;H为图像的高度,对于整幅图片,全部相似性的计算量为:

T=∑0≤i

易知,局部相关匹配算法的时间复杂度为O(WHdmaxn2)。

1.4 局部相关匹配算法的改进

若假设匹配窗口的边长为2n+1,对于每行像素,其相似性测度函数为P(x,y,d)=∑ni=-n|IL(x+i,y)-IR(x+i+d,y)|;在模板向右滑动时,P(x+1,y,d)可由之前的计算结果得到,有迭代公式:

P(x+1,y,d)=P(x,y,d)+[|IL(x+n+1,y)-

IR(x+n+1+d,y)|-|IL(x-n,y)-

IR(x-n+d,y)|](3)

即在模板滑动时,不需要重新计算整个窗口的SAD,而只需计算新的一列SAD。分析可知,改进后算法的时间复杂度由O(WHdmaxn2)降为O(WHdmaxn),算法实时性有了较大提升。

2 双目立体视觉区域局部匹配算法的实现

2.1 实验环境

该研究的实验主要是通过计算机编程实现区域局部匹配算法,并在双相机系统上利用标准和实际场景图像进行验证性实验的。以VC++ 6.0及OPENCV为编程环境,完成验证软件设计。

该研究的验证实验使用了西安交通大学系统工程所的实验设备(如图2所示)。两只摄像机平行放置,其位置姿态参数已由标定结果给出,如表2所示。

图2 试验系统

表2 相机标定参数表(以像素为单位)

参数指标左相机右相机

焦距699.85696.15

相机中心[392.34 283.94][389.26 308.18]

畸变[-0.270 20 0.454 48][-0.239 75 0.256 22]

旋转角/radα=0.013 77,β=0.001 07,γ=0.000 38

相对位移/mmt1=87.921,t2=1.205,t3=4.980

摄像机与处理计算机之间通过双1394总线连接,计算机中配备2块64位PCI-1394卡,以适应摄像机高速图像流的要求。摄像机的主要参数如表3所示。

表3 摄像机参数

摄像机特性参数

CCD传感器Sony Progressive Scan CCDs

CCD最大像素1 624×1 224

像素大小4.4 μm×4.4 μm

支持图像大小320×240(30),640×480(30),800×600(30),1 600×1 200(15)

快门0.01~66.63 ms

图像输出方式双1394总线输出

2.2 软件设计流程图

系统算法流程图如图3所示。

图3 系统算法流程图

2.3 实验结果

部分实验结果如图4所示。

图4 实验结果

由图4可知[10],实验得到的图片较好地完成了对现实场景中的匹配,可以较直接地从所得视差图中获得物体的深度信息。

同时,图像边缘处的匹配精度受到图像边界的影响,误差较大,真实场景图片中噪声较大,导致误匹配较多。如何减少误差,提高精度是现在和今后重点考虑的问题之一。

3 结 语

这里对双目立体视觉中的区域局部匹配算法进行讨论,对现有SAD算法进行了改进,较显著地提高了匹配速度。在实验平台上较好地完成了对标准图像及现实场景图像的视差图获取,验证了算法的有效性和快速性。

参考文献

[1]章毓晋.图像工程(下册)图像理解[M].2版.北京:清华大学出版社,2007.

[2]何明一,卫保国.数字图像处理[M].北京:科学出版社,2008.

[3]游素亚.立体视觉研究的现状与进展[J].中国图像图形学报,1997,2(1):1-2.

[4]Hajar Sadeghi,Payman Moallem,Monadjemi S A.Feature Based Dense Stereo Matching using Dynamic Programming and Color[J].International Journal of Computational Intelligence,2004,4(3):179-186.

[5]高峰,文贡坚,吕金建.一种准自动高精度图像配准算法[J].现代电子技术,2007,30(6):56-59.

[6]Kuk Jin Yoon,In So Kweon.Adaptive Support-Weight Approach for Correspondence Search[A].APRIL[C].2006,28(4):650-655.

[7]徐奕,周军,周源华.立体视觉匹配技术[J].计算机工程与应用,2003,39(15):388-392.

[8]Cyganek B,Borgosz J.A Comparative Study of Performance and Implementation of Some Area-based Stereo Algorithms[A].CAIP[C].2001,21(24):709-716.

[9]夏永泉.计算机视觉中双目匹配相关技术的研究[D].南京:南京理工大学,2007.

计算机视觉总结篇4

1视觉跟踪算法

1.1KCF算法

KCF(KernelCorrelationFilter)核相关滤波算法通过目标样本去训练判别分类器,训练判别分类器分析当前跟踪的目标是被跟踪目标周围的背景信息还是被跟踪目标,如图1所示。KCF通过岭回归分类器的学习来完成对目标的跟踪,通过快速傅里叶变化实现算法的加速运算。KCF跟踪算法在训练阶段,利用循环矩阵理论,对视频目标区域进行稠密采样,获取正负样本,提取方向梯度直方图(HOG)特征,通过岭回归分类器分析所以样本进行训练。在检测阶段,以视频前一帧目标位置为中心进行稠密采样,将得到的所有样本输入到岭回归分类器,经过岭回归分类器的分类,得到目标的位置。

1.2TLD算法

TLD(Tracking-Learning-Detection)目标跟踪算法由跟踪模块(Tracking)、检测模块(Detection)、学习模块(Learning)三部分组成,如图2所示。该算法首先由跟踪模块的作用是将被跟踪目标的运动轨道处理成轨道碎片提供给学习模块进行学习,学习模块根据跟踪模块的处理结果进行学习并对检测模块的错误进行分析,通过学习处理后生成训练样本,检测模块在接收到训练样本后对相关参数和目标模型进行跟新并对跟踪模块重新初始化,其中跟踪模块为中值流跟踪器,学习模块为P-N目标模型学习。

1.3视觉跟踪算法改进

KCF跟踪算法的运行速度方面和在目标环境变化不大的情况下跟踪速度表现优异,但其在被跟踪目标出现遮挡、形变、跟丢后无法找回目标,反观TLD解决了被跟踪目标被遮挡、目标跟丢无法重新找回的情况,因此将两个算法互相融合,取长补短能提高算法的运算速度和追踪效果。融合方法:利用KCF克服TLD的中值流跟踪器的缺点,将KCF替换TLD的中值流跟踪器,能够加快TLD的目标跟踪速度。当被跟踪目标在当前图像帧中消失后,KCF会把盲目地在背景中寻找被跟踪目标,当被跟踪重新出现时,KCF算法依然在背景中寻找被跟踪目标,导致跟踪失败,为了避免这个错误的方法,KCF与TLD融合的算法包含了原TLD学习模块,当判断目标丢失时不再盲目地在背景内寻找目标,当目标重新出现时重新跟踪目标,进一步提高算法的跟踪性能。虽然这两个算法的融合方法很简单,但融合后的算法确实解决了KCF不能跟踪被遮挡的物体以及目标跟踪后不能找回的缺点,而且算法速度上高于原TLD算法,提高了算法的性能和适用性。

2机器人控制系统设计

机器人系统总体框架如图4所示,USB摄像头拍摄到的图像信以视频帧的形式传入到程序中。首先先进行KCF的滤波和特征跟踪,再经由TLD算法的处理运算出目标状态,再通过整合模块把得到被跟踪目标的位置信息转换为云台舵机转动命令发送,通过CH340模块将指令由USB转为TTL电平,机器人下位机通过STM32单片机直接或间接地控制各个模块实现机器人的各个功能。STM32单片机在接收到PS2手柄模块和CH340模块的控制信号后,根据程序存储器对应的指令执行行动,如前进、水弹枪射击等。STM32单片机实时接收各模块的信息,例如编码电机的电机转速,陀螺仪的欧拉角等,根据各模块的信息及时调整机器人的运动状态实现机器人运动底盘的灵活移动。摄像头所拍摄的图像信息并不会直接交给STM32单片机除了,而是先经由上位机NUC通过视觉追踪算法运算过后所得的控制指令发送给单片机接收,单片机接收到通过CH340转换的控制指令后控制舵机云台转动追踪目标。

3机器人目标跟踪算法软件设计

目标跟踪算法软件实现流程图如图5所示。由于该目标跟踪算法的运算结果只返回一个跟踪框,并没有实际的跟踪结果,所以需要获取被跟踪目标所在图像中的坐标,获取包围被跟踪目标的矩形重心后,才能方便实现目标跟踪算法。计算出被跟踪目标的矩形包围框的重心后,先对图像帧区域进行划分,使用渐近式接近目标区域为核心思想,将每一帧的图像划分为许多相同的矩形区域。随后根据KCF+TLD目标跟踪算法运算得出的结果框的重心与图像正中心对比,计算出被跟踪目标与图像正中心坐标的偏移量,再通过舵机控制算法计算出舵机云台的转动量,逐帧接近目标所在位置,达到跟踪效果。

4系统视觉跟踪算法测试

为保证系统测试的可靠性,设置了遥控车为移动目标靶,机器人先对移动目标进行框选获得目标样本,随后遥控移动目标测试机器人的实际追踪效果。通过测试可以发现在算法实际运行时,跟踪目标的移动会导致目标的背景产生变化、目标的图像信息发生形变、目标被其他物体遮挡、目标突然丢失等问题,摄像头拍摄目标所在的图像信息发生变化,KCF+TLD跟踪算法通过在线不断对目标进行样本取样学习目标特征,能够有效应对移动目标的跟踪瞄准。当目标因为某种原因跟丢后(目标被遮挡也算跟丢),目标跟踪算法会根据选取目标时保留的原始样本的特征值在图像信息内搜索。符合原始样本目标特征的图像将被重新判断为被跟踪目标。测试结果表1和表2所示。通过三个算法分别对静态目标的跟踪算法帧数测试如图6所示,得出数据结果表3所示,KCF算法的运行帧数较高,TLD算法的运行帧数较低,而KCF+TLD算法的运行帧数比TLD算法有所降低。基于视觉跟踪机器人的设计与实现,采用了融合KCF+TLD的目标跟踪算法以及NUC作为视觉算法运行环境,可以对任意目标进行跟踪瞄准并在目标丢失并重新出现时自动找回目标,同时能够长时间稳定地跟踪目标,该方案功能实现对视觉机器人的目标识别与跟踪具有一定的研究价值。

计算机视觉总结篇5

关键词:计算机图形图像设计;视觉传达设计;关系研究

中图分类号:TP391.41

将计算机技术应用到图形图像设计领域发起于上世纪80年代的欧美国家,并且随着计算机科技的快速发展,电脑制图对许多人来说不再是一件新鲜事,计算机制图技术得到广泛普及与应用[1]。正所谓“过犹不及”,长时间以来人们过度关注计算机制图技术,甚至完全将其当做一种工具,从而导致图形图像设计基本原则被忽视,致使计算机设计的图形图像缺乏艺术创新型,难以满足人类的视觉要求[2]。对此,相关学者开始尝试将计算机图形设计与视觉传达设计结合起来,并取得显著成效。本文即在此背景下展开研究,具体结果如下:

1 基本概念分析

要想了解计算机图像图形设计与视觉传达设计之间的关系,我们需要了解两者的基本概念,具体如下:

1.1 计算机图形图像设计的概念

所谓计算机图形图像设计,顾名思义,是指利用计算机技术设计制作图形图像的过程。计算机图形图像技术是随计算机技术发展而兴起的新技术,相比于传统的图形图像设计工作,它极大的解放了设计家的双手,有效减少了设计家双手的劳动,促使其有更多的时间和精力思考新的创意灵感。

另外,相比于手工制图,计算机软件更为精密,同时设计软件所提供的色彩、线条更为丰富,从而使制图者有更多选择余地。同时,相比于传统制图,计算机制图不需要长时间的美术基础训练,并且随着技术的发展,操作更加简单,适合初学者使用。

1.2 视觉传达设计

1.2.1 传达。在分析视觉传达设计前,我们需要先搞清楚什么是传达?传达是事物之间的一种共通现象,广泛存在于人类、自然界生物、机械等事物之间[3]。相比于其他事物之间的传达,人类之间的传达需要借助各种符号,因此我们可以将人类传达分为语言传达与非语言传达[4]。

语言传达,顾名思义,是指人类通过语言符号传递信息的现象,由于语言是人类最开始也是最常用的沟通方式,因此常被人类用来传达抽象概念。非语言传达是指语言传达之外的人类所采用的传达信息的方式,非语言传达主要通过视觉与听觉传递信息,而其中涉及范围最广的是视觉传达。

1.2.2 视觉传达设计。视觉传达设计是指需要通过视觉传达各种信息的设计。例如:人们通过视觉观察绘画作品的大小、形状、色泽等可以得到作者想要表达的信息,并且画家通过改变以上因素就可以传达出不同的信息。视觉传达设计的内容为:各种标志、文字、图形以及符号等;传达媒体为:电视、广播、杂志、报纸以及网络平台等;传达面向的群体为:社会中不同身份的受众。

2 计算机图形图像设计与视觉传达设计的异同点分析

2.1 两者不同点分析

虽然有关计算机图形图像设计与视觉传达设计结合的研究方兴未艾,但是从根本上来说,两者之间存在较多的不同点。我们只有准确把握两者的差距,才能够更好的将两者融合起来。总结来看,两者之间的不同点主要存在于历史背景、设计任务、培训方法、创作方法等几个方面。

2.1.1 两者的历史背景不同。如前文所说,计算机图形图像设计是随着计算机技术的发展而兴起的,因此该技术形成并兴起于上世纪末与本世纪初。而且进入新世纪后,随着计算机运行速度、存储容量、结构以及网络通信的完善,计算机图形图形设计进入了全新的发展时期,基本实现了与打印机、多媒体、绘图仪等设备的组合使用,从而使得计算机图形图像设计的范围得到拓展,逐渐从二维领域进入到三维领域。

相比于计算机图形图像设计,视觉传达设计的出现较早,其形成于上世纪40年代,第二次世界大战之后。此时人类社会迎来一个发展的新高峰,商品经济流通速度越来越快、流通范围越来越广。尤其是广告业的快速发展使得绘画与广告紧密的结合在一起,从而改变了传统的传达方法,使得视觉传达方式在人类社会中的地位越来越重要。此时,人类对视觉传达的需要促使了视觉传达设计的兴起与发展。

2.1.2 两者设计任务不同。从设计作品的特性来看,计算机图形图像设计的作品主要是立体的、三维的以及动态的,因此其设计任务就是将原本的平面、二维、静止等作品转变成为立体、三维、动态作品。

而视觉传达设计的作品主要是通过视觉传达向受众传递作者想要表达的信息,因此作品的形式并不固定,只要能准确表达信息即可。因此,视觉传达设计的任务主要是树立形象、传递思想、说服受众,同时视觉传达设计还肩负着传递艺术美感的任务。

2.1.3 两者培训方法不同。计算机图形图像设计是依靠计算机技术进行的工作,因此初学者掌握相关的计算机软件技术十分必要。因此,图形图像设计的培训方法主要是训练初学者了解并熟练使用计算机平面图形软件、三维软件,掌握排版印刷、视频编辑等技术。另外,训练初学者掌握一定的作品设计知识也是图形图像设计的主要任务。

由于世界传达设计的主要任务是向受众传达信息、传递美感,因此视觉传达设计工作需要用到广告学、美术学、传播学、设计学等多种知识。因此,在对初学者进行视觉传达设计培训时,要想初学者灌输工艺美术史、广告通论、设计史等学科的理论知识[5];同时,还要训练出初学者掌握广告设计、产品包装、装帧等必要技能。

2.1.4 两者创作方法不同。计算机图形图像设计的创作主要依赖于各种设计软件,因此设计师在创作时只要能够熟练掌握各种软件技术,合理搭配形体与色彩、装饰与视觉美、静与动、立体与空间,就能创作出一幅比较完美的作品。

视觉传达设计的创作还比较倾向于美术作品创作,因此在创作时设计师首先要从绘画技法的角度调整点、线、面、色彩、光线、形体等方面的关系,从而准确将自身思想融入到作品中,进而实现形和意、象征与象的结合。

2.2 两者的相同点分析

计算机图形图像设计与视觉传达设计最主要的共同点是:两者都属于艺术作品。因此,从这一角度来说,两者之间存在重叠的共同领域,例如:两者的教育培训都设计到了平面设计、色彩、素面等专业知识。

同时,两者都是运用文化符号与受众进行沟通并传递信息;并且,两种作品的设计都需要设计师进行创新思考,都必须要充满创意;另外,两者在进行创作时都需要考虑美术作品创作的各种要素以及创作原则。

3 结束语

计算机图形图像设计与视觉传达设计的结合是未来的发展潮流,符合21实际的发展要求,能够充分体现计算机技术与艺术的完美结合[6]。而在分析两者基本概念的基础上,对两者的异同点进行探讨,可以为两者的应用结合提供理论参考,进而更好的推动二者的发展。

参考文献:

[1]张金龙.计算机图形图像设计与视觉传达设计研究[J].吉林广播电视大学学报,2013(01):117-118.

[2]袁志翔.计算机图形图像设计与视觉传达设计探微[J].现代装饰(理论),2013(02):173.

[3]邵玉兰,赵昕.关于计算机图形图像设计与视觉传达设计的分析[J].信息与电脑(理论版),2013(03):45-46.

[4]范丽萍.计算机图形图像设计与视觉传达设计[J].电脑编程技巧与维护,2012(04):83-84.

[5]龚良彩.计算机图形图像设计与视觉传达设计[J].计算机光盘软件与应用,2012(10):181.

[6]张婷.计算机图形图像设计与视觉传达设计的研究[J].信息系统工程,2014(02):30.

计算机视觉总结篇6

CG的由来

CG是英语Computer Graphics的缩写,是一种使用数学算法将二维或三维图形转化为计算机显示器的栅格形式的科学。简单地说,计算机图形学的主要研究内容就是研究如何在计算机中表示图形、以及利用计算机进行图形的计算、处理和显示的相关原理与算法。

利用计算机技术进行视觉设计和生产。它既包括技术也包括艺术,几乎涵盖了利用计算机技术进行的所有的视觉艺术创作活动,如平面设计、网页设计、三维动画、影视特效、多媒体技术,以及计算机辅助设计的建筑设计等。现在CG的概念正在扩大,已经形成一个可观的经济产业,我们提到CG时,一般可以指以下四个主要领域:CG艺术与设计、游戏软件、动画、漫画。

CG动画指电脑制作动画,就是电脑原先就制作好了的动画,主机只需要播放就可以了。跟它相对应的是即时演算动画,是一段程序需要主机进行计算才能播放出的动画。一般来说,CG动画的画面要比即时演算的强上不少,占用的空间也比即时演算的要少。但是CG动画缺少变化性,无法即时更改动作。

在电影特技中的应用

计算机动画的一个重要应用就是制作电影特技 可以说电影特技的发展和计算机动画的发展是相互促进的。1987年由著名的计算机动画专家塔尔曼夫妇领导的MIRA 实验室制作了一部七分钟的计算机动画片《相会在蒙特利尔》 再现了国际影星玛丽莲·梦露的风采。1988年,美国电影《谁陷害了兔子罗杰》(Who Framed Roger Rabbit?)中二维动画人物和真实演员的完美结合,令人瞠目结舌、叹为观止 其中用了不少计算机动画处理。1991年美国电影《终结者II:世界末日》展现了奇妙的计算机技术。此外,还有《侏罗纪公园》(Jurassic Park)、《狮子王》、《玩具总动员》(Toy Story)等。

行业趋势

计算机图形学狭义上是一种研究基于物理定律、经验方法以及认知原理,使用各种数学算法处理二维或三维图形数据,生成可视数据表现的科学。它是计算机科学的一个分支领域与应用方向,主要关注数字合成与操作视觉的图形内容。广义上来看,计算机图形学不仅包含了从三维图形建模、绘制到动画的过程,同时也包括了对二维矢量图形以及图像视频融合处理的研究。计算机图形学经过将近40年的发展,已进入了较为成熟的发展期。目前,其主要应用领域包括计算机辅助设计与加工,影视动漫,军事仿真,医学图像处理,气象、地质、财经和电磁等的科学可视化等。由于计算机图形学在这些领域的成功运用,特别是在迅猛发展的动漫产业中,带来了可观的经济效益。动漫产业是目前各国优先发展的绿色产业,具有高科技、高投入与高产出等特点。据统计,截至2009年3月,美国动画梦工厂所拍摄的三维动画片《怪物史莱克II》在预算为1.5亿美元的情况下,获得了超过9.2亿的全球累计票房。而我国在2008年度共制作完成的国产电视动画片249部,计131042分钟,与2007年度相比增加了近28%。另一方面,由于这些领域应用的推动,也给计算机图形学的发展提供了新的发展机遇与挑战。

图形渲染是整个图形学发展的核心。在计算机辅助设计,影视动漫以及各类可视化应用中都对图形渲染结果的高真实感提出了很高的要求。同时,由于显示设备的快速发展,人们要求能提供高清分辨率(1920x1080),进一步要能达到数字电影所能播放的4K分辨率(4096x2060);色彩的动态范围也希望从原来每个通道的8Bit提高到10bit及以上。虽然已有的图形学方法已经能较为真实地再现各类视觉效果,然而为了能提供高分辨率高动态的渲染效果,必须消耗非常可观的计算能力。一帧精美的高清分辨率图像,单机渲染往往需要耗费数小时至数十小时。为此,传统方法主要采用分布式系统,将渲染任务分配到集群渲染节点中。即使这样,也需要使用上千台计算机,耗费数月时间才能完成一部标准90分钟长度的影片渲染。

计算机图形学在追求真实感方向的研究发展已进入一个发展的平台期,基本上各种真实感特效在不计较计算代价的前提下均能较好得以重现。然而,人们创造和生成图片的终极目的不仅仅是展现真实的世界,更重要的是表达所需要传达的信息。例如,在一个所需要描绘的场景中每个对象和元素都有其相关需要传达的信息,可根据重要度不同可采用不同的绘制策略来进行分层渲染再加以融合,最终合成具有一定表意性的图像。为此,研究者已经开始研究如何与图像处理、人工智能、心理认知等领域相结合,探索合适表意性图形生成方法。而这一技术趋势的兴起,实际上延续了已有的非真实感绘制研究中的若干进展,必将在未来有更多的发展。

总 结

CG技术随着计算机技术的发展,开始为影视视觉服务,从最早pixar开始运用电脑将手绘的二维动画往三维CG动画发展,影视动画就开始蓬勃发展,从1995年pixar公司的《玩具总动员》成功上映,到2011年《变形金刚3》《怪物史瑞克3》站上电影票房之巅。无不预示着电影动画的发展前景。而中国第一部全三维动画电影有环球数码制作的《魔比斯环》在2006年成功上映奠定了中国CG影视的第一步,到今中国CG不断发展,衍生出很多CG影视公司,拉动了整个产业的发展和就业。未来中国CG动画还将蓬勃发展。

(作者单位:辽宁科技大学)

作者简介:

吕洪,男,黑龙江哈尔滨人,出生于1990年1月20日,学历:本科,职称:学生,研究方向:影视动画,邮编:114041。

计算机视觉总结篇7

关键词:双目立体视觉系统;系统设计;方法

随着视频技术的发展,使用硬件实现实时的双目立体视觉系统也有了越来越多的研究,但是其硬件实现却一直存在计算精度和资源消耗这对矛盾,复杂的算法势必需要消耗更多的硬件资源,有些较新的算法甚至根本不适合使用硬件来实现。

1双目立体视觉原理和实时立体视觉系统结构分析

1.1双目立体视觉原理分析

双目立体视觉系统以人类的视觉系统为基础,通过双目摄像机获取双目图像,以各种不同的算法来计算出场景的深度信息,再通过对这些深度信息进行三维重构,以实现从二维空间到三维空间的转换。

1.2实时立体视觉系统结构分析

1.2.1camera_in模块

此模块为基于PE1005S摄像头的采集模块。当基于不同的摄像头模组时,可模块可以通过简单修改以配置不同的摄像头,如ov9710、ov7740等。

1.2.2video_det模块

此模块功能为检测所采集图像的实时分辨率,检测到的分辨率会实时保存下来,可以通过PLB总线进行访问。有了这个模块,就可以根据检测出来的分辨率来控制数据在DDR中的存放以及正确地显示图像。

1.2.3xsvi_in_ddr模块

此模块将从两路XSVI接口传送过来的数据通过两个FIFO进行缓存,然后通过两个独立的写时序状态机模块生成独立的MCB接口时序,最后由主控制电路controller进行仲裁和控制等并通过一个MCB接口写到DDR中。由于在大部分情况下,系统中DDR的写入时钟频率都与摄像头数据时钟频率不同,故所使用的FIFO只能是异步的,这样数据才不会错乱。

1.2.4ddr_to_xsvi模块

此模块预先通过读时序状态机模块将DDR里的数据缓存在FIFO里,然后根据外部来的数据请求信号将数据从FIFO里读出来,以XSVI接口传给下一个模块。同样,在大部分情况下,由于系统中DDR的读取时钟频率都与显示图像的时钟频率不同,故所使用的FIFO只能是异步的。

1.2.5video_gen模块

此模块在PLB总线来的控制下可以生成多种标准格式的视频信号,如VGA(640×480)、SVGA(1024×768)、SXGA(1280×1024)、UXGA(1600×1200)、720P和1080P等。另外,在整个系统的分布调试阶段,此模块还可以在未与实际视频数据连接的情况下生成指定格式的测试彩条,以对显示部分的各模块进行测试。

1.2.6dvi_out模块

此模块将XSVI接口的图像数据信号转换成DVI接口的信号。由于图像的时序部分已经有video_gen模块完成了,此模块的功能只是简单的数据格式转换已经同步。

1.2.7depth模块

此模块是整个系统的核心部分,所有的立体视觉算法都将在这个模块中进行。从数据流动的顺序主要包括代价初始化、代价融合、动态规划三个模块。其中,代价初始化通过census转换和SAD两种方法生成用于后续匹配运算的两种初始代价,代价融合将两种初始代价按一定的比例融合起来,动态规划用来寻找匹配点。另外,为了使生成的深度图更加准确,系统中还使用了图像矫正来处理由于摄像头组安装不规范和镜头畸变造成图像数据不匹配,背景去除和中值滤波用来优化生成的深度图。

2实时立体视觉系统的模块设计探究

图像处理系统平台构成。图像处理系统平台是双目立体视觉系统的基础,也可以说是所有图像处理算法验证的基础。因此在验证双目立体视觉系统的性能之前必须先搭建好完善的图像处理系统平台,主要包括图像采集、图像存取、图像显示三部分。例如图像显示模块,图像显示模块主要由分辨率生成模块video_gen和DVI时序模块dvi_out组成[4]。video_gen模块用来生成不同分辨率的视频所需要的标准时序,由两个计数器和两个状态机组成,行计数器和行状态机用来生成行同步时序,而场计数器和场状态机用来生成场同步时序。

实时立体视觉模块,双目立体视觉模块主要由disparity_rd和disparity_wr两个模块组成。disparity_rd模块通过一个MCB接口轮流地从内存控制器中读取出左右两幅图像以及背景图像,并将它们分别缓存在三个异步FIFO中,然后由一个控制电路使它们完全同步地输出给disparity_wr模块。而disparity_wr模块则先将输入进来的三路数据送到stereo_matching模块计算深度图,然后在控制电路的配合下将生成的disparity通过一个MCB口存入内存控制器中。由于整个系统考虑了模块化设计,本模块中使用的mcb_rd和mcb_wr与图像存取模块中的是完全相同的,大大节约了开发时间。

其他辅助模块,如图像矫正,首先,CoordGen模块根据提供的矫正矩阵计算出对应的坐标存到CoordFifo中,然后Controller模块根据坐标的整数部分控制RdDataCtr模块从内存中读出所需像素点存到两个DataRam中,最后CorrectCtrl模块根据坐标的小数部分对取出来的数据进行运算并放到DataFifo中等待读取,图像矫正过程就完成了。其中,坐标保留小数部分和一次读取内存的两段数据是为了进行插值算法,使矫正后图像不会出现锯齿,而矫正矩阵则是通过Matlab在实验阶段计算出来的。

3结语

综上所述,此次主要分析了大量国内外有关双目立体视觉系统的算法以及各种不同的实现方案,详细描述了所设计的双目立体视觉系统中各个模块的实现方式。在这些相应分析下就能有助于设计目标的实现。

参考文献:

[1]薄雪峰,全海英,刘志成,谭国庆,何玉.被动式立体视觉研究进展[J].北京生物医学工程.2013(05):1-2.

[2]Guivant.J,Nebot.E,Baiker.S.Autonomous navigation and map building using laser range sensors in outdoor application[J].Journal of Robotic Systems,2014,17(10):565-583

[3]周清海等.基于FPGA的多通道全景SoC设计与实现[D].深圳:深圳大学,2013:2-4.

[4]韩超,邓甲昊,邹金慧,韩敏.基于差分均值背景提取和矩阵分区目标检测算法的研究[J].北京理工大学学报,2015,32(12):1247-1257.

作者简介:

计算机视觉总结篇8

关键词关键词:芯片点胶;机器视觉;视觉检测;平面标定;中心定位

DOIDOI:10.11907/rjdk.162384

中图分类号:TP319

文献标识码:A 文章编号文章编号:16727800(2016)011013103

0 引言

随着半导体和电子行业的高速发展,传统的人工生产方式已难以满足现代生产要求的精度和速度。机器视觉产品凭借对生产现场的图像采集处理,由系统内部对各种情况进行分析处理,只需人工下达工作指令即可。其不但可以长达24小时连续不断地工作,还能避免各种化学药物对人体的伤害。因此,机器视觉产品以其独特的优势在各个行业得到了迅速发展,在产品尺寸检测等领域发挥着重要作用。

目前,机器视觉产品应用最为广泛的行业是工业生产。在半导体和电子产品的制造过程中,点胶操作是芯片生产封装过程中的一项关键技术,已被广泛用于检测与装配的自动化生产过程中。芯片点胶系统采用半自动人工控制,并采用机器视觉技术以自动化生产模式取代传统手工模式,在人力、资金等方面为公司节约了大量成本。当前的点胶机存在点胶过慢、精度较低等问题,无法满足点胶封装的要求,所以芯片点胶系统需要不断进行改进与优化。本文针对芯片点胶系统的关键技术进行研究,对现有的中心定位算法进行改进,提出了一种改进的中心定位算法,从而更精确地对芯片中心进行定位,完成点胶操作。

1 系统方案设计

1.1 自动点胶系统设计

自动点胶系统由工控机、点胶机(机器人)、空气压缩机、视觉检测系统与光源等组成,系统框架如图1所示,系统实物如图2所示。工作原理如下:将需要点胶的芯片随机放在工作台上,给予适合的光照强度。视觉检测系统通过检测芯片,识别定位出芯片的引脚中心位置,将数据反馈到主机中,再控制机器人进行点胶操作。

在自动点胶系统中,视觉检测系统最为关键。由于芯片的高度集成化,芯片之间的间距越来越小,因此检测识别难度更大,精度要求也不断提高。而且由于生产的自动化,速度也不断加快。因此,高精度的视觉检测系统发挥了重要作用。

1.2 视觉检测系统

视觉检测系统模块包括图像采集和显示模块、图像处理模块以及检测结果输出模块3部分:①图像的采集与显示模块包括图像传感器及A/D转换器等,主要功能是在合适光源的照度下进行图像采集,并转换为需要的图片格式进行显示和存储;②图像处理模块是整个系统的核心,其根据需要提取目标图像的特性信息进行中心定位;③图像输出部分将图像处理后存储的数字阵列图像变换为适于人们理解的形式。本文基于VC2010与Opencv,对CCD摄像头采集的芯片图像进行图像处理与编程仿真,最终实现芯片的点胶定位。

2 点胶系统视觉检测算法

2.1 芯片中心定位算法研究

目前研究人员对于芯片中心定位的计算方法主要分为两种,一种是基于区域的方法,另一种是基于边缘的方法。在基于区域的中心定位算法中,应用较多的是重心法、曲面拟合法等;基于边缘的中心定位算法则主要包括边缘曲线拟合法、插值法等。

2.2 改进的中心定位算法

为了解决重心法和高斯曲面拟合法在中心定位方面的不足之处,本文提出一种改进的基于重心法和高斯曲面拟合法的中心定位算法。改进的中心定位算法同时结合了重心法与高斯曲面拟合法的优点,能够在误差允许的范围内提升目标区域中心的定位精度。算法主要步骤如下:①利用不同阈值对图像进行边缘提取,得到不同的目标灰度图像;②对得到的灰度图像使用重心法对其进行中心定位,计算出相应的中心坐标位置并记录;③使用高斯曲面拟合法对不同阈值进行曲面拟合算法运算,计算出不同阈值分别对应的中心坐标位置并记录;④对使用重心法和高斯曲面拟合法计算得到的数值进行总体标准差运算,得到重心法和高斯曲面拟合法相应的中心坐标标准差;⑤再对重心法和高斯曲面拟合法计算得到的标准差进行均方根值运算,得出最终的中心坐标位置。

均方根(RMS)有时也被称为方均根。将N个项的平方进行求和,然后再除以N以后开方所得的结果即是均方根的结果,其计算公式为:

3 实验与结果分析

对于不同阈值进行边缘提取以后的灰度图像,本文通过对图像的标准差进行计算,分别得到了重心法和高斯曲面拟合法的中心坐标。图3为使用重心法、高斯曲面拟合法和改进的中心定位算法分别计算芯片中心坐标得到的中心标示图。

可以看出,几种算法的主要差别存在于X方向,在Y方向上基本没有差别。而且从图6中可以更加清晰地看到,明显有几个点偏离实际测量位置,这是由于算法局限性造成的误差,而改进算法与实际测量数据之间的误差极小。三种算法的误差分析具体如表2所示。

从表2中可以看出,传统的中心定位算法在边缘部分可能出现一定偏差,而改进的中心定位算法能够在现有基础上提升定位准确率,控制误差率在3%以内,从而避免了重心法及高斯曲面拟合法的弊端,有效提升了芯片中心的定位精度,取得了预期的实验效果。

4 结语

本文首先阐述了中心定位算法对于芯片点胶系统的重要性,然后介绍了传统的中心定位算法――重心法以及高斯曲面拟合法,分析了现有算法的优劣,并提出一种改进的中心定位算法,从而更精确地对目标中心进行定位。处理得到芯片中心坐标,然后使用最小二乘法对中心坐标进行计算,将中心坐标转换为空间的三维坐标,通过运动控制完成最终的点胶操作。实验证明了本文算法的可行性,较之传统算法误差更小,精度获得了有效提升。

参考文献:

[1] 梁锡汉.自动贴片视觉系统的研究与设计[J].制造技术与机床,2005(1):4648.

[2] 刘建群.基于视觉的表面封装芯片引脚检测系统的研究[J].中国机械工程,2007,18(16):19081912.

[3] CHENYANG GE, ZUOXUN HOU, HUIMIN YAO,et al. A new implementation of imageprocessing engine for 3D visualization and stereo video stream display[J]. Semiconductor Technology, 2014, 59(56):459467.

[4] 李刚.基于机器视觉的密集复杂物体识别与定位[D].哈尔滨:哈尔滨工业大学,2013.

[5] 王欢,王修辉.基于阈值判断的自适应中值滤波算法[J].中国计量学院学报,2011(24):382385.

[6] WANG,CHIENCHIH.Multivariate analysisbased image enhancement model for machine vision inspection[J].International Journal of Production Research,2011,49 (10):29993021.

[7] 林开颜.彩色图像分割方法综述[J].中国图像图形学报,2005,10(1):110.

[8] 刘好龙.一种改进的激光光斑中心定位算法[J].计算机测量与控制,2014,22(1):139141.

[9] 陈大川,许小东,陈永彬,等.基于机器视觉的铰链精密检验系统[J].机电工程技术,2015,44(3):6467.

上一篇:茶礼仪基本知识范文 下一篇:逻辑学有效性范文