计算机视觉心得体会范文

时间:2023-12-19 16:22:40

计算机视觉心得体会

计算机视觉心得体会篇1

【关键词】盲人 视觉障碍 计算机教学

【中图分类号】G76 【文献标识码】A 【文章编号】2095-3089(2014)10-0140-02

在信息技术高速发展的今天,计算机作为一个普及的应用工具,它几乎是无处不在、无所不能。盲人由于视力上的障碍,从外界获取的知识极为有限,想要操作计算机更是难上加难。而读屏软件的出现让盲人使用计算机成为可能,盲人在学会读屏软件和中文输入法后,就可以和明眼人一样使用计算机了。所以,在特殊学校开设计算机课尤为重要。那么,如何尽快地使盲人学会计算机的操作呢?

一、培养盲人学习计算机的兴趣

心理学家布鲁纳说:“学习最好的刺激,乃是对所学材料的兴趣。”所以教学的关键就是要激发学生对计算机的兴趣,有了兴趣才有学习的动力。盲人一旦对学习产生了兴趣,就能变被动学习为主动学习,充分发挥其智力潜能和创新潜能。

盲人由于视觉障碍,对客观事物的感知能力、思维、想象力等受到一定的限制,这就给他们获取信息带来一定的困难。作为教师,我们要根据盲人在听觉上、触觉上、嗅觉上比健全人敏感,且记忆力强的特点,来激发他们对计算机产生兴趣。比如盲人认识键盘时,要发挥盲人触觉灵敏、记忆力强的优势,将每个功能分区的形状具象化,方便盲人识记。同时,计算机是一门实践性很强的学科。在上机实践中,应使学生感到在玩中学、学中玩。上机操作的过程是一个融阅读、理解思考和观察、验证于一体的过程。学生刚开始学习还有兴趣,但慢慢热情就会下降,甚至不感兴趣。我们要充分发挥盲人“以手代目”的特点,利用语言和直观手法相结合,教师先讲清指法位置要领,再做示范,对全盲学生把手放在教师的手上,使他们对指法的轻重变化有个具体的形象,在实践中得到学习乐趣和兴趣。

二、在教学过程中,从实用性出发,培养盲人解决计算机故障的能力

盲人因其视觉上的生理缺陷,对计算机的使用受到了极大的限制,这是不争的事实。像计算机一般故障的排除,盲人就会觉得非常困难,特别是碰到计算机有时因为程序忙而出现假死机的情况,或运行的软件等待时间过长,或有误操作等小故障时,盲人看不见,计算机这时又发不出提示语音,他们就会手足无措了。通常这种情况盲人都会认为是死机了,就乱按重启键或开关电源,一方面会使计算机的数据不能保存下来;另一方面,如果盲人使用的计算机过于频繁开关机或重启,会大大缩短计算机键盘的寿命,随时丢失数据,这种做法在使用计算机上是大忌。教师应该在教学中结合实际故障,甚至人为制造出一些常见而又容易解决的故障来教会他们如何自己解决一些小问题,避免今后碰到小故障惊慌失措。所以我认为盲人计算机的教学目标是让他们今后自己在家或在单位能够独立使用计算机,并能够解决一般的故障,达到真正会使用计算机。

三、针对盲人的整体情况和个别情况采用多种教学方式进行教学

很多学生是全盲的,完全看不见事物,也就不知道计算机是怎么样的,他们对计算机没有一个感性的认识,计算机在他们心目中只是一个抽象的事物。他们大部分只是抱着试试看的心态去学,信心不足,有些甚至带有抵触的情绪,对这些学生进行计算机的教学就比较困难。但是有部分盲人是低视力的,他们能够模糊地看见计算机视窗操作系统和较大号的字体,对计算机有一定的感性认识,他们渴望能够用文字代替盲文的书写,达到与人交流的目的,因此,他们学习计算机的兴趣较浓厚,学习很积极主动。教师在教学中可采用精熟教学、同伴教学、协同教学、分层教学等多种教学方法,反复训练、循序渐进,力求让每一个盲人都能掌握计算机的常用操作。

四、在教学中要善于观察、总结经验,积极寻找适当的教学方法

盲人因视觉障碍导致他们对事物缺乏感性认识,计算机视窗界面对于他们来说根本没有一种直观的感觉,他们不能像正常人一样使用鼠标。盲人学习计算机的关键在于键位的熟悉和快捷键的使用,只有熟悉计算机的键盘格局,才能熟练地使用计算机。在实际教学中,我们都是先讲授各个功能分区的布局和键盘分布,用具象化的语言,手把手的操作帮助盲人熟悉键盘格局。通过不断的演练和校正来帮助盲人认识键盘、熟悉键盘。由于盲人看不出汉字,打字只能用双拼或全拼输入法,他们是靠听字来选取所需的字,这就造成文字输入比正常人慢很多,但是文字输入又是教学的一项最重要的内容。所以在教学过程中首先要求学生练熟文字输入,当学生熟练掌握文字输入后才讲解有关计算机基础操作命令方面的内容,如讲解组合键、快捷键的作用和操作方法,如Ctrl+A,Ctrl+C,Ctrl+X,Ctrl+V等常用组合键。

在教学中要求教师改变一般的教学方法,上课一定用计算机当场进行操作演示,教师一边做一边讲,学生一边听一边跟着教师的步骤一步一步地操作,遇到较复杂的操作就多讲几遍,讲了新内容以后又再结合旧的内容练习,不断以滚雪球方式循序渐近、重复训练,采用这种教学方法后,教学效果明显,学生的操作技能得到了很大的提高。

五、拓宽盲人视野,提高盲人使用计算机获取信息的针对性和准确性

在教授盲人使用计算机的同时,也要指导盲人科学使用计算机。在盲人计算机的教学过程中,很多教师和盲人认为只要学好了上网打字聊天,学习任务就结束了,学习目标就实现了,这种观点是需要修正的,学会上网打字聊天只是帮助盲人在获取信息的道路上迈出了第一步。虽然由于专业条件所限,目前我们学校的开设的计算机课并不是培养计算机行业精英为目的,而帮助盲人及时了解党和国家以及省内各项政策、增加盲人提高个人素养的途径,加强残疾人工作者与盲人群体间的信息交流才是最终目标。盲人计算机课中,及时将与盲人切身相关的网站,如中国盲人协会、中国盲文图书馆、按摩教学网站等的链接教给盲人,帮助盲人拓宽视野,提高盲人使用计算机获取信息的针对性和准确性。

六、健康心理培养,情感教育贯穿始终

盲人由于视觉的缺陷,就造成了他们与健全人不同的心理特征,他们对事物的认识和判断容易出现偏差、片面性或绝对化,爱“钻牛角尖”,而在与人交往和感情方面易出现:孤独感、强烈的防范心理、情绪不稳定、猜忌心较重、自私或自卑等不健康的心理障碍,这些都极大地影响了盲人与他人的正常交往与沟通。所以,健康的心理培养和情感教育始终贯穿于我们的教学之中。

计算机视觉心得体会篇2

关键词:设计艺术;设计教学;手绘训练;计算机绘图;视知觉

中图分类号:J50文献标识码:A

Significance of Freehand Sketching in Design Teaching

XU Qing

(School of Design, Jiangnan University, Wuxi, Jiangsu 214122)

近年来,随着计算机软件教学在设计教学中的广泛应用,绘图软件的高效性和便捷性,对于教学中的手绘训练,产生了重大的冲击,有观点认为用计算机绘图的方式完成设计练习会更容易,色彩搭配和替换的也更直接。持此观点的人不理解甚至否定了手绘在设计练习中的必要和意义,希望练习作业用绘图软件来绘制,而不是手绘。这种观点是十分错误和有害的。

计算机的出现是科技改变生活的一面镜子。它改变了我们的生活和工作,使衣食住行都发生了惊人的变化,工作的速度和效率得到空前提高。但是,如果简单地把计算机当作人类改造世界的工具来看待,就太小觑它的影响力了。计算机作为自然科学的产物,关注的是物的清晰性、稳定性和运动性规律,力求通过排除具有差异性的偶然因素,获得世界的普遍性和确定性本质。而包括设计在内的人文科学,关注人的认识和思维活动的全面发展,认为把世界静态化和程式化处理是虚假和有害的,因为一旦它得以确立,就很容易因特有的便捷性和可操作性使人放弃对世界的真实领会,而人对世界的真实领会是人认识自身和世界的源头。然而,在当今追求“功能―效益”的工业文化主导的社会,计算机在社会学习和工作中的广泛应用,正对人的认识和思维活动的全面发展产生不利的影响。在设计教学中,主张放弃手绘训练,而中意计算机操作,就是一个鲜活的例子。

主张“以计算机绘图取代手绘”的人认为,设计创作的流程是:观察事物―提炼形式―形成语言―转换语言―进行创作。其中,手绘和计算机绘图都只是转换语言的手段而已。既然计算机绘图效率更高,为什么不用呢?

可是,计算机真的是我们可以随心使用的工具吗?关于计算机,要记住的基本事实是,其研究方法只依靠严格的线性逻辑方法。它的程序只是类似于人的认知过程而已。这种过程是计算机力量的根源。在物质世界的逻辑分析中,计算机以比人更强的记忆和精密分析着日常世界。这就给人一个错觉。在认知过程中,我们点击鼠标就像手持画笔一样,可以自由地将自己的感受和视知觉形象由内而外地转换出来。然而,这里出现了一个人们难以发现的、却意义重大的差异,即手绘时视知觉的表现与操作计算机时的视知觉的转化是完全不同的。手绘时,视知觉处于一种感悟过程,而计算机绘图是一个对视知觉印象浏览和跳读的过程。前者是视知觉经验在纸笔间留下印记、在世界与智慧之间取得一致的过程;后者是在程序操作技巧和速写之间,取得形式上的秩序的过程。计算机绘图使得人的视知觉表达机械化(事实上,在学习计算机程序时,学习者的感觉和思维就被要求必须依附于逻辑化、机械化的程序操作模式)。计算机绘图有着明显的流水线工作流程,忽略这种程序化的流程对视知觉表现的不利影响,是那些主张“以计算机绘图取代手绘”错误观点的症结所在。

计算机绘图程序在个别事物之中猎取那些具备普遍意义的东西,把人视觉经验轮廓化,建立起概括性很强的形式(造型与色彩元素)模型。计算机无视人的视知觉感悟世界的天赋,与自然科学关注“物”的文化取向有关。人的视知觉是对世界的一种能动的把握,不是人在感知事物的个别成分之后,再将这些成分在脑中机械拼凑或相加而成的。它是知觉活动在对外部事物整体的瞬间把握中建构的产物。“它是有高度选择性的,不仅对那些能够吸引它的事物进行选择,而且对看到的任何一种事物进行选择。”[1](P.49)

当人观看世界时,自然事物或内心世界中的任何变化,都会令人产生充满激情的视觉感知。鲁道夫・阿恩海姆说:“所谓‘观看’,就意味着捕捉眼前事物的某几个最突出的特征……这些突出的标志不仅足以使人把事物识别出来,而且能够给他一种生动的印象,使人觉得这就是那个只是事物的完整形象。”[1](P.50)诸多形象和色彩混乱、偶发并积极地结合,尝试着构建出一种视知觉的形成。这种形成是人对观看对象的总体结构特征的主动把握。阿恩海姆认为,人的视知觉具有思维的一切本领。他说:“人的视觉决不是一种类似机械复制外物的照相机一样的装置。它不像照相机那样仅仅是一种被动的接受活动,外部世界的形象也不像照相机那样简单地印在忠实接受一切的感受器上。相反,对于人来说,他总是在想要获取某件事物时,才真正地去观看这件事物。这种类似无形的‘手指’一样的视觉,在周围的空间中移动着,哪儿有事物存在,它就进入哪里,一旦发现事物之后,它就触动它们、捕捉它们、扫描它们的表面、寻找它们的边界、探究它们的质地。因此,视觉完完全全是一种积极的活动。”[1](P.48-49)

在视觉艺术创作中,视知觉的功能被有意识地使用和扩大了。当一个艺术家“观看”事物时,他对事物的视觉构建有独特的方向,他比一般人更努力地捕捉和表现“视觉形象的表现性”。这种“视觉形象的表现性”体现为视知觉对“力”的感知。“我们发现,造成表现性的基础是一种力的结构,这种结构之所以会引起我们的兴趣,不仅在于它对拥有这种结构的客观事物本身具有意义,而且在于它对于一般的物理世界和精神世界均有意义。”[1](P.620)视觉艺术家在努力寻求一种视觉判断上“力”的平衡。一切事物都存在于时间和空间中。它们都是流动、偶发、短暂和矛盾的。力的平衡,就是感知事物时所经历到的视觉力的基本性质――扩张与收缩、上升与降落、前进与后退、扭曲与径直等方面――都在达到其极短暂的、静态时所特有的一种“力”的分布状态。对于造型来说,就是形状、位置、方向、色彩等诸多“力”的表现要素“都达到了如此确定的程度,以至于不允许这些要素有任何些微的改变。”[1](P.17)“在实际上,在任何一个具体的艺术品中,都是通过……各种力的相互支持和相互抵消而构成整体的平衡的……由这些力的关系所造成的复杂性,对于造成一件艺术品的生命力来说是至关重要的。”[1](P.26)这种视知觉中“力”的平衡瞬间建构,会改变或歪曲物质世界的形式和色彩,确立一个具有强烈节奏性的新的创造性视觉形式。在这种创造性视觉中,实物或印象中物象本身似乎消失了,从先前具体的、个别的、混乱不清的各种形与色的关系中,浮现出肯定而明晰的线条与色彩。这种形式,线条和色彩各方面,对人而言,不是对外界事物一种忠实的复制,而是充满生动的、形与色的和谐律动的世界,是一种形式美的世界。

人的感知与知识不同,它在与世界进行接触的过程中根本不需要以概念为中介。从纷繁复杂的变化世界中,捕捉事物之间力的平衡,并塑造新的创造性视觉形式,是十分困难的。但是,对于一个准备成为视觉艺术家的人来说,这种能力是一个必须掌握的专业素养。视知觉是一种既具体又抽象、既清晰又模糊、既完整又片面的自相矛盾的感知。创造性视觉的最终形成,是一个经过无序和漫长的阶段,和无数次的力的调节和踪迹的抹擦过程,是一个不同物到另一个不同物,一个对立项到另一个对立项的位移和摇摆不定的延异(雅克・德里达语)。事物的差异和位移的永恒存在的,而力的平衡只是在延异过程中的瞬间的状态,也是手绘者最终寻到力的平衡时候的视觉形式的表达。

海德格尔说:“在每一件手的作品中所包含的每一个手的动作都贯穿着思的因素,手的每一举措皆于此因素中承载自己。一切手的作品都根植于思。”[2](P.21)手绘最大特点就是,它将视知觉经验的迅捷过程呈现为稳定不变的、沉思与分析的力量。在设计教学中,手绘设计表现必须被重视。它对激发视知觉感悟能力,增强对造型空间、细部结构的力的把握,都有重要作用。手绘训练,既培养了学生的视知觉能力,增强对造型艺术的敏感度和审美能力,也培养了学生的艺术思维方法,让设计思想和设计表现更加活跃。而计算机绘图另辟出一系列与设计创作完全不同的心智习惯,若是以这种方式进行设计教学,危害甚大。首先,计算机绘图软件程序的理性逻辑与模块使用,是无视视知觉捕捉事物之间力的平衡的创造,将严重降低学生视知觉能力的培养;其次,计算机的程序操作迫使学生将勉强抓住的点滴视知觉经验转化为机械语言,具有活力的视觉感悟被降解至枯燥无趣的点线面的拼凑;此外,当学生惯用计算机形式化语言后,图像和色彩的复制粘贴就立刻因效率高而被大量运用,可以想象的结果是,学生不再尝试形式创造,而是热衷于模仿抄袭。

手绘训练是设计教学中一项重要基本技能培养。计算机绘图不能替代手绘对世界的感悟。在信息高速发展的今天,计算机给予了我们工作和生活的许多便利。我们可以利用计算机绘图软件,实现一些纯技术化的操作,能节省许多工作时间,提高工作效率。当代很多优秀的设计师,他们的创意都喜欢用手绘的方式进行表现,用手工设计完了,再由电脑辅助设计师来用电脑完成设计图。在设计教学中,手绘训练能培养学生视知觉敏感性的训练,通过切实感受到事物的灵韵,触摸媒材的颤动,更深刻地体验到设计的艺术魅力。“以计算机绘图取代手绘”的观点是不妥当的。在当前的设计教学中,手绘训练不但不应该取消,反而应该加大训练力度。(责任编辑:贾明哲)

参考文献:

[1]鲁道夫・阿恩海姆著,滕守尧、朱疆源译.艺术与视知觉[M].成都:四川人民出版社,1998.

计算机视觉心得体会篇3

【关键词】计算机视觉;数字色彩;感性认知

一、色彩的视觉生理机制与计算机色彩设置的关系

眼睛是人类的视觉器官,视觉系统就像一架摄相机,具有较完善的光学系统及各种使眼球转动并调节光学装置的肌肉组织。光线透过眼的折光系统到达视网膜,并在视网膜中形成物像,同时兴奋视网膜的感光细胞,然后,信息沿视神经传导到大脑皮质的视觉中枢产生视觉。实现阅读的第一反应区域处于大脑后方的枕叶皮层(视觉皮层),人类的视觉系统自动对视觉输入构建结构,并在神经系统层面上感知形状、图形、物体。

视觉能够感受到物体细节,通常称为视觉视敏度,也就是对所观察的实物细节或图像细节的辨别能力,具体量化起来就是能分辨出平面上的两个点的能力。人眼的分辨能力是有限的,在一定距离、一定对比度和一定亮度的条件下,人眼只能区分出小到一定程度的点,如果点更小,就无法看清。以光学色彩为基础的计算机显示器,荧屏上的数字色彩是由许多红、绿、蓝紫三原光小色点构成,以不同比例的混合得出自然界的各种颜色。在各种颜色的反射光快速地先后刺激或同时刺激人眼过程中,显示器色光点过于细小,超出人眼能够分辨的视敏度,待传到人眼中识别时,视觉不能识别全部微妙变化的色彩波段,视觉对相似的色彩归纳在一起,光在人眼中留下的印象在视觉中混合,将信息传入大脑皮层,印象由人的视觉器官完成视觉混合。色彩混合后明度是被混合色的平均明度,混合效果近看色彩丰富,远看色调统一。

电脑显示器工作时的正常显示状态是根据人的视觉明视而设计的,开机工作状态下,感知显示图像的始终是视锥细胞。视觉明视中感受相当光照水平和颜色刺激的视锥细胞中含有感红色素、感绿色素和感蓝色素,三类视椎细胞分别对红绿蓝色(RGB)光敏感。这意味着,人类的色觉与计算机显示器类似,人们感知世界的视觉状态基本处于视觉明视,通过红绿蓝色像素探测形成多种颜色,使人在视觉明视中感知到真实的色彩。

二、计算机视觉色彩感知中的敏感源

在适当的条件下,视觉对光的强度具有敏感性。眼睛对暗适应越久,对光的反应越敏感。视觉对光强度(明度)感受存在一段适合阈值。强度阈值内可以读取色彩,而在强度的阈值以外,人眼只能看出光亮却看不出颜色,明度过高分辨不出颜色。计算机显示亮度的设置是参考视觉感受亮度的共性阈值而设计的,适合阈值范围内,视觉可以读取计算机显示器中色彩。

视觉对光波长的敏感性不同于对光强度的敏感性。视网膜的不同部位对色调的敏感性是不同的。视网膜中央凹能分辨各种颜色,从中央凹到边缘部分,对颜色的辨别能力逐渐减弱,先丧失红、绿色的感受性,最后黄、蓝色的感受性也丧失,成了全色盲。在整个光谱上,人眼能分辨出大约150种不同的颜色(光波),但人对光波(颜色)的辨别感受能力因不同波长而不一样。

在视觉感知计算机色彩过程中色彩认知心理的共性经验可以产生敏感源。色彩认知心理来源于生活共性经验的理性“归纳”。视觉生理机制的共同特征使色彩视觉感知存在基本相同的生理基础。色彩的直接心理效应来自色彩的物理光刺激对人的生理发生的直接影响,视觉生理及视觉心理等方面的共性特征使人们在色彩视觉意象存在相似的感受。视觉感知过程中,以往的认知结构对现有的认知过程的影响,生活经验影响人的认知心理变化过程,心理之间的相互联系、相互制约,使人类认知过程相近的模式。著名的认知心理学家布鲁纳认为,在人们认知的过程中,必须考虑到通过视觉感官对客观联系的色彩信息进行组织,结合视觉经验感知新的客观事物,用归纳方法能找出事物的共性,“感知”出相互联系的客观事物中相近的东西。

色彩心理共性源于“经验色”。人类可以通过本能的眼睛或是肢体触探物质本身的微妙变化感知生活,不断产生认知“经验”。在历史和风俗的影响下,色彩所蕴藏的深层意义来至生活经历的联想,视觉色彩通过联想链来理解传播信息。在生活实践中,不同的色彩刺激结合识别色彩的习惯与经验,形成明显的情绪感,产生不同的情绪反射,使人既能感觉积极兴奋,也能使人消沉或感伤,其影响最明显的是色相。纯度的关系也很大,高纯度色有兴奋感,低纯度色有沉静感。明度也可以表现情绪,暖色系中高明度、高纯度的色彩呈兴奋感,低明度、低纯度的色彩呈沉静感。利用色彩视觉心理经验有利于完成认知任务,对于实际生活具有很强的指导性,这些“经验”向我们明确地肯定了色彩对人心理的影响具有共性。

色彩心理共性源于人们学习和推理。在认知过程中人类情感普遍交流的同时产生相互认同,不断找到与周围的环境现象结合的个人经验。知识学习积累物质的色彩、材料、形状、物理的空间、运动与时间等认知共性,这些共通的经验,可以在大量事实研究中归纳出一些自然规律,诠释事物,形成可以指导和影响社会发展的观点。

三、计算机数字色彩设计

人们在各自分隔的世界里共同生活,色彩视觉感知受人的经历、记忆力、看法和视觉灵敏度等各种因素的影响,但相近的生活习性,相似的生活经验,使人们会采用相近的方式理解色彩。感性色彩的科学设计可以满足计算机视觉的准确性,提高网络平台交互速度,促进经济,满足视觉风尚,帮助高效实现计算机交互。人类共通的视觉经验,产生感知色彩的一般规律,可以归纳出以下计算机数字色彩设计法则。

(1)经验影响感知,应用色彩隐藏的寓意引导,尽可能与图像结合表达。例如,每人看云和水滴会联想熟知的图形,看火会联想到红橙色的激动与热辣。人们能快速识别图像,而且触发相关信息回忆。使用经验图标,一般人们不需要学习,就能识别所提示的意思。

(2)看到和选择比回忆和输入要容易。为用户提供色彩鲜明的选项,在颜色之外使用其它提示,让它们从中选择,而不是强迫用户回忆选项再告诉电脑。

(3)使用缩略图紧凑地描绘全尺寸的图像。缩略图能让人一次性看很多选项,熟悉的图形内容会引起注意,方便选择。使用独特的色彩,用饱和度、亮度及色相区分内容。

(4)避免使用色盲人无法区分的颜色(例如,色盲人可以识别白色和不同深浅的绿色地图)。

(5)将强烈的对抗色分开(强烈的对抗色使人产生难受的闪烁感)。

(6)利用色彩引导边界视力,提供低分辨的线索,引导眼球运动。对视觉选择性感知,边界视野中的暗色和静止物体经常不被注意到,边界视线中物体的运动通常会被察觉。例如,出错提示在点击电脑按键位置1-2厘米边界视力以外,出错提示将不被看到。

(7)物体之间的相对距离会影响人们感知它们是否及如何组织在一起。(互相靠近物体看起来为一组)。例如,计算机图形设计,拉近距离或分组框和分割线隔开,减少用户视觉凌乱。相似物体视觉归属于一组,色彩中的类似色可以归属成一组。

(8)视觉倾向于感知连续的形式而不是离散的碎片。例如,形间断,但色彩相同,视觉自动连续成完整图形。例如,计算机音量滑动条范围的色彩连续,滑动条手柄连续整体感知(灰色地、红色条)。

(9)人们倾向于分解复杂的场景来降低复杂度,视觉自动组织并解析数据,简化数据。例如,图计算机图形中应用此原理,平面色彩显示三维物体和复杂的二维图形解析为三维场景(假空间错视)。

(10)人们的视觉组织将视觉区域分成主体和背景。小的区域为聚焦主体,一点的形式,占据我们注意力,引来观者注意力的焦点,其余为背景。计算机应用实例中,用户界面的内容背后区域可以放置诱惑的背景色暗示主题、表达情绪。

计算机视觉心得体会篇4

关键词:计算机;视觉传达设计;图形图像设计

中图分类号:TP311.52 文献标识码:A 文章编号:1007-9599 (2012) 20-0000-02

早在20世纪80年代初,一些发达国家已经开始使用电脑进行图形图像设计,所以对于现在来说,它并不算是一个新事物。这种设计方法后来传入中国,开始了一段新的征程。视觉传达技术的产生远远久于计算机图形图像设计,但是从学科角度上看,它仍然是一个比较年轻的领域。视觉传达是指通过视觉传达各种信息的设计,是人们运用信息符号相互交流信息的工具,而计算机图形图像设计则是运用计算机技术将视觉信息中的图形图像等信息进行再创作,从定义可以看出二者的制作方法是不同的。

1 视觉传达中图形设计的特征

图形设计与艺术设计二者关系十分密切,图形在本质上来说通过图像和视觉形象来表达和阐述作者的某种观点,其中视觉形象具有创造性,也是人类利用相关媒体以视觉形象的形式进行特定信息传达的某种特殊的语言形式。图形设计不管是在哪个领域,都非常受人们的青睐,比如服装设计,追求时尚的人都希望能买到独一无二的衣服,而这种衣服少不了设计师的图形设计方案。现在就图形设计的特点做以下三方面的阐述:

1.1 经济基础决定上层建筑,图形设计的每一项任务设计任务都离不开经济因素的影响,特别是在商业广告中,企业家都是为了争取最大利益,所以在设计广告时也以这个作为终极木标,而在公益广告中,就更多的要考虑社会因素,人文关怀,文化氛围及人们的人们关怀等,在。图形如果要得到好的发展,必须要很好的社会发展相适应,并且要符合人们的心理,便于人们更好的接受。

1.2 在设计主题思想的过程中,设计师通常要将设计的内容的基本思路,设计目标明确下来,并且要明确它的核心内容,比如说海尔空调一系列的广告,都要体现调节室温的功能,只有这样,广告才体现了他的核心思想,因为空调最主要的功能就是能够调节室温,使得冬暖夏凉,这样就体现了整个广告设计方案的目标,也体现了这一方案的主题,这一主题一定要具有唯一性、鲜明性,便于消费者很快的识别这个商品,并毫不犹豫的购买。图形与主题是相辅相成的,二者互相对应,图形体现了主题,主题又指导了图形设计。确定主题的时候往往会遇到很多困难,因为有很多因素会影响主题的选定,比如说受众对主题的接受程度是不一样的,所以我们要选择大家能够普遍接受的主题,比如空调的调温这一主题,许多因素都能表现这一特点,比如说动植物很好的在室内生长等等;并且它们可以用用不同的场景来体现。次,空调的购买者大多数的家庭主妇,所以设计者也要充分考虑到家庭主妇的购买欲,她们一般喜欢物美价廉的商品,所以设计时也要将这一因素考虑进去。只有设计者将所有的因素综合起来考虑,才能实现最终选定完美主体的目标。现将消费者的购物心理指数与广告设计的主题之间的关系作一比较:

购物心理与设计主题的关系

消费者购物心理 广告设计主题

70% 100%

50% 80%

10% 40%

1.3 图形设计和画画绝对是两回事,画画讲究物与物之间的一致性,所以画家画画时一定要事先看清楚所画东西的形象。而图形就不一样了,设计者一定要选择人们易于接受的事物作为载体,这就意味着设计者在设计图形时一定要选择我们日常生活中时常接触的东西,生动的东西做样本,这样设计出来的图形才能在不经意的看一眼的情况下,也能留下印象,后者能够吸引人回头再看一眼。

2 分析

2.1 图形图像设计

计算机图形图像设计涵义就是指设计师利用计算机技术把视觉信息中的色彩信息、图形图像信息进行有针对性的创作。而且现在随着计算机技术的不断发展,人们生活水平的不断提高,导致人们对创作的内涵也越来越高,计算机技术在图形图像设计领域开始不断的解放了设计师的双手,进而是设计者们的大脑思维弹性被充分利用起来,源源不断的产生更好更有新意的灵感来不断的满足人们的需求。因为计算机本身的结构十分复杂、精密,所以设计制作效果也体现出与传统的设计制作明显不同的精确度,效果也更奇妙,并且人们只需要花费很少的时间进行美术的锻炼就可以设计出不一样的图形图像,从而有充足的时间来不断的去考虑创造新意以满足人们日益增长的需要。从以上我们可以得知,与传统的设计制作相比,计算机图形图像的设计更加精美、也更加准确和迅速。

2.2 视觉传达设计与计算机图形图像设计的比较

(1)从历史背景的角度来比较:视觉传达设计是在二次世界大战后形成的,它是从绘画和广告的结合中脱颖而出的一种新技术,它不仅使得物品的传播沟通系统发生了变化,而且是的物品的流通系统发生了巨大的改变。随着第三次科技革命的爆发,计算机信息技术的不断发展,从而产生了一种全新的设计技术—计算机图形图像设计。随着计算机技术的进一步发展,计算机的存储、上传速度以及网络等技术也日臻完善,许多配合计算机图形图像设计的应用工具得到不断的更新和改进,再加上扫描仪、绘图仪、打印机以及多媒体的组合应用,使得设计的种类和范围得到进一步拓展提升。此外,计算计软件技术的不断发展,也促使计算机图形图像设计可以向二维或者三维领域前进。

(2)从他们的目的性方面进行比较:传统的视觉传达设计的目的就是通过不断的传统手工设计说服目标受众,让受众能够看到具体的形象,从而实现动感与美感,进而对媒体的动态、造型的生成等进行全面掌握;而新型的计算机图形图像设计的主要目的则是塑造二维空间和三维空间,建立静态与动态的图像,生成造型。在其中加入自己创作的想法和新意使得顾客满意。

2.3 共同处

二者在很多重叠的地方,而且它们在语言和思维方式上也很相似。而其二者在很多领域内都不能够作出很具体的划分,比如在平面设计、色彩等方面,都有许多具有共同的领域在计算机图形图像设计和视觉传达设计的专业范围中,很多部分并不能做出明确、清晰的划分与分类。

3 结束语

现今社会,各行各业都充满了挑战,顺应时展的计算机图形图像设计这一新型技术一定会得到很好的发展,特别是和视觉图形设计在相结合发展的过程中,相辅相成,相互促进,必将会在不久的将来产生新的突破,为图形设计的发展增添更加绚丽的一笔。

参考文献:

[1]范丽萍.计算机图形图像设计与视觉传达设计[J].人工智能及识别技术,2012,(04).

[2]朱希伟.论图像色彩模式及其之间的转换[J].办公自动化,2010,(04).

计算机视觉心得体会篇5

【关键词】特征点提取 特征点匹配 F-HARRIS

1 双目立体视觉的数学表达

为了描述问题的方便我们定义三个坐标系,真实世界事物的大小、位置一般用世界坐标系(xw,yw,zw)表示;摄像机的光学成像系统用摄像机系统(xc,yc,zc)表示,事物的图像在图1所示的xoy平面内,即图像坐标系平面,但图像中心一般不和zc轴重合。

通过图1可以看到,摄像机坐标系就是联系图像坐标系和世界坐标系的桥梁,世界坐标系首先变换到摄像机坐标系,然后通过取整、平移后,变换到图像坐标系的行和列。变换公式如下:

公式中R和T组成旋转、平移矩阵,将世界坐标系中事物的坐标转换到摄像机坐标系,由f组成的转换矩阵,将摄像机坐标系中事物的坐标投影到图像坐标系的x-y平面上,最后把得到的位于图像坐标系x-y平面上的坐标数值除以表示像素大小的dx、dy,就得到图像坐标系的行u和列v,但由于图像坐标系的中心和摄像机坐标系的zc轴一般不重合,因此需要进行平移u0行和v0列。其中,zc表示事物到镜头的距离,f表示焦距,fx=f/dx,fy=f/dy,表示有效焦距。

在单目摄像机系统中,世界坐标系到图像坐标系的转换关系用公式(1)表示,为了简化问题,我们假设世界坐标系的原点和双目视觉系统中左目摄像系统的摄像坐标系重合,且各自成像系统的有效焦距相同。

2 双目立体视觉摄像机系统参数

为了能够对(4)式进行求解,需要确定所有参数数值,其中ul、vl和ur是匹配后的特征点像素坐标,标定后的其它系统参数如下: u0r为-17、u0l为43、v0l为-58、r1为0.9996、r2为-0.0010、r3为-0.0290、r7为0.0289、r8为-0.0086、r9为0.9995、fl为1872、fr为1908、tx为-216.21和tz为-0.0818的值。

3 特征点的寻找

目前应用比较广泛的图像匹配是特征点匹配法,首先利用特征点算法计算特征点的位置,常用的特征点有SIFT特征点、HARRIS特征点和FAST特征点;然后利用描述子μ卣鞯憬行某种表示,常用的描述子有BRIEF描述子和SIFT描述子,最后进行特征点的匹配。

3.1 特征点寻找

双目视觉图像没有旋转、尺度变化,不能发挥SIFT算子在不变特征提取方面无可比拟的长处,反而暴露出其很差的实时性。本文针对HARRIS实时性不足和FAST太依赖阈值以及图像本身纹理信息分布可能造成特征点提取不均匀的缺陷,提出了一种改进的角点检测算法F-HARRIS,该算法借鉴了HARRIS角点和FAST角点的思想,先通过FAST思想(取小阈值)过滤掉大量不是候选角点的像素,之后计算出候选点的HARRIS响应值R,然后筛选出真正的强角点,实验表明其具有几乎和HARRIS角点检测算法一样的效果,检测效率却大大提高,尤其是对于角点数目小的大图像而言,这种优势更加明显,本文将这个算法称为F-HARRIS。

F-HARRIS算法具体流程如下:

Step1:选取图像中的任一像素点p。

Step2:通过4.3.2节中FAST特征点检测算法判断 p是否FAST特征点,如果是,转Step3,否则跳转到Step1。

Step3:分别计算该像素点及其邻域构成的子图像在X,Y方向上的梯度Ix和Iy。

Step4:结合高斯模板ω,计算出该像素点的Hessian矩阵M。

Step5:根据Hessian矩阵计算该像素的Harris响应值R,如果R大于阈值t,则为角点,否则不是。如果图像像素没有遍历结束,转Step1,否则转Step6。

Step6:对R进行非极大值抑制,局部最大值点为角点。

通过对比试验,HARRIS方法用时146ms,检测到角点数量884,而改进算法F-HARRIS方法用时50ms,检测到角点数量903。

3.2 双目立体视觉的特征点匹配

通过上面的描述,利用F-HARRIS方法我们已经能非常高效的提取特征点,由公式(4)可知,要计算事物的三维空间坐标,还需要将两幅图中表征事物相同位置的特征点匹配。

本文使用双向交叉匹配方法去匹配双目图像的特征点,利用穷举法进行匹配验证。将BRIEF描述子、SIFT描述子和Harris特征点、FAST特征点两两配对,组成四种方式,进行试验验证。实验环境是Intel(R) Pentium(R) CPU G860 3.00GHz,4.00GB 内存。

通过计算,在进行匹配时HARRIS、FAST特征点和BRIEF描述子的两个组合方案用时分别为408ms和301ms,正确率为72.9%和69.9%,而HARRIS、FAST特征点和SIFT描述子的两个组合方案用时分别为811ms和14975ms,正确率为65.8%和79.9%。因此,BRIEF描述子比SIFT描述子更节省时间,同时保证正确率。最终选择BRIEF描述子作为特征描述子。

经过上面的步骤,我们得到数量比较大的匹配的特征点,但总体来说,误配的数量也比较大,考虑到双摄像机摆放在同以平面的同一高度上,两幅图像中景物的高度不会有太大差别,把该条件作为特征点匹配的约束条件,将F-HARRIS+BRIEF和HARRIS+BRIEF两个方案进行对比试验,匹配时间分别为340ms和145描述,匹配点的数量也不是很大,分别为132和104,试验结果比较理想。

4 事物三维坐标的获取

通过摄像机的标定和特征点的匹配,公式(4)中所需要的所有参数已经具备。从公式(4)中可以看到xw和yw的计算都需要得到zw后才能够计算,zw重要性比较高,因此我们只对zw进行了精度分析。需要注意的问题是图像坐标系的原点一般在左上角,而文中都是将图像的几何中心作为原点,计算时需要一个平移转换,才能得到公式(4)所需ul、vl和ur。

本实验中,我们把模型飞机(全长为23cm,宽度为14cm)的质心放置距离双目摄像机透镜中心面(即z轴距离)600mm,1200mm,1800mm,2400mm,3000mm,3600mm,4200mm,4500mm处,获取16组匹配点对(ul、vl,ur)如下:(1415 , 918,638),(968 , 765,159),(1449 , 862,999),(1118 , 810,662),(1103 , 807,757),(1325 , 842,982),(1386 , 900,1102),(1334 , 924,1050),(1127 , 866,874),(1212 , 917,959),(1254 , 885,1025),(1255 , 878,1027),(1197 , 894,983),(1121 , 895,907),(1099 , 894,891),(1036 , 887,826),算得到的zw坐标为616.35,598.11,1207.50,1208.20,1784.80,1775.20,2370.10,2380.60,2976.80,2942.80,3527.76,3557.70,4088.20,4149.00,4437.10,4408.10(单位:mm),从上述数据可以看到当物体距离摄像机系统越近,测距精度越高,反之,测距精度降低。实验结果还表明:物体距摄像机4.5米以内时,测距误差在3%以内。

参考文献

[1]高宏伟.计算机双目立体视觉[M].北京:电子工业出版社,2012:4-10.

[2]隋婧,金伟其.双目立体视觉技术的实现及其发展[J].电子技术运用,2004,30(10):4-6.

[3]刘红宁.基于双目立体视觉拟人机器人定位关键技术的研究[C].天津:河北工业大学图书馆(硕士学位论文),2006.

[4]宋丽梅.双目立体机器视觉检测系统及其应用[J].西南科技大学学报(自然科学版),2006,21(01):30-34.

[5]马颂德,张正友.计算机视觉―计算理论与算法基础[M].北京:科学出版社,2003:52-56.

作者单位

计算机视觉心得体会篇6

【关键词】人工智能;认知计算;计算机系统;大数据

认知计算(Cognitive Computing)源自模拟人脑的计算机系统的人工智能.90年代后,研究人员开始用认知计算一词,以表明该学科用于教计算机像人脑一样思考,而不只是开发一种人工系统[1]。传统的计算技术是定量的,并着重于精度和序列等级,而认知计算则试图解决生物系统中的不精确、不确定和部分真实的问题,以实现不同程度的感知、记忆、学习、语言、思维和问题解决等过程[3]。目前随着科学技术的发展以及大数据时代的到来,如何实现类似人脑的认知与判断,发现新的关联和模式,从而做出正确的决策,显得尤为重要,这给认知计算技术的发展带来了新的机遇和挑战。目前国外关于认知计算的研究早于国内,但都属于较为前沿的研究领域,发表的相关文献较少,因此系统地了解认知计算,归纳总结目前国内外研究现状,分析认知计算未来发展方向具有一定的重要意义,本文通过查阅相关资料,试图给出较为准确的认知计算发展综述。

1.认知计算的由来及定义

认知是人类的一个复杂行为动作,是人们推测和判断客观事物的心理过程,是在过去的经验及对有关线索进行分析的基础上形成的对信息的理解、分类、归纳、演绎和计算,人类的认知活动包括思维、语言、定向和意识4部分。

认知科学源于20世纪50年代,该名称于1956年的一次信息论的科学讨论会上提出。60年代,认知科学开始发展起来。1976年,《认知科学》期刊创刊,1979年由Roger Schank, Allan Col lins, Donald Norman及其他一些心理学、语言学、计算机科学和哲学界的学者共同成立了认知科学协会,使认知科学得到了迅速的发展,成为了一个备受关注的学术研究领域。90年代,有人将认知科学定义为研究智能和智能系统的科学[4]。如今世界上已有60多所大学拥有认知科学的相关课程。对于认知科学的含义有着多种不同的解释,总体上,认知科学是一门以现代科学的观点,用科学的方法研究人的精神世界的学科。认知科学是包含了心理学、语言学、神经科学和脑科学、计算机科学,以及哲学、教育学、人类学等许多不同领域学科的一门广泛的综合性科学。其中认知计算是认知科学的子领域之一,也是认知科学的核心技术领域,认知计算对于未来信息技术、人工智能等领域均有着十分重要的影响。

认知计算最简单的工作是说话、听、看、写,复杂的工作是辅助、理解、决策和发现.认知计算是一种自上而下的、全局性的统一理论研究,旨在解释观察到的认知现象(思维),符合已知的自下而上的神经生物学事实(脑),可以进行计算,也可以用数学原理解释。它寻求一种符合已知的有着脑神经生物学基础的计算机科学类的软、硬件元件,并用于处理感知、记忆、语言、智力和意识等心智过程。认知计算的一个目标是让计算机系统能够像人的大脑一样学习、思考,并做出正确的决策。人脑与电脑各有所长,认知计算系统可以成为一个很好的辅工具,配合人类进行工作,解决人脑所不擅长解决的一些问题。认知计算时代,计算机将成为人类能力的扩展和延伸。认知计算意味着更高效的信息处理能力、更加自然的

人机交互能力、以数据为中心的体系设计,以及类似人脑的自主学习能力,这为人类应对大数据挑战开启了新方向。

理想状态下,认知计算系统应具备以下四个特性[5]。

第一,辅助(Assistance)功能。认知计算系统可以提供百科全书式的信息辅助和支撑能力,让人类利用广泛而深入的信息,轻松成为各个领域的“资深专家”。

第二,理解(Understanding)能力。认知计算系统应该具有卓越的观察力和理解能力,能够帮助人类在纷繁的数据中发现不同信息之间的内在联系。

第三,决策(Decision)能力。认知计算系统必须具备快速的决策能力,能够帮助人类定量地分析影响决策的方方面面的因素,从而保障决策的精准性。认知计算系统可以用来解决大数据的相关问题,比如通过对大量交通数据的分析,找出解决交通拥堵的办法。

第四,洞察与发现(Discovery)。认知计算系统的真正价值在于,可以从大量数据和信息中归纳出人们所需要的内容和知识,让计算系统具备类似人脑的认知能力,从而帮助人类更快地发现新问题、新机遇以及新价值。

2.认知计算的国内外研究现状

在国外认知计算受到了政府、研究机构以及研究人员的高度重视。2002年,美国国家科学基金会(NSF)和美国商务部(DOC)共同资助了一个雄心勃勃的计划“聚合四大技术,提高人类性能”,将纳米技术、生物技术、信息技术和认知科学看作21世纪四大前沿技术,并将认知科学视为最优先发展领域,主张这四大技术融合发展,并描绘了这样的科学前景:“聚合技术以认知科学为先导。因为一旦我们能够在如何、为何、何处、何时这四个层次上理解思维,我们就可以用纳米科技来制造它,用生物技术和生物医学来实现它,最后用信息技术来操纵和控制它,使它工作”。在欧洲,由欧盟资助的聚合技术及其对社会科学与人文科学的影响项目也同样强调了认知科学的重要性.在学术研究界,2006年由IBM阿尔马登研究中心发起了2006年认知计算会议,该会议取得了良好的效果。2007年又在加州大学召开了认知计算会议。美国国防高级研究计划署信息处理技术中心2003年开始资助的认知计算项目的重点也是研制一种能够对环境、目标和自身能力进行思考,具有学习能力,能与使用者互动并解释其推理,以及应对突发事件能力的认知计算机系统。近年来IBM公司成为认知计算的研究先锋,2011年,IBM开发的neurosynaptic(神经突触)计算机芯片为现代认知计算的研究拉开了帷幕。2012年,在美国犹他州盐湖城举行的“超级计算机大会”上,IBM了其关于认知计算的最新研究成果――《Compass:一个认知计算架构的可扩展的模拟器》,这种芯片技术是模拟一个人脑,并且完成人脑的各种功能[6]。2013年10月2日,IBM研究院宣布成立“认知计算研究联合会”。据了解,以IBM沃森(Watson)为代表的认知计算系统通过对大数据进行实时运算和分析,实现了自主学习并拥有了类似人脑的能力,它有效地提供信息,并且按我们的条件在人们每天面对的众多的自然语言内容里搜寻关键知识。并且已经成功应用于医疗、金融和客户服务等领域,以其更加智能、精准的大数据分析能力,降低误诊、拯救生命和提升客户体验。IBM近日又宣布将与卡内基梅隆大学、麻省理工学院、纽约大学和伦斯勒理工学院四所大学合作制造一种类似人类大脑的计算机,将能够处理自然语言和非结构化数据,像人类一样通过经验进行学习。

我国对认知科学及认知计算的研究尚处于起步阶段,多数研究是对国外相关研究的介绍和总结。国内涉及该领域的研究人员多数是哲学、心理学领域和信息技术领域。许多研究虽然涉及认知计算技术,但多数将其纳入人工智能的研究,很少使用认知计算这一概念,至今还没有关于认知计算的综述文章。2008年国家自然基金委员会了“视听觉信息的认知计算”重大研究计划,重点包括多模态信息协同计算、自然语言(汉语)理解、脑-机接口、驾驶行为的认知机理和无人驾驶车辆集成验证平台等领域,该重大计划的实施将有力地推动我国认知计算领域相关研究的发展,截止到目前已在视听觉信息处理的基础理论研究方面取得重要进展,在视听觉信息计算以及与视听觉认知相关的脑-机接口等关键技术方面取得重大突破。2013年10月11日,在北京举办以“从大数据到认知计算”为主题的认知计算研讨会,达成“我们已经进入了认知计算(Cognitive Computing)的新时代”的共识,2013年11月13日在MDCC 2013移动开发者大会上中国工程院院士李德毅发表了题为《大数据时代的认知计算》的演讲,充分体现了当前我国学者对认知计算技术方面研究的高度重视[7]。

3.认知计算目前研究的重点和难点

人类的认知主要依靠大脑来实现,为了能够让机器像人一样具有认知能力,有必要深入探讨和研究人脑与计算机在存储和处理信息时的区别,来确定认知计算的研究目标以及研究的重点和难点。

就目前生物学家和神经学家对大脑研究成果可知,人类大脑将记忆和存储整合成一体,重量小于3磅,占用体积大约两升,却比灯泡更加节能,人脑大约包含1011个神经元,每个神经元大约有103~104个树突及相应的突触,形成极为错综复杂而灵活多变的神经网络,虽然每个神经元的运算功能十分简单,且信号传输速率也较低(大约100次/秒),但由于各神经元之间形成的网络结构具有极极度并行互连功能,使人的大脑能够高速处理复杂信息。人类大脑的运行就像是一个大规模并行分布式处理器,属于事件驱动方式,也就是说它对其所处环境中的事物做出反应,活动状态时耗能较少,休息状态下更少。人类大脑会重复利用神经元,并突触、异步、并行、分布式、缓慢、不具通用性地处理问题,是可重构的、专门的、容错的生物基质,并且人脑记忆数据与进行计算的边界是模糊的。

而现代计算机是基于冯诺依曼结构的二进制存储和中央处理器的分离机制,它的运行大部分是按照顺序依次进行的,并由一个时钟控制。这个时钟就像是军乐队的一个指挥,将每一个指令和每一份数据驱动到下一个位置――就像有足够空位的音乐抢椅子游戏。随着时钟增速以更快驱动数据处理速度,功耗也随之大幅上升,甚至在休眠时这些机器也需要大量的电能。更重要的是,编程是必不可少的.它们由电线连接,并且容易出现故障。它们善于执行的是预定义的算法以及分析工作。一般情况下计算机使用固定的数字化的程序模型,同步、串行、集中、快速、具有通用性地处理问题,数据存储与计算过程在不同地址空间完成。

由此可知,人类大脑和现代计算机具有完全不同的架构,它们的存储和处理机制完全不同,无论我们再努力多少年,以现代计算机为基础的认知计算无法模拟人脑的功能和实时反应,不能像人类大脑一样实现灵活而高深的认知过程,完成这个任务需要一个新颖的架构,这正是认知计算目前面临的难点和重点。

认知计算是一项系统工程,涉及多个领域的技术,目前研究学者公认的认知计算的四大关键技术为以下四个方面[6]。

第一,在认知计算最顶层的是机器学习、自然语言理解和人机交互等技术。

第二,大数据技术,包括以什么样的方式来存储、组织、管理及分析大数据等。

第三,计算机的架构。认知计算系统所要求的计算能力远高于我们今天所能提供的计算能力。因此,如何实现以数据为中心的系统设计也是当前面临的挑战。

第四,在认知计算系统的底层还需要实现原子及纳米等技术方面的突破。

在上述认知计算的四个关键技术中,由于人脑与计算机有着本质区别,就目前认知计算的研究现状,其研究方向应该分为近期目标和远期目标,其中近期目标是认知计算的研究重点,远期目标是认知计算的研究难点。

作为认知计算的近期目标就是在计算机上尽可能像人类一样实现具有辅助、理解、决策和洞察与发现的能力,通过研究人类的认知机理,建立计算机认知模型,然后用计算机模拟人类认知的过程来处理实际问题,如目前正在处于研究阶段的人工智能机器学习、自然语言理解、视听觉信息的识别以及智能人机交互技术的研究等,而基于计算机的任何认知研究成果都无法实现机器认知的实质突破。

作为认知计算的远期目标应该是研究一个具有与大脑存储结构相似的电子大脑,新的电子大脑完全不同于目前的计算机存储和处理机理,而它像人类大脑一样实现灵活而高深的认知过程,为此我们需要不懈的努力,真正弄清人类大脑存储和处理信息的机理,建立合理的数学模型,并通过软硬件设计实现在存储和处理方面具有新机制的全新电子大脑结构,力争创造一种能够与真正人类大脑相比拟的新型智能机器。

IBM阿尔马登研究中心在这个方面进行了有益而尖端的研究,给认知计算的未来发展带来信心。他们设计了神经形态自适应塑料可伸缩电子系统,为大脑的接线图绘制地图并开始人工合成,2009年5月他们成功地模拟建立了一个由10亿个神经元组成的系统,大约相当于一个较低等哺乳动物的大脑,系统结构同今天的计算机完全不同。存储器与处理器组件被紧密结合在一起,它没有时钟,操作是不同步的、事件驱动的,也就是说,它们没有预定的次序或时间表,像人类一样依赖的是学习而非编程。但其处理速度是实际事件发生速度的千分之一,不足以执行人类基本行为:觅食、打架、逃跑和。

2012年9月该实验室模拟大脑建成了一个较小版本的硬件装置,只有256个神经元、26.2万个可编程突触和6.5万个学习突触,并且这台机器运行能耗跟大脑的耗能在同一个数量级上。基于其原生态能力,这个“小型人脑”可以进行空间导航、机器视觉、模式识别以及联想记忆等,并可以基于证据生成假设。它有一个“心灵之眼”,可以辨别出事物背后的模式,例如根据一个潦草的笔记,对其实际所代表的数字做出较为准确的猜测,这一成果已经比我们前寒武纪的祖先优秀了。

4.认知计算的未来展望

在下一个计算时代,计算系统将具备学习、适应和感知的能力,这将从根本上改善人们的生活、工作和人际交往的方式,这就是认知计算时代,计算机将成为人类能力的扩展和延伸。认知计算意味着更高效的信息处理能力、更加自然的人机交互能力、以数据为中心的体系设计,以及类似人脑的自主学习能力,这为人类应对大数据挑战开启了新方向。

可以相信,随着认知计算技术的发展,认知计算系统所具备的四个层次的特性――辅助、理解、决策、发现,将是人类面对大数据时代的挑战、做出智慧决策的保障.百科全书式的信息辅助和支撑,让人类可以利用广泛而深入的信息,轻松成为各个领域的“资深专家”;非凡的观察和理解能力,帮助人类在纷繁信息中发现其内在的关联和涌现的趋势;快速决策能力,帮助人类定量地分析影响决策的方方面面,降低失误,保障决策的精准性;发现及洞察能力,将实现从“演绎”到“归纳”的突破,真正让机器具备类似人脑的“认知”能力,帮助人类发现当今计算技术无法发现的新洞察,新机遇及新价值。

目前作为认知计算系统的先锋,IBM的沃森系统已经应用于医疗、金融和客户服务等领域,以其更加智能、精准的大数据分析能力,降低误诊、拯救生命和提升客户体验[7]。

2013年9月18日国家自然基金委公布2013年度关于认知计算的重大研究计划,重点支持如下两个领域,将是目前我国在认知计算领域的未来研究方向。

(1)基于视听觉认知机理的无人驾驶车辆与行驶环境理解。

针对无人驾驶车辆行驶需求,研究生物视听觉信息处理不同阶段的认知机理和计算模型:包括视听觉信息早期处理(视听觉信息预处理与增强)、中期处理(降维、特征选择与提取)和后期处理(分类、识别与理解)等不同阶段的认知机理与可计算模型。

1)基于视听觉认知机理的无人驾驶车辆

该集成项目要充分集成和体现在本重大研究计划资助下所取得的有关视听觉信息认知机理与计算机视觉方面的重要创新性成果,同时还要集成和体现在本重大研究计划资助下所研发的智能车关键技术与器件(如控制器、激光雷达、传感器和芯片技术等),研制无人驾驶车辆平台,实现复杂交通环境下高性能长距离自主行驶。

2)基于生物视觉机理的交通环境理解与目标检测

研究基于生物视觉机理及其视觉皮层信息处理机制的交通环境理解新模型和高效视觉信息处理方法。

(2)先进脑机接口与脑认知图像重建.

1)先进脑机接口

借鉴认知科学的已有研究成果,重点研究人脑行为意图信息可靠、快速获取、处理、分析和应用的新方法与新技术。

2)脑认知图像三维重建

重点研究人在一种或多种脑神经影像设备下的视觉场景激励方法、脑神经影像的表征与时空关联关系以及视觉场景激励与脑认知影像之间的数学映射模型,给出动态脑认知影像的三维重建模型和方法,探索理解与重现脑认知过程。

未来,认知计算在人类生活的各个方面都将带来根本性的改变.可以想象,在实时金融风险控制领域,认知计算技术可以让人们实现秒级的风险检测与防范;在教育领域,认知计算通过实时分析技术,为学习者制定个性化的教育计划并及时评估学习效果,以此优化教育方案,提高教育质量和效率。

5.结束语

认知计算是一个能够给人类生活带来不可思议变化的智能技术,文中通过对认知计算相关文献的归纳总结,综述了目前认知计算的国内外研究现状,通过分析计算机与人脑的区别,给出了今后研究的远期近期目标以及未来展望,对认知计算的总体认识和深入的研究具有一定益处。总之认知计算是一个贯穿整个计算机软硬件的整体创新,它的实现需要来自各个领域科学家的共同努力,需要一个漫长而艰苦的研究过程,但是认知计算技术的发展,必将是未来科技发展的趋势。

参考文献

[1]史忠植.认知计算[M].合肥:中国科学技术大学出版社,2008.

[2]瞿心昱.基于仿人脑认知计算模型的机器人视觉学习方法[D].浙江:浙江工业大学,2012.

[3]王志良,郑思仪,王先梅,王巍.心理认知计算的研究现状及发展趋势[J].模式识别与人工智能,2011,24(2):215-225).

[4]徐峰,冷伏海.认知计算及其对情报科学的影响[J].情报杂志,2009,28(6):19-23.

[5]郭涛.认知计算更好驾驭大数据[N].中国计算机报(数据中心),2013-10-21(18).

[6]何立中.认知计算架构突破传统模式[N].中国计算机报(热点观察),2012-12-10(7).

[7]申明.电脑会思考,认知计算前景广阔[N].科技日报,2013-10-28(4).

基金项目:国家自然科学基金项目(编号:61175126);中央高校基本科研业务费专项资金项目(编号:HEUCFZ1209);高等学校博士学科点专项科研基金项目(编号:20112304110009)。

作者简介:

毕晓君(1964―),女,哈尔滨工程大学信息与通信工程学院教授,博士生导师,主要研究方向:智能信息处理、图像处理。

计算机视觉心得体会篇7

【关键词】农产品 计算机视觉技术 品质检测

农产品品质检测工作中除了采取人工检测法以外,还可以采取半自动或自动检测法,如在水果分级检测工作中的质量分级检测法、光电分选法以及大小分级法等。然而农产品品质会受到自然生长环境或人为因素等方面的影响,农产品的色泽、大小及形状等并不相同,无法采取单一指标进行检测。因此充分应用计算机视觉技术,对农产品的品质进行检测,极为重要。

1 计算机视觉技术

计算机视觉技术又被称为机器视觉技术,指的是通过人类设计,在计算机环境下,达到再现或模拟人类视觉相关的职能行为的一种技术,包括了印刷和手写文字的识别技术,图像模式识别技术,物体三维表面形状识别技术、距离识别以及速度感知等技术。该技术是诸多学科的结合与交叉,涉及到数学、生理学、信息处理、物理学、光学以及计算机等多种学科。探究计算机视觉技术的目的在于实验人类视觉的再现及延伸,即再现高等动物的视觉系统,并对物体形状以及类别进行识别。

此外,计算机视觉技术处理的原始资料多是图像,所以该技术和图像处理以及模拟识别等有着紧密的联系。现阶段,计算机视觉技术在诸多领域有着较为广泛的运用,包括了医学辅助诊断、资源调查、卫星图像解释、军事指导、灾害监测、气象以及工业产品的外观筛选及检测等。同时研究该技术在农业工程领域中的应用,也成为了热门话题。

2 在农产品品质检测中,计算机视觉技术的具体应用

笔者在查阅相关文献资料的基础上,探究在农产品品质检测工作中,计算机视觉技术在产品表面缺陷以及损伤识别工作中的具体应用;果形识别工作中的具体应用;农产品尺寸以及面积检测工作中的具体应用。

2.1 在产品表面缺陷以及损伤识别工作中的具体应用

在对农产品进行分级的过程中,依然存在着一大问题,即农产品表面缺损以及损伤识别。而早在1984年就已经出现了采取线扫描和模拟摄像机针对苹果表面损伤进行检测的实验报道,实验结果显示,采取数据技术能够检测出苹果表面损伤,其检测结果完全能够达到人工分级的精度。与此同时,还出现了一种机器视觉系统,该系统将不规则的图像信息与正常的图像信息区分开来,在去除蔬菜内的杂物以及检测农产品的污点等方面能够取得较好的应用效果。此外,在1989年,国外出现了一种全新的计算方法,即运用红外线扫描摄像机,处理苹果表面的灰度图像,既能够确定苹果表面的损伤面积,还能够区分不同损伤区。然而还技术是以机械装置的设定为基础,需要消耗2s的时间,对一个苹果进行检测,苹果表面缺陷分级精度以及损伤分级进度并不高。

我国在1997年,出现了运用计算机图像处理技术对苹果损坏自动化检测的试验研究,该试验结果显示,该技术的损坏检出率较高,能够规避果梗区以及花萼区对于坏损区域识别的具体影响,且该检测技术的鲁棒性较强。

2.2 在果形识别工作中的具体应用

果形识别是影响水果质量的重要因素之一,对于水果品质检测有着重大意义。当水果成熟后,水果的外形将会发生巨大的改变,且无法采取数学方法进行鉴别,采取其他方式进行果形识别极为重要。

在1981年,有研究人员就针对形状识别中的图像特征进行了探讨,提倡采取结构分析法以及外形轮廓曲线检测法,针对水果外形进行识别。并在1985年,以数字图像分析技术以及模式识别技术为依据,针对番茄定向、番茄形状、表面缺陷以及尺寸进行分类的特殊算法,运用灰度梯度曲线,明确番茄表面缺陷以及花萼位置等。而我国则在2000年,按照果实形状分析,通过连续性指标、半径指标、连续指标对称性、半径指标对称性等特征参数,表示果形,并首次采取参数形状分析法。

2.3 在农产品尺寸以及面积检测工作中的具体应用

农产品分级中,以农产品外形尺寸为依据。在1987年,国外就已经开始研究机械视觉技术在牡蛎肉分级以及尺寸检测工作中的具体应用。并在1992年,针对人工检测以及机器视觉检测进行进行了对比分析,试验结果显示,和人工检测技术相比,采取视觉检测技术,能够提高检测的精确度,减少检测消耗时间;同时在评价以及推广种质资源中,准确的测量以及详细的记录种质形态的指标,有着极为重要的意义。为了能够精确、快速地计算出玉米种质尺度,在1995年,有研究人员就提出了自动化选择技术,该技术在处理玉米种质图像中,其辨别精度极高。

而我国在2002年,有研究人员就针对水果品质进行动态、实时监测的智能化分级生产线进行了研究,该生产线,首先通过水果输送翻转系统,利用滚筒式输送翻转装置,将水果往前输送,在输送过程中,以水平轴为中心,保证水果表面能够被系统检测到,以此获得图像信息。然后利用计算机视觉识别系统,对水果等级进行判断,明确图像信息。该系统具备了视觉识别功能。最终通过分级系统,完成水果分级工作。

3 结语

在二十世纪七十年代以后,计算机视觉技术就已经得到了较为迅速的发展,在我国,该技术在农产品品质检测中的具体应用也得到了人们的高度关注,同时也取得了一定的成效。计算机视觉技术作为人眼的延伸技术之一,其具备了人脑功能,运用该技术代替以往的人工操作技术,已经成为了农产品品质检测工作的必然发展趋势。

参考文献

[1]朱从容.计算机视觉技术在水产养殖中的应用[J].浙江海洋学院学报(自然科学版),2008,10(04):191-192.

[2]王勃,徐静.计算机视觉技术在苹果叶片营养诊断上的应用[J].农机化研究,2008,(03):887-888.

[3]李朝东,崔国贤,盛畅,等.计算机视觉技术在农业领域的应用[J].农机化研究,2009,10(12):667-668.

作者简介

陈超(1995-),男,福建省福州市人。现为北京交通大学在校学生。研究方向为电子科学与技术。

作者单位

计算机视觉心得体会篇8

【关键词】株高 HALCON 双目视觉 误差修正

1 引言

计算机视觉技术是近几年来发展较快的信息处理技术,随着图像处理技术的专业化、计算机硬件成本的降低和速度的提高,计算机视觉的应用已变得越来越广泛,其中不乏在农业中的应用。

株高是植物生长指标的重要参数,是一个物种争夺阳光的能力的主要决定因素[1]。对于作物来讲,株高参数是作物产量预估不可或缺的参数。

然而对于具体的利用机器视觉方法直接测量株高的研究还是比较少的,本文就是利用HALCON软件,采用双目计算机视觉方法来实现株高的测量。

2 双目视觉原理

双目视觉的基本原理是从两个视点观察同一景物,获取不同视角下的两幅图像,然后根据三角测量原理计算不同图像对应像素间的视差(disparity ),获取景物的三维信息,从而实现场景三维重构。

根据两个摄像机位姿的不同,双目视觉有多种模式,常用的有双目横向模式,双目横向会聚模式以及双目纵向模式(也称双目轴向模式)。

为了增加测量精度,基线一般不能太小,但基线长度也不可太长,否则,由于物体各部分相互遮挡,两个摄像机可能不能同时观察到目标点。

图1是会聚双目成像中的视差原理图。图中给出两镜头连线所在平面(XZ平面),两镜头中心间的距离(即基线)是B,两光轴在XZ平面相交于(0,0,Z)点,交角为(未知)。现在来看如果已知像平面坐标点(x1, y1)和(x2, y2 ),如何求取世界点W的坐标(X,Y,Z)。

根据相似三角形的关系可以很明显得出: (2.1)

(2.2)

(2.3)

其中r为从(任一)镜头中心到两系统会聚点的距离(未知)。将式(2.2)和(2.3)联立, 可得:

(2.4)

上式把物体和像平面的距离Z与视差d直接联系起来,若想求解式(2.4),除视差d外,还需要知道x1和x2本身。另外,由图1可以得到:

(2.5)

代入式(2.2)或(2.3)可得:

代入式(2.2)或(2.3)可得:

(2.6)

现实测量中,两相机的光轴与世界坐标Z轴的夹角不可能相等,不过即便如此,也只会引入几个待确定的三角函数,而这些三角函数在相机标定时即可确定。

3 测量过程

实现该测量过程包括如下几个功能模块:图像获取、摄像机标定、特征提取、立体匹配与三维信息恢复、后处理。本实验采用是分比率为960×720的双摄像头。被测区域大小约为56cm×42cm,所以采用的标定板应为被测区域1/3大小的HALCON专用的200mm标定板。标定数为24×2张图片。利用HALCON自带的标定助手,可以轻松实现单目标定。

双目标定时,需要有15张以上左右相机相同时刻拍摄的标定板的图片。再利用for循环,find_caltab函数,find_marks_and_pose函数以及binocular_calibration函数,可以实现双目标定。将标定过程中,获得的摄像机的内参以及两个摄像机相对位置关系作参数传递给函数gen_binocular_rectification_map,可以很好地实现双目视觉校正的目的,得到两幅校正后的图像,还能得到校正后虚拟立体视觉系统中两个摄像机的内参和外参。

不同种类的植物其株高定义不同,测量方式也不尽相同。本文研究的株高只针对直立型的,是指从植株根部露出土壤部分到植株最高处的株高。

先利用gen_binocular_rectification_map函数为map_image函数提供控制参数,再通过map_image函数对采集到的图像做校正处理,利用threshold函数,fill_up_shape函数以及select等函数找出校正后图像中植株的最低和最高点,利用intersect_lines_of_sight函数,可获得植株最低点和最高点的真实三维坐标,最后通过几何运算得到双目测量结果。

我们在图像采集时就应该考虑到,摄像头应该稍微带一点俯拍的角度,保证左右两幅图像上最高处均为现实坐标中的最高处。切忌俯拍角度不可太大,否则由于拍摄角度而引起的像差会很大,对结果将会有很大的影响。

经过以上几步骤得到的三维坐标,常因各种原因而存在一定的误差,需要进行误差校正。我们对已知高度的对象进行了测量,得出结果如表1:

通过上述数据得出的修正关系如下:

y=-0.0002x2+1.0699x (3.1)

其相关系数R2=0.9993

4 实验结果

我们对三种植物进行了测量得出的结果如下:

从测量结果中可以看出,修正后相对误差控制在2%之内,可以接受。误差引入的原因可能如下:

1、标定板的选择决定了标定精度。一定要选用高精度的标定板,且标定板的大小应约为测量范围1/3大小。

2、相机是图像获取的根本,高质量的图像离不开高分辨率相机,但是高分比率,高解析度的相机又会带来成本上的提升。本文中,对于390.0mm左右的对象,1个像素的误差可以带入约0.4mm的实际误差。

3、本文所采用的算法只能针对比较理想,比较直的植株,算法的不断优化,才能不断减少误差,提高精度。

5 结语

本文介绍了一种基于HALCON的,利用双目视觉测量株高的方法。对于直立型植物,通过对立体匹配与三维信息恢复结果的误差修正,其株高测量相对误差不超过2%,方法具有一定的可借鉴性。

参考文献

[1]章毓晋.计算机视觉教程 [M].北京: 人民邮电出版社,2011.

作者简介

郝慧鹏(1988-),男,内蒙古乌兰察布人,硕士研究生,主要研究方向为计算机视觉技术在农作物检测上的应用。

指导老师

田跃(1956-),男,北京人,北京科技大学数理学院物理系教授,北京市弱磁检测及应用工程技术研究中心副主任。

作者单位

1.北京科技大学数理学院 北京市 100083

上一篇:阅读教学的规律范文 下一篇:新闻与传播学研究方法范文