计算机视觉技术基础范文

时间:2023-12-18 16:28:33

计算机视觉技术基础

计算机视觉技术基础篇1

关键词: 多媒体教学; 多媒体技术; 计算机技术; 心理学; 教育

Abstract: Multimedia technology is technically synthetic, integrative, multidimensional, digitalized and distributive. So multimedia teaching is brought into practice on the basis of these technical distinctions. In fact, multimedia teaching technology depends not only upon computer technology but also upon the learner's psychological characteristics and pedagogical principles. Application of multimedia technology in education calls for developing multimedia teachingsoftware and utilization of creating instruments and fabricating reality technology.

Key Words: multimedia teaching; multimedia technology; computer technology; psychology; education

多媒体教学的发展,与其技术的发展有直接关系。在一些相关论著中,学者们更多的是对多媒体教学技术的论述,强调的是技术,而很少涉及学习者和教育者这样的“人的因素”。虽然对多媒体教学技术的研究是不可缺少的,但是探索多媒体教学的心理机制和教育基础则更为重要,因为人类是以完全不同的方式来加工多媒体教学的。只有这样,才能在多媒体教学中考虑学习者和教育者的主体性。

一、 多媒体教学技术及其计算机基础

多媒体与多媒体技术应视为同义词。关于多媒体技术的特点虽然还没有形成共识,但是,也有一些基本的共同之处。早在1996年,吴炜煜先生在《多媒体世界》撰文提出了多媒体五大特点:1.将不同的媒体数据都表示成统一的结构码流;2.实行新的技术标准体制,以适应系统级集成和规范相关产品的性能指标;3.建设“全球信息高速公路”;4.应用“双向性设计”,统一信息提供者、接受者和控制者的关系;5.赋予信息系统对客观世界信息的自然模拟与处理能力。[1]华中师范大学傅德荣教授认为,多媒体特点主要有:1.整合性,通过计算机实现多种单媒体的整合;2.数字化,将各种单媒体变换成数字信息,读入计算机进行统一的整合,数字化技术是多媒体技术的一种基本技术;3.交互性,交互成多媒体系统;4.超媒体,是一种网状式的结构形式。[2]3黄孝建先生主编的《多媒体技术》一书指出,“多媒体技术是一种能同时综合处理多种信息,在信息之间建立逻辑联系,使其集成为一个交互式系统的技术。”“多媒体的关键性在于信息载体的多样性、交互性和集成性。这也是多媒体技术研究中必须解决的主要问题……多媒体系统一般具备如下功能:捕捉、操作、编辑、存储、呈现和通信,为用户服务。”[3]

根据以上关于多媒体技术的几种观点,我们认为,多媒体技术主要有5个特点:一是整合性。多媒体实时地综合,把文本、图形图像、声音、动画以及视频这些媒体中组成两种或两种以上的结合体,为的是借鉴各种媒体的优势,形成一种在功能上更加完善的体系。二是集成化。多媒体表示的并不单纯是信息的多样性,而是通过多种媒体表现、多种感官认知、多种仪器设备、多学科汇聚、多领域应用等交互作用,集成信息码流、设备控制、人与客观现实关系的一体化。三是多维式。多媒体是趋于人性化的多维信息处理系统,目标是要尽可能实现让人类在现实生活的自然环境下,保持信息交流的高保真效果、通信带宽和交互控制能力。四是数字化。多媒体具备数字化处理系统,其信息是一种数字化的信息,其信息结构是一种超媒体的网状式结构,所以高速宽带网络支持多媒体通讯和资源共享,建造全景化虚拟世界数据库成为现实。五是分布式。目前,多媒体技术正朝着分布式的方向发展。分布式多媒体是一门综合性技术,它集计算机的交互性、网络的分布性和多媒体信息的综合性于一身,突破了计算机、通信等传统产业间相对各自独立发展的界限,是计算机和通信领域的一次革命;分布式多媒体的发展涉及两个关键性的技术问题,一个是多媒体网络技术,网络的频宽、信息的交换方式及网络的高层协作,这直接决定着网络质量;另一个是数据压缩技术,使信息量巨大的多媒体数据、特别是视频和声频数据得以在网络上传输;分布式多媒体向社会提供全新的信息服务,使用户不但可以选择播放的节目以及内容,而且还可利用此系统得到诸如咨询、交流等信息服务。多媒体教学正是在上述5个技术特点的基础上实施的,这些技术特点,为我们提供了教学领域内各种综合性的信息服务,并帮助地理位置不同、时间安排不同的用户,克服各种障碍来共同完成教学任务。由此可以看出,在对多媒体教学技术及其计算机基础的理解中,我们不仅要重视计算机的技术,而且也要关注人与机器的关系、人性化的系统和用户至上的观念。

多媒体并不是多媒体计算机的代名词。多媒体计算机只是多媒体的一个特例。[4]它既有计算机的显著特性,又有多媒体的功能,所以学校进行多媒体教学时,通常以多媒体计算机为载体。然而,多媒体计算机仅仅是多媒体系统中的一个分系统,因此,它常常被认为是多媒体中的一个典范,或者说是多媒体的一种狭义的范畴。

多媒体教学为什么要应用多媒体计算机?计算机虽然也是单一的媒体,但它同电视、音响的不同之处就在于它具有强大的扩展性。就目前的科技水平来说,只要在计算机内加上适当的部件,就多了相应的媒体功能,对于多媒体教学来说,非常简便、经济,更重要的是它还能“胜任”多媒体教学的功能,是不可多得的优质的技术设备,必然被学校广泛应用。多媒体计算机正在以我们无法想象的速度发展。其主要作用是让计算机的使用和操作更加接近于人们的日常生活,使人们在日常生活中用各种各样的媒体交换信息。如使用纸张、广播和电视交换新闻、消息和知识。多媒体计算机技术可以使家用电脑用声音媒体、光学媒体和动画媒体来交换信息,它在教育中有着广泛前景。在多媒体教学中,它主要通过文字、声音、图形图像以及视频与动画这4个方面媒体的形式呈现出教学软件,掌握这四方面媒体的制作,成为制作多媒体教学软件的基本技能基础。

二、 多媒体教学技术及其心理基础

从媒体技术的基础来分析,多媒体教学技术离不开视觉媒体技术、听觉媒体技术和触觉媒体技术等。多媒体信息是这些媒体信息数字化后整合而成的,如前所述,数字化技术是多媒体技术的基础技术。在数字化的过程中,各种单媒体有各种不同的国际标准,然而,如果重视“感觉通道说”[5],那么就要在探讨这几个方面的媒体技术问题的同时,必须揭示使用者(尤其是学习者)的感觉、知觉的心理机制,特别是人的视觉和听觉特征。

多媒体教学技术的出现扩展了人们用视觉模式呈现材料的具体途径。视觉材料包括文本信息、图形图像信息、视频信息。这些信息通过视觉媒体技术数字化后整合为多媒体信息。在这个过程中,我们对其技术上要作四点说明:第一,视觉媒体是一个非常复杂的信息系统。文本信息是文字信息的集合,它既是一种符号系统,又具有颜色、大小和种类等特征;图形是点、线、面、体等信号的集合,以面为例,不仅指一般的平面图,还包括曲线、地图、设计图等;图像是静止图像和活动图像的集合,所谓视频信息就是活动或运动的图像信息,它由一系列时间轴(周期)呈现的画面构成。第二,视觉媒体信息的数字化是根据上述各种视觉媒体信息的特征进行的。不管是文本信息还是图形信息,它们的数字化都是各自按编码的国际标准完成的。第三,视觉媒体的各种信息根据不同信号实现数字化。静止图像是一种二维信号,先要经过扫描转换成一维信号,再经过采样、量化、编码实现数字化;活动图像的视频按一幅一幅的静止图像以一定周期展示,每一幅的数字化方法与静止图像类似。第四,视觉媒体信息处理是一种按照物理学原理进行的技术。它们都是利用光电和电光转换原理,把光学图像转换为电信号进行处理后再还原为光图像。

为了使

多媒体教学技术的视觉材料更容易被学习者所接受,就必须要顾及人的视觉心理基础,也就是说,上述视觉媒体技术只有通过视觉心理机制才能实现多媒体教学的目标。这里,我们也要强调四点:第一,多媒体技术要考虑光的物理三属性所引起的视觉的三种心理机制。视觉的刺激是光,光是电磁波,电磁波的范围很广,而人可见的电磁波只占电磁波的一小部分。波长不同,会使我们在视觉上产生色调的差别,从而产生不同的色觉。色觉不仅取决于由波长所引起的色调,还和主观感觉的明度和饱和度有关。明度是对光波强度(振幅)的反应,饱和度则由物体发射或反射的光的纯度来决定。所以,多媒体教学技术在视觉媒体设计上要处理好可见视觉、色调、明度和饱和度这几方面的关系。第二,多媒体教学技术要考虑对感光物质的视觉感受器心理机制。视觉感受器的真正感光器官是视网膜上的一些细胞,其中锥状细胞感觉颜色,棒状细胞感觉明度,这两种细胞中感光物质的化学性质不同,光使这些物质分解,色素被漂白,从而刺激了感受细胞的膜,引起神经冲动。所以,多媒体教学技术在视觉媒体设计上要研究这两种感光物质的化学性质。第三,多媒体教学技术要考虑视觉过程, 即 眼睛看东西是一个编码过程,视网膜上的不同感受野在视觉中枢有不同的神经细胞,各有其 功能,不同的细胞对所刺激信息系统的不同特征分别反应,并像计算机那样编码,这种编码实际是对一些图像的辨认。所以,多媒体教学技术在视觉媒体设计上要利用好视觉感受野与信息的特征。第四,多媒体教学技术要考虑各类视觉现象,特别是决定视力高低的视角、强弱光下的适应、视觉后暂留的后像、不同背景的视觉对比、不同明度下对不同光波长的感受性等等造成视觉的各种差异。所以,多媒体教学技术在视觉媒体设计上要运用各类视觉现象产生的规律。

在多媒体教学技术中,视听是紧紧地联系在一起的。在计算机环境下,眼睛知觉动画图像,耳朵则知觉解说语言;在演讲的情境中,视觉通道加工投影仪上幻灯片的内容,听觉通道则加工演讲者的声音。听觉材料主要是声音,包括语言信息、音乐信息和效果声信息。这些信息通过听觉媒体技术上数字化后整合为多媒体信息。在这一过程中,我们从技术角度作如下三点说明:第一,声音信息尽管是一种一维的模拟信号,它可以通过采样、量化、码字分配实现数字化,但它比文本信息的数据量要大,通常采用呈现声音和声音合成技术。第二,声波是起源于发声体的振动,在弹性媒质中传播的是一种机械波。它在气体或液体媒质中传播的是纵波,在固体媒质中传播的则是纵波、横波或两者的复合。声音信号有时域特征、频域特征和声色与失真特征。第三,声频或音频是人耳可闻的振动频率,频率范围每秒钟约为20-20 000次(赫兹),声频信息数字化后其数据速率大、保真度好和动态范围大。当然,对于不同类型的声频信号,其信号带宽是不同的,电话、调幅广播、调频广播和激光唱盘等的声频信号是有较大区别的。随着声频数字化的发展,压缩编码技术是多媒体教学技术的关键之一。

要使多媒体教学技术的听觉材料被学习者更容易接受,也必须顾及人的听觉心理基础。这里,我们仅作两点分析:第一,多媒体教学技术要考虑声音的物理三属性所引起的听觉的三个特征。正像光有三种物理属性一样,声音也有三种属性,即振动的频率、振幅的大小、基音与陪音的倍数配合关系,以及所产生的听觉的音调(或因高)、音强(或响度)和音色的三个特征。人对不同音调的感受性是有差别的,尽管声频在20-20 000 Hz范围,但声频为1 000-4 000 Hz之间音调感受性较好(即阈限较低),这是由于耳膜神经纤维承担的振动频率所决定的。测量音强的方法以分贝(dB)为单位,这是物理学与心理学都认可的,即两个声音之间的强度比率为1∶1.26(1分贝),因为1.26是能清楚辨别出两个声音振幅大小的区别。人的音色是由基音和陪音的不同比例的配合决定的。在音调和音强相同的情况下,人们之所以能够分辨出是哪种琴所演奏的曲子,正是由于不同琴的基本振动(基音)与分段振动(陪音)的比例是不一样的,这种比例成整数倍数为乐音,不成整数倍数则为噪音。所以,多媒体教学技术在听觉媒体设计上要利用好音调、音强和音色的三个特征。第二,多媒体教学技术要考虑听觉的感受野。因为听觉神经细胞是有分工的,研究指出,听觉中枢神经细胞有40%只反应噪音而不反应乐音,另外60%的神经细胞对乐音的反应也有分工。[6]冲动频可以出现在声音的出现时,可以出现在声音消失之后,也可以出现在声音出现和消失的一刹那;可以在声频降低时发生变化,也可以在声频升高时发生变化。一句话,听东西也是一个编码的过程,即在听觉的范围内也会有视觉中那种感受野的情况。由此可见,听东西绝不是简单的录音,听觉过程是有分工的,是一个侦察器在那里侦察。所以,多媒体教学技术在听觉媒体设计上要揭示听觉感受野,以及反应乐音与噪音信息的特征。

由此可见,我们在分析多媒体教学的相关技术的同时,也要注意学习者的心理基础,因为学习者是以特有的心理活动的方式来加工视觉和听觉等媒体信息的。

三、 多媒体教学技术及其教育基础

在教育中应用多媒体技术,首先是多媒体教学软件的开发,此外,创作工具和虚拟现实等技术也在教育中应用。每一种技术既为教育服务,又有其教育的需要和基础。由于教育对象是人,所以在教育中不管怎样去应用多媒体技术,都要体现每一种技术为人服务,并把学习者和教育者的要求作为出发点。

多媒体教学软件是为教育制作的以计算机为基础的教育应用软件,它包括计算机辅助教学软件、计算机管理教学软件以及应用于教育的图标统计类等的实用软件,其中多媒体教学软件是核心技术。多媒体教学软件的开发,是一项对视觉媒体、听觉媒体和触觉媒体数据加以分析、处理和编辑的过程,这个过程包括两个环节,即设计和制作。在多媒体教学软件的开发设计中,有一个编写稿本的重要技术。傅德荣教授在《多媒体技术以及教育应用》

一书中设专章论述这个问题。他指出,“稿本是表示多媒体教学软件内部结构的各种文档的总和。它是一种多媒体文档。编写稿本的实质是多媒体教学软件的设计”。[2]230这个设计包括三个方面:一是总本设计,涉及内容结构分析、开发策略、超媒体的结构框图和制作原理等;二是详细设计,设计超媒体结构设计、人机界面设计、学习流程设计和框面设计;三是媒体数据设计、涉及静止图像数据设计、视频图像数据设计,动画数据设计和声音数据设计。稿本编写体现出工作的计划和制作的蓝图;成功的稿本编写是多媒体教学软件开发成功的一半,多媒体教学软件就是根据稿本进行制作的。与此同时,多媒体化的教学设计把活动分为三种类型,有课堂型、课外型和知识扩展型。多媒体教学软件设计要从教学实际出发,根据这三种教学模型编制教学软件,前两种属于课程软件,后一种属于参考软件。多媒体教学软件的制作,既需要有多媒体计算机等硬件环境,又需要有多个媒体数据整合而成的软件环境。在制作中,有一个立项、写本、编辑、加工、整合等开发流程;要使用某种算法语言和各种工具的两种方法,强调坚持教育性、可调节性、因材施教和非结构化教材等原则;制作成果是课件,也就是说,是有关课程某一部分内容的多媒体教学材料(包括教科书、参考书、录音带、录像带、幻灯片、影片等),是专为教学活动设计的计算机软件(包括用于控制和进行教育活动的程序,帮助开发、维护程序的文档资料,帮助教师和学生使用程序学习的课本和练习册等)。多媒体教学软件的开发,体现了多媒体技术是计算机教育的最佳手段。因为多媒体教学软件形式丰富多彩、趣味性强,符合学生心理特点;形象直观、生动、活泼,易于理解;有着丰富的教学资源,特别是和国际联网,以获取最新资料;改革教学模式,呈现交互式的教育方式;体积小、分量轻的光盘能容纳庞大的信息等等。多媒体教学软件的开发尽管有一些妨碍教师主导作用的负面影响,但它是各级各类学校教学的需要。现代教育对学习者记忆与学习的要求、师生互动组合方式的要求、个别化教学与因材施教的要求、不同教学环境、不同教学模式的要求等,这些都为多媒体教学软件开发奠定了教育基础。

多媒体创作工具是指能够集成处理和统一管理文本、图形、静态图像、视频影像、动画、声音等多媒体信息,使之能够根据用户的需要生成多媒体应用软件的编辑工具。当前,多媒体创作工具的种类归纳起来主要有以下三种类型:一是交互式流线或图标编辑控制型,编辑人员按照脚本的要求将选定的不同类型的图标根据需要一一放置于流线上进行编辑。二是描述式页控制型,将多媒体素材根据需要编辑在一幅画面之中形成一页书,再将页与页之间按一定的调用关系联系起来以形成一本书的概念,不同页之间根据需要交互性地呈现即形成多媒体应用软件。三是时间流程型,这类工具在编辑信息时显示出较强的时间前后顺序,即时间流程(Time Line),主要用来编制一些简报类的程序。编制一个优秀的教育软件,我们需要了解诸如软件的使用体、运行环境等问题。其中关系到软件成败的一个重要因素是要了解创作工具的特点,这样,才可根据需要有目的地进行选择。多媒体创作工具与其他工具软件相比,具有以下特点:1.操作简便,易于入门;2.强大的集成性开发环境;3.开发周期的缩短是软件得以投入运作的最好方式;4.具有极大的扩充功能。在软件的制作中创作人员一般都追求一种极大的时效比,也就是在较短的时间内,用较少的原程序求得较好的效果、较高的质量、亮丽的界面和较低的运作环境。因此,如何从众多的多媒体创作工具中选择符合自己最满意的多媒体创作系统,直接关系到以上所罗列的各种要求。一般来讲,选择多媒体创作工具时应从以下几个方面进行考虑:对创作人员,要求其个人能力与经验;对多媒体创作工具运行的环境,我们以PC机的环境作为标准。此外,MAC多媒体系统是一种多媒体的典范;由于多媒体教学软件有诸如教育型、演示型、娱乐型、百科全书型等不同类型,因此,对创作工具的选择要求根据具体需要考虑选取不同的类型。因为不同的多媒体创作工具其适用范围是不一样的。综上所述,现在教育系统使用多媒体教学技术,其质量是受多媒体创作过程影响的。目前,为满足大、中、小学制作多媒体教学软件的需求,在制作软件时需按要求选取适当的创作工具,提高制作人员的业务素质,才能做出质量较高的教育软件。

虚拟现实是一种人和计算机接口的技术,亦称“灵境技术”。它是利用计算机生成一种高度逼真的、模拟人在现实世界中进行视、听、动等行为的虚拟世界。虚拟现实不仅能够展示现实世界的各种现象,而且还能实现现实世界难以实现的特征。虚拟现实通过多种传感设备,使人有很好的临场感,产生身临其境的体验。虚拟现实技术实现人与虚拟环境的自然交互,实现对虚拟系统的自主控制,实现感知的现实、操作的现实和运动的现实所构成的三要素。这里要强调传感设备。它有显示和呈现视听感知现实的立体头盔等设备;有输入人体对虚拟现实操作行为的数据手套等设备;有通过合成和传递方式实现运动现实的计算机模拟等设备。这些传感设备,既有穿戴在人体上的装置,又有设置于现实环境中的传感器,如摄像机、声响设备、远程传感设备等。虚拟现实尽管经费昂贵且有一定实验的危险性等,但作为多媒体教学的一种技术,它在丰富学习环境、为学生扩大知识信息、提高实践能力、增强创造才华等方面还是有教育价值的。虚拟现实的出现,是教学训练、特别是复杂技能和特殊专业训练以及教学评价的需要。如果有条件,教师也可以使用。不少现代教育,如建工、医学、航空、航天等专业的教学,若采用虚拟现实技术,对提高教学教育质量会有很大的帮助。所有这一切,都为虚拟现实技术奠定了教育基础。

[ 参 考 文 献 ]

[1] 吴炜煜.多媒体技术导论[J].多媒体世界,1996(1):11-13.

[2] 傅德荣.多媒体技术及其教育应用[M].北京:高等教育出版社,2003:3.

[3] 黄孝建.多媒体技术[M].北京:北京邮电大学出版社,2000:2.

[4] 林众,冯瑞琴.计算机与智力心理学[M].杭州:浙江人民出版社,1997:289.

[5] 理查德E.迈耶.多媒体学习[M].牛勇,邱香,译.北京:商务印书馆,2006:8.

计算机视觉技术基础篇2

[关键词]多媒体教学;多媒体技术;计算机技术;心理学;教育

多媒体教学的发展,与其技术的发展有直接关系。在一些相关论著中,学者们更多的是对多媒体教学技术的论述,强调的是技术,而很少涉及学习者和教育者这样的“人的因素”。虽然对多媒体教学技术的研究是不可缺少的,但是探索多媒体教学的心理机制和教育基础则更为重要,因为人类是以完全不同的方式来加工多媒体教学的。只有这样,才能在多媒体教学中考虑学习者和教育者的主体性。

一多媒体教学技术及其计算机基础

多媒体与多媒体技术应视为同义词。关于多媒体技术的特点虽然还没有形成共识,但是,也有一些基本的共同之处。多媒体五大特点:1.将不同的媒体数据都表示成统一的结构码流;2.实行新的技术标准体制,以适应系统级集成和规范相关产品的性能指标;3.建设“全球信息高速公路”;4.应用“双向性设计”,统一信息提供者、接受者和控制者的关系;5.赋予信息系统对客观世界信息的自然模拟与处理能力。

(一)多媒体技术的特点

1.整合性。多媒体实时地综合,把文本、图形图像、声音、动画以及视频这些媒体中组成两种或两种以上的结合体,为的是借鉴各种媒体的优势,形成一种在功能上更加完善的体系。

2.集成化。多媒体表示的并不单纯是信息的多样性,而是通过多种媒体表现、多种感官认知、多种仪器设备、多学科汇聚、多领域应用等交互作用,集成信息码流、设备控制、人与客观现实关系的一体化。

3.多维式。多媒体是趋于人性化的多维信息处理系统,目标是要尽可能实现让人类在现实生活的自然环境下,保持信息交流的高保真效果、通信带宽和交互控制能力。

4.数字化。多媒体具备数字化处理系统,其信息是一种数字化的信息,其信息结构是一种超媒体的网状式结构,所以高速宽带网络支持多媒体通讯和资源共享,建造全景化虚拟世界数据库成为现实。

5.分布式。目前,多媒体技术正朝着分布式的方向发展。分布式多媒体是一门综合性技术,它集计算机的交互性、网络的分布性和多媒体信息的综合性于一身,突破了计算机、通信等传统产业间相对各自独立发展的界限,是计算机和通信领域的一次革命;分布式多媒体的发展涉及两个关键性的技术问题,一个是多媒体网络技术,网络的频宽、信息的交换方式及网络的高层协作,这直接决定着网络质量;另一个是数据压缩技术,使信息量巨大的多媒体数据、特别是视频和声频数据得以在网络上传输;分布式多媒体向社会提供全新的信息服务,使用户不但可以选择播放的节目以及内容,而且还可利用此系统得到诸如咨询、交流等信息服务。

(二)多媒体并不是多媒体计算机的代名词。

多媒体计算机只是多媒体的一个特例。它既有计算机的显著特性,又有多媒体的功能,所以学校进行多媒体教学时,通常以多媒体计算机为载体。然而,多媒体计算机仅仅是多媒体系统中的一个分系统,因此,它常常被认为是多媒体中的一个典范,或者说是多媒体的一种狭义的范畴。

二多媒体教学技术及其心理基础

从媒体技术的基础来分析,多媒体教学技术离不开视觉媒体技术、听觉媒体技术和触觉媒体技术等。多媒体信息是这些媒体信息数字化后整合而成的,如前所述,数字化技术是多媒体技术的基础技术。在数字化的过程中,各种单媒体有各种不同的国际标准,然而,如果重视“感觉通道说”,那么就要在探讨这几个方面的媒体技术问题的同时,必须揭示使用者(尤其是学习者)的感觉、知觉的心理机制,特别是人的视觉和听觉特征。

多媒体教学技术的出现扩展了人们用视觉模式呈现材料的具体途径。视觉材料包括文本信息、图形图像信息、视频信息。这些信息通过视觉媒体技术数字化后整合为多媒体信息。

(一)为了使多媒体教学技术的视觉材料更容易被学习者所接受,就必须要顾及人的视觉心理基础,也就是说,上述视觉媒体技术只有通过视觉心理机制才能实现多媒体教学的目标。这里,我们也要强调四点:

1.多媒体技术要考虑光的物理三属性所引起的视觉的三种心理机制。视觉的刺激是光,光是电磁波,电磁波的范围很广,而人可见的电磁波只占电磁波的一小部分。波长不同,会使我们在视觉上产生色调的差别,从而产生不同的色觉。色觉不仅取决于由波长所引起的色调,还和主观感觉的明度和饱和度有关。明度是对光波强度(振幅)的反应,饱和度则由物体发射或反射的光的纯度来决定。所以,多媒体教学技术在视觉媒体设计上要处理好可见视觉、色调、明度和饱和度这几方面的关系。

2.多媒体教学技术要考虑对感光物质的视觉感受器心理机制。视觉感受器的真正感光器官是视网膜上的一些细胞,其中锥状细胞感觉颜色,棒状细胞感觉明度,这两种细胞中感光物质的化学性质不同,光使这些物质分解,色素被漂白,从而刺激了感受细胞的膜,引起神经冲动。所以,多媒体教学技术在视觉媒体设计上要研究这两种感光物质的化学性质。

3.多媒体教学技术要考虑视觉过程,即眼睛看东西是一个编码过程,视网膜上的不同感受野在视觉中枢有不同的神经细胞,各有其功能,不同的细胞对所刺激信息系统的不同特征分别反应,并像计算机那样编码,这种编码实际是对一些图像的辨认。所以,多媒体教学技术在视觉媒体设计上要利用好视觉感受野与信息的特征。

4.多媒体教学技术要考虑各类视觉现象,特别是决定视力高低的视角、强弱光下的适应、视觉后暂留的后像、不同背景的视觉对比、不同明度下对不同光波长的感受性等等造成视觉的各种差异。所以,多媒体教学技术在视觉媒体设计上要运用各类视觉现象产生的规律。

(二)在多媒体教学技术中,视听是紧紧地联系在一起的。在计算机环境下,眼睛知觉动画图像,耳朵则知觉解说语言;在演讲的情境中,视觉通道加工投影仪上幻灯片的内容,听觉通道则加工演讲者的声音。听觉材料主要是声音,包括语言信息、音乐信息和效果声信息。这些信息通过听觉媒体技术上数字化后整合为多媒体信息。在这一过程中,我们从技术角度作如下三点说明:

1.声音信息尽管是一种一维的模拟信号,它可以通过采样、量化、码字分配实现数字化,但它比文本信息的数据量要大,通常采用呈现声音和声音合成技术。

2.声波是起源于发声体的振动,在弹性媒质中传播的是一种机械波。它在气体或液体媒质中传播的是纵波,在固体媒质中传播的则是纵波、横波或两者的复合。声音信号有时域特征、频域特征和声色与失真特征。

3.声频或音频是人耳可闻的振动频率,频率范围每秒钟约为20-20000次(赫兹),声频信息数字化后其数据速率大、保真度好和动态范围大。当然,对于不同类型的声频信号,其信号带宽是不同的,电话、调幅广播、调频广播和激光唱盘等的声频信号是有较大区别的。随着声频数字化的发展,压缩编码技术是多媒体教学技术的关键之一。(三)要使多媒体教学技术的听觉材料被学习者更容易接受,也必须顾及人的听觉心理基础。这里,我们仅作两点分析:

1.多媒体教学技术要考虑声音的物理三属性所引起的听觉的三个特征。正像光有三种物理属性一样,声音也有三种属性,即振动的频率、振幅的大小、基音与陪音的倍数配合关系,以及所产生的听觉的音调(或因高)、音强(或响度)和音色的三个特征。人对不同音调的感受性是有差别的,尽管声频在20-20000Hz范围,但声频为1000-4000Hz之间音调感受性较好(即阈限较低),这是由于耳膜神经纤维承担的振动频率所决定的。测量音强的方法以分贝(dB)为单位,这是物理学与心理学都认可的,即两个声音之间的强度比率为1∶1.26(1分贝),因为1.26是能清楚辨别出两个声音振幅大小的区别。人的音色是由基音和陪音的不同比例的配合决定的。在音调和音强相同的情况下,人们之所以能够分辨出是哪种琴所演奏的曲子,正是由于不同琴的基本振动(基音)与分段振动(陪音)的比例是不一样的,这种比例成整数倍数为乐音,不成整数倍数则为噪音。所以,多媒体教学技术在听觉媒体设计上要利用好音调、音强和音色的三个特征。

2.多媒体教学技术要考虑听觉的感受野。因为听觉神经细胞是有分工的,研究指出,听觉中枢神经细胞有40%只反应噪音而不反应乐音,另外60%的神经细胞对乐音的反应也有分工。冲动频可以出现在声音的出现时,可以出现在声音消失之后,也可以出现在声音出现和消失的一刹那;可以在声频降低时发生变化,也可以在声频升高时发生变化。

由此可见,我们在分析多媒体教学的相关技术的同时,也要注意学习者的心理基础,因为学习者是以特有的心理活动的方式来加工视觉和听觉等媒体信息的。

三、多媒体教学技术及其教育基础

(一)在教育中应用多媒体技术,首先是多媒体教学软件的开发,此外,创作工具和虚拟现实等技术也在教育中应用。每一种技术既为教育服务,又有其教育的需要和基础。由于教育对象是人,所以在教育中不管怎样去应用多媒体技术,都要体现每一种技术为人服务,并把学习者和教育者的要求作为出发点。

(二)多媒体创作工具是指能够集成处理和统一管理文本、图形、静态图像、视频影像、动画、声音等多媒体信息,使之能够根据用户的需要生成多媒体应用软件的编辑工具。当前,多媒体创作工具的种类归纳起来主要有以下三种类型:

1.交互式流线或图标编辑控制型,编辑人员按照脚本的要求将选定的不同类型的图标根据需要一一放置于流线上进行编辑。

2.描述式页控制型,将多媒体素材根据需要编辑在一幅画面之中形成一页书,再将页与页之间按一定的调用关系联系起来以形成一本书的概念,不同页之间根据需要交互性地呈现即形成多媒体应用软件。

3.时间流程型,这类工具在编辑信息时显示出较强的时间前后顺序,即时间流程(TimeLine),主要用来编制一些简报类的程序。

[参考文献]

[1]吴炜煜.多媒体技术导论[J].多媒体世界,1996(1):11-13.

[2]傅德荣.多媒体技术及其教育应用[M].北京:高等教育出版社,2003:3.

[3]黄孝建.多媒体技术[M].北京:北京邮电大学出版社,2000:2.

[4]林众,冯瑞琴.计算机与智力心理学[M].杭州:浙江人民出版社,1997:289.

[5]理查德•E.迈耶.多媒体学习[M].牛勇,邱香,译.北京:商务印书馆,2006:8.

计算机视觉技术基础篇3

在我国市场经济不断发展的盛况下,我国科技发展水平也紧随其后,成为世界上的科技强国之一。在计算机水平的不断提高下,计算机视觉技术应运而生。其中,计算机视觉技术被应用与各个领域,并在各个领域都得到广泛有效的应用,比如军事领域、医疗领域、工业领域等。本文针对计算机视觉技术在交通领域中的应用进行分析。

【关键词】计算机视觉 交通领域 探究

近年来,随着科技水平的提高,计算机视觉技术逐渐被人们熟知并广泛应用。相较于其他传感器来说,视觉能获得更多的信息。因此,在我国交通领域中,也对计算机视觉技术进行研究完善,将计算机视觉技术应用在交通领域各个方面中,并取得了显著的成效。

1 计算机视觉的概述及基本体系结构

1.1 计算机视觉概述

通过使用计算机和相关设备,对生物视觉进行模拟的方式,就是计算机视觉。对采集到的图片或视频进行相应的技术处理,从而获得相应的三维信息场景,是计算机视觉的主要任务。

计算机视觉是一门学问,它就如何通过计算机和照相机的运用,使人们获得被拍摄对象的数据与信息所需等问题进行研究。简单的说,就是让计算机通过人们给其安装上的“大脑”和“眼睛”,对周围环境进行感知。

计算机视觉是一门综合性学科,在各个领域都有所作为,已经吸引了各个领域的研究者对其研究。同时,计算机视觉也是科学领域中一个具有重要挑战性的研究。

1.2 计算机视觉领域基本体系结构

提出第一个较为完善的视觉系统框架的是Marr,他从信息处理系统角度出发,结合图像处理、心理物理学等多领域的研究成果,提出被计算机视觉工作者基本接受的计算机视觉系统框架。在此基础上,研究者们针对视觉系统框架的各个角度、各个阶段、各个功能进行分析研究,得出了计算机视觉系统的基本体系结构,如图1。

2 计算机视觉在交通领域的应用

2.1 牌照识别

车辆的唯一身份是车辆牌照。在检测违规车辆、稽查被盗车辆和管理停车场工作中,车辆牌照的有效识别与检测具有重要的作用和应用价值。然而在实际应用工作中,虽然车牌识别技术相对成熟,但是由于受到拍摄角度、光照、天气等因素的影响,车牌识别技术仍需改善。车牌定位技术、车牌字符识别技术和车牌字符分割技术是组成车牌识别技术的重要部分。

2.2 车辆检测

目前,城市交通路口处红绿灯的间隔时间是固定不变的,但是受交通路口的位置不同、时间不同的影响,每个交通路口的交通流量也是持续变化的。此外,对于某些交通区域来说,公共资源的配备,比如交通警察、交通车辆的数量是有限的。如果能根据计算机视觉技术,对交通路口的不同时间、不同位置的交通情况进行分析计算,并对交通流量进行预测,有利于为交通警察缩短出警时间、为交通路口的红绿灯根据实际情况设置动态变化等技术提供支持。

2.3 统计公交乘客人数

城市公共交通的核心内容是城市公交调度问题,一个城市如何合理的解决公交调度问题,是缓解城市运力和运量矛盾,缓解城市交通紧张的有效措施。城市公交调度问题,为公交公司与乘客的平衡利益,为公交公司的经济利益和社会效益的提高做出了巨大的贡献。由于在不同的地域、不同的时间,公交客流会存在不均衡性,高峰时段的公交乘客过多,平峰时段的公交乘客过少,造成了公交调度不均衡问题,使有限资源浪费严重。在计算机视觉智能公交系统中,自动乘客计数技术是其关键技术。自动乘客计数技术,是对乘客上下车的时间和地点自动收集的最有效的技术之一。根据其收集到的数据,从时间和地点两方面对客流分析,为城市公交调度进行合理的安排。

2.4 对车道偏离程度和驾驶员工作状态判断

交通事故的发生率随着车辆数量的增加而增加。引发交通事故的重要因素之一就是驾驶员疲劳驾驶。据相关数据显示,因车道偏离导致的交通事故在40%以上。其中,驾驶员的疲劳驾驶就是导致车道偏离的主要原因。针对此种现象,为减少交通事故的发生,计算机视觉中车道偏离预警系统被研究开发并被广泛应用。针对驾驶员眨眼频率,利用计算机视觉对驾驶员面部进行图像处理和分析,再根据疲劳驾驶关注度与眨眼频率的关系,对驾驶员的工作状态进行判断。此外,根据道路识别技术,对车辆行驶状态进行检测,也是判断驾驶员工作状态的方法之一。这两种方法,是目前基于计算机视觉的基础上,检测驾驶员疲劳状态的有效方法。

2.5 路面破损检测

最常见的路面损坏方式就是裂缝。利用计算机视觉,及时发现路面破损情况,并在其裂缝程度严重之前进行修补,有利于节省维护成本,也避免出现路面坍塌,车辆凹陷的情况发生。利用计算机视觉进行路面检测,相较于之前人工视觉检测相比,有效提高了视觉检测的效率,增强了自动化程度,提高了安全性,为市民的出行安全带来了更高保障。

3 结论

本文从计算机视觉的概述,及计算机视觉基本体系结构,和计算机视觉在交通领域中的应用三面进行分析,可见计算机视觉在交通领域中的广泛应用,在交通领域中应用的有效性、显著性,以此可得计算机视觉在现展过程中的重要性。随着计算机视觉技术的越来越成熟,交通领域的检测管理一定会加严格,更加安全。

参考文献

[1]段里仁.智能交通系境在我国道路空通管理中的应用[J].北方工业时报,2015(06).

[2]王丰元.计算机视觉在建筑区间的应用实例分析[J].河北电力学报,2015(04).

[3]李钊称.主动测距技术在计算机数据分析中的作用探析[J].计算机应用,2015(08).

[4]马良红.三维物体影像的摄取与分析[J].中国公路学报,2014(05).

[5]朱学君,沈睿.关于计算机视觉在交通领域中的探讨[J].信息通信,2013(01):123.

[6]王大勇.关于计算机视觉在交通领域中的应用分析[J].科技与企业,2013(01):115.

作者简介

夏栋(1988-),男,湖北省孝感市人。现为同济大学软件学院在读硕士。研究方向为计算机视觉。

作者单位

计算机视觉技术基础篇4

1计算机视觉的概述及基本体系结构

1.1计算机视觉概述

通过使用计算机和相关设备,对生物视觉进行模拟的方式,就是计算机视觉。对采集到的图片或视频进行相应的技术处理,从而获得相应的三维信息场景,是计算机视觉的主要任务。计算机视觉是一门学问,它就如何通过计算机和照相机的运用,使人们获得被拍摄对象的数据与信息所需等问题进行研究。简单的说,就是让计算机通过人们给其安装上的“大脑”和“眼睛”,对周围环境进行感知。计算机视觉是一门综合性学科,在各个领域都有所作为,已经吸引了各个领域的研究者对其研究。同时,计算机视觉也是科学领域中一个具有重要挑战性的研究。

1.2计算机视觉领域基本体系结构

提出第一个较为完善的视觉系统框架的是Marr,他从信息处理系统角度出发,结合图像处理、心理物理学等多领域的研究成果,提出被计算机视觉工作者基本接受的计算机视觉系统框架。在此基础上,研究者们针对视觉系统框架的各个角度、各个阶段、各个功能进行分析研究,得出了计算机视觉系统的基本体系结构,如图1。

2计算机视觉在交通领域的应用

2.1牌照识别

车辆的唯一身份是车辆牌照。在检测违规车辆、稽查被盗车辆和管理停车场工作中,车辆牌照的有效识别与检测具有重要的作用和应用价值。然而在实际应用工作中,虽然车牌识别技术相对成熟,但是由于受到拍摄角度、光照、天气等因素的影响,车牌识别技术仍需改善。车牌定位技术、车牌字符识别技术和车牌字符分割技术是组成车牌识别技术的重要部分。

2.2车辆检测

目前,城市交通路口处红绿灯的间隔时间是固定不变的,但是受交通路口的位置不同、时间不同的影响,每个交通路口的交通流量也是持续变化的。此外,对于某些交通区域来说,公共资源的配备,比如交通警察、交通车辆的数量是有限的。如果能根据计算机视觉技术,对交通路口的不同时间、不同位置的交通情况进行分析计算,并对交通流量进行预测,有利于为交通警察缩短出警时间、为交通路口的红绿灯根据实际情况设置动态变化等技术提供支持。

2.3统计公交乘客人数

城市公共交通的核心内容是城市公交调度问题,一个城市如何合理的解决公交调度问题,是缓解城市运力和运量矛盾,缓解城市交通紧张的有效措施。城市公交调度问题,为公交公司与乘客的平衡利益,为公交公司的经济利益和社会效益的提高做出了巨大的贡献。由于在不同的地域、不同的时间,公交客流会存在不均衡性,高峰时段的公交乘客过多,平峰时段的公交乘客过少,造成了公交调度不均衡问题,使有限资源浪费严重。在计算机视觉智能公交系统中,自动乘客计数技术是其关键技术。自动乘客计数技术,是对乘客上下车的时间和地点自动收集的最有效的技术之一。根据其收集到的数据,从时间和地点两方面对客流分析,为城市公交调度进行合理的安排。

2.4对车道偏离程度和驾驶员工作状态判断

交通事故的发生率随着车辆数量的增加而增加。引发交通事故的重要因素之一就是驾驶员疲劳驾驶。据相关数据显示,因车道偏离导致的交通事故在40%以上。其中,驾驶员的疲劳驾驶就是导致车道偏离的主要原因。针对此种现象,为减少交通事故的发生,计算机视觉中车道偏离预警系统被研究开发并被广泛应用。针对驾驶员眨眼频率,利用计算机视觉对驾驶员面部进行图像处理和分析,再根据疲劳驾驶关注度与眨眼频率的关系,对驾驶员的工作状态进行判断。此外,根据道路识别技术,对车辆行驶状态进行检测,也是判断驾驶员工作状态的方法之一。这两种方法,是目前基于计算机视觉的基础上,检测驾驶员疲劳状态的有效方法。

2.5路面破损检测

最常见的路面损坏方式就是裂缝。利用计算机视觉,及时发现路面破损情况,并在其裂缝程度严重之前进行修补,有利于节省维护成本,也避免出现路面坍塌,车辆凹陷的情况发生。利用计算机视觉进行路面检测,相较于之前人工视觉检测相比,有效提高了视觉检测的效率,增强了自动化程度,提高了安全性,为市民的出行安全带来了更高保障。

3结论

本文从计算机视觉的概述,及计算机视觉基本体系结构,和计算机视觉在交通领域中的应用三面进行分析,可见计算机视觉在交通领域中的广泛应用,在交通领域中应用的有效性、显著性,以此可得计算机视觉在现展过程中的重要性。随着计算机视觉技术的越来越成熟,交通领域的检测管理一定会加严格,更加安全。

作者:夏栋 单位:同济大学软件学院

参考文献:

[1]段里仁.智能交通系境在我国道路空通管理中的应用[J].北方工业时报,2015(06).

[2]王丰元.计算机视觉在建筑区间的应用实例分析[J].河北电力学报,2015(04).

[3]李钊称.主动测距技术在计算机数据分析中的作用探析[J].计算机应用,2015(08).

[4]马良红.三维物体影像的摄取与分析[J].中国公路学报,2014(05).

[5]朱学君,沈睿.关于计算机视觉在交通领域中的探讨[J].信息通信,2013(01):123.

计算机视觉技术基础篇5

关键词:计算机;视觉技术;应用;分析

中图分类号:TP37 文献标识码:A 文章编号:1009-3044(2016)03-0242-02

计算机人工智能技术中的一项重要技术就是计算机视觉技术,这种技术主要是让计算机利用图像来实现认知环境信息的目的,这一目的的实现需要用到多种高尖端技术。近年来随着计算机技术以及计算机网络的普及与发展,计算机视觉技术也得到了较快发展,并且在实际生产与生活中的应用也越来越广泛。

1 计算机视觉技术概述

1.1 基本概念

计算机视觉技术主要研究计算机认知能力的一门技术,其具体主要是通过用摄像机代替人的眼睛,用电脑代替人的大脑,最终使计算机具备类似于人类的识别、判断以及记忆目标的功能,代替人类进行部分生产作业。人们目前研究的人工智能技术中的一项重要内容就是计算机视觉技术,通过研究计算机视觉技术可以让计算机拥有利用二维图像认知三维环境的功能。总的来说,计算机视觉技术是在图像与信号处理技术、概率分析统计、网络神经技术以及信息处理技术的基础上,利用计算机来分析、处理视觉信息的技术,它是现代社会新兴起的一门高新技术。

1.2 工作原理

在亮度满足要求的情况下,首先使用摄像机对具体事物的图像信息进行采集,利用网络把采集到的图像信息向计算机内部输送,然后在计算机系统内部处理加工图像信息会把事物的原始图像得到,随后利用图像处理技术进一步处理原始图像,获得优化质量效果之后的图像,分类与整理图像中有特征价值的信息,通过智能识别技术识别与描述提取到的图像信息特征,最后把得到的高层次的抽象信息存储起来,在进行识别事务时分析对比这些储存信息就可以实现事物的识别,这样视觉系统的基本任务也就完成了。其具体视觉系统如图1所示:

1.3理论框架

人类研究视觉技术虽然起步比较早,但取得较大进步是在20世纪80年代初伴随着视觉计算理论的出现。它的出现把研究视觉理论的策略问题解决了,视觉技术是一项特别复杂的信息处理过程,要想对视觉的本质准确完整的理解,必须从不同角度与层次研究与分析视觉本质。视觉计算理论研究层次大致可分为:计算机理论、算法以及实际执行。站在计算机理论的角度分析视觉技术,我们可知必须用要素图、维图、以及三维模型表像来描述视觉信息。

所以,可以把计算机视觉技术当做从三维环境图像中抽取、描述与解释信息的过程,其主要分析步骤可分为感觉、处理、描述、识别、解释等。若依据上述各过程实现需用到的方法与技术的复杂性划分层次,可大致把计算机视觉技术划分为:低层视觉处理、中层视觉处理、高层视觉处理三个层次。

2 计算机视觉技术在自动化中的应用

2.1 农业自动化中计算机视觉技术的应用

在农业自动化中应用计算机视觉技术可以全天候实时监测农作物的生长状况,便于科学管理农作物。还可以应用计算机视觉技术来检测农产品的质量,例如可以应用计算机监测技术来监测大多数蔬菜的质量,传统的人工检测蔬菜质量的方法,不仅费时费力,而且检测结果的准确性也不能很好的保证,在实际人工检测过程中还容易伤害蔬菜,可以通过利用计算机视觉技术来感应蔬菜自身释放的红外线、紫外线以及其他可见光的能量大小,然后和质量达标蔬菜的光线能量大小进行对比,根据这些对比结果可以把蔬菜质量的好坏准确判断出来,在蔬菜质量检测过程中应用计算机视觉技术,把传统的蔬菜检测方法完全颠覆了,极大的方便了农产品的质量检测,由此可见,计算机视觉技术在农业生产中有很高的使用与推广价值。

2.2 在工业自动化中计算机视觉技术的应用

计算机视觉技术在工业自动化应用的一个重要领域就是可以精密测量零件尺寸,其测量与被测对象的原理如图2所示。

光学系统、计算机处理系统以及CCD摄像头,是计算机检测系统的主要组成,被测物体由光源发出的平行光束进行照射,利用显微光学镜把待检测部位的轮廓图像呈现在摄像机的面阵CCD上,然后再通过计算机处理这些图像,进而把被测部位的轮廓位置信息获取下来,若被测对象是出现位移时,可通过两次重复测量,利用两次测量的位置差就可以得出,被测物体的位移量。

此外计算机视觉技术还可以应用于逆向工程中,应用3D数字化测量仪可以快速准确的测出现有工件轮廓的坐标值,同时还能构建曲面,保存成CAD或CAM图像,把这些图像送入CNC制作中心加工,便可制作出产品,这也就是所谓的逆向工程。由上述分析我们可知逆向工程要想实现,最关键的一环就是如何通过精密测量系统来测量样品的三围尺寸,获得各部位数据,进而做曲面处理进而加工生产。对于这一难题我可以通过利用线结构光测量物体表面轮廓技术来实现,器具体轮廓结构示意图如下图3所示。

这种测量方法的工作原理为:利用激光穿越平行、等距的振幅光栅组件,或直接采用干涉仪发出的干涉条纹,形成平面条纹结构光,再向物体表面投射,由于物体各表面的深度与曲率的不同,条纹会自动出现变化,然后再通过使用CCD摄像机对变形条纹进行拍摄。这样就可以把物体表面轮廓的变化情况分析出来。摄像机在拍摄图像的过程中,把图像信号转化为模拟信号,再转化为数字信号,然后经过传送再还原信号到图形处理系统,就得到三维轮廓图像。

在工业自动化中计算机视觉技术的深入广泛应用,不但使工业产品的生产质量得到了保障,而且跨越式的提高了工业产品的生产速度。如计算机视觉技术可以很好的检测产品包装质量,封口质量以及印刷质量等等,如我国重点指定的印刷造币机器的南京造币厂,由于货币制造印刷是由印刷造币机器来实现的,所以要严格要求其生产工艺,一丝一毫的生产差错都不允许存在,为了保障印刷制造出来的造币机器质量完全达标,必须严格精确检测生产出来的成品。在印刷造币机器的过程中要求要有非常高的计算机视觉技术,随着计算机视觉技术的不断进步,计算机视觉技术已经对印刷造币机器的需求完全满足了,实际的应用效果也非常理想,印刷造币机器在实际生产的过程中,南京造币厂把计算机视觉技术应用在了每个应刷造币机器最后的生产工序上,硬币受到重力下落的瞬间,计算机视觉技术可以瞬间采集图像的信息,准确拍摄硬币在下落过程中的图像,通过高速光纤传感器可以把硬币图像向计算机系统快速传输,利用计算机系统处理信息与识别信息的超强能力,可以及时识别硬币质量,经大量实践研究得出,在印刷造币机器上应用计算机视觉技术已经几乎没有检查差错现象的发生,由此可知,在工业自动化中计算机视觉技术的应用不但可行,而且发展空间还很大。

2.3 在医学自动化中计算机视觉技术的应用

在医学领域计算机视觉技术也得到了广泛应用,如医学中经常用到的CT图像以及X射线图都用到了计算机视觉技术,这些技术的广泛应用很大程度上方便了医生准确判断病人病情,另外,在生产药品的过程中,应用计算机视觉技术可以高效检测药品包装的合格与否,其基本流程是:传送装置先准确运输药品到指定位置,传送装置自身又可分为检测与分离两个区域,在传送药品的过程中药品的图像信息会被特定的摄像机采集,采集完成后向计算机系统传递采集信息,然后计算机系统会分析与处理这些信息,把没有包装好的药品自动识别出来,并且向分离区传递识别信息,分离区的自动装置会依据传输的分离信息,隔离开没有包装好的药品,这样就可以有效分类包装好的药品与没有包装好的药品,在药品包装检测方面应用计算机视觉技术代替传统人工检测,不但可以实现药品准确无误的检测,而且还可以大大提高检测药品包装质量的效率,完善了药品生产的自动化,由此可见,在医学自动化中应用计算机视觉技术可以积极促进医学自动化的发展。

3 结束语

总之,计算机视觉技术是一门研究计算机识别能力的高新技术,它涵盖了很多其他技术,具有一定复杂性。要想使其在自动化生产中得到更好地推广与应用,我们必须在明白其基本概念、工作原理以及理论框架的基础上,结合实际生产情况,不断进行深入研究,只有这样才能使计算机视觉技术得到更好地推广与应用,才能使这项现代化的高新技术更好的服务于社会,服务于人类。

参考文献:

[1] 龚超,罗毅,涂光瑜.计算机视觉技术及其在电力系统自动化中的应用[J].电力系统自动化,2003(1).

[2] 李永奎,刘冬.计算机视觉技术在农业生产中的应用[J].农业科技与装备,2011(6).

[3] 郭联金,朱日龙,杨国卿,等.浅谈机器视觉技术在自动化制造业中的应用[J].机电一体化,2015(8).

计算机视觉技术基础篇6

关键词:视觉系统;产品特征;电子产品;机器视觉,防呆,扫描检测

采用计算机模拟生物视觉的科学技术称之为机器视觉,而机器视觉系统的目的在于认识现实世界。随着我国社会经济和科学技术水平的不断发展,计算机以及信息化也在飞速地提升,计算机科学的关键研究领域之一就包括了机器视觉。机器视觉研发初期是在上世纪五十年代,当时的研发工作仅集中于分析以及识别二维图像等问题上。例如:通过计算机程序的应用,提取出三维结构,并描述了物体空间关系以及物体形态等等。而真正研发出机器视觉是上世纪八十年代中期。之后,随着计算机技术以及光电自动化的迅速发展,在印刷电路板的检验、IC字符识别、元件定位电子装配线、自动装配完整性检查等方面,机器视觉才得到具体的应用。机器视觉具有着可现场性、智能化、可重复性、快速性等特点。

1、 视觉系统组成

机器视觉指的是用机器人来代替人眼作出判断和测量等。机器视觉系统是通过机器视觉产品将转换为图像信号的被摄取目标传输给专用图像处理系统,图像处理系统根据颜色、亮度、像素分布.面积比例等信息,抽取目标特征经行比较分析,之后实现现场控制的设备动作。

专用的处理图像软件、装有图像采集卡的计算机、CCD图像传感器、光源部分等共同组成了机器视觉系统。图像的采集时通过CCD图像传感器实现的,所谓的模拟信号就是通过光信号转换成为电信号,而数字信号是由图像采集卡转换了电信号而来,最后提供给计算机进行统一处理。为了防止灯光或者自然光线影响到工作状态,机器视觉系统的光源应具有高稳定性、好的均匀性、可调亮度、亮度大等特点,这是为了能够对外界环境中各种光影响倒图像质量,而起的抑制作用。通常,CCD图像传感器的形式有两种,一为面阵CCD,另一种为线性CCD。机器视觉系统以PC机为基础,图像信号的接受、转换、协调等功能是图像采集卡所具有的功能。通过PC总线,专用处理图像软件处理与分析图像。

2、 现代3C电子产品制造业中视觉技术的应用

在现代电子产品制造业中,视觉系统所具有的的特点诸多,例如:现场抗干扰能力强、精度高、速度快、非接触等等。这些优质的特点使得机器视觉技术在经济效益与社会效益中获得广泛应用。

2.1机器人的研究应用

在现代制造业中,机器人的研发与制造广泛应用了机器视觉的技术,该技术为机器人创建了视觉系统,使机器人具备了更主动、更灵活的方式,在诸多的领域中,能够满足如自动焊接、搬运、装配、自动定位、自动检测等很多柔性生产方式的需要。为了对未知目标物体进行判断,提供出较为有效地依据,研发除了一种以手、眼视觉为寄出的定位与测量方法。该方法用于重复定位任务中时,为了避免频繁移动手臂,而利用目标物体的快速定位技术。线采用线状光投影的方法将金属表面的镜面反射呈现出的伪3D信息有效去除,在对物体3D位置法线、向量进行有效计算,最后在将物体某个面信息检测出来。为了保持稳定的位置,应从检测面信息中在进行检测。

2.2检查产品特征

在进行电子产品的大批量生产中,为了能够提升生产效率,实现高效、准确、快速的检查品质,采用了机器视觉技术。不同特征的产品可按照如下方法进行检查。第一,以产品结构特征为基础进行检查,通过机器视觉来检查3c产品生产线上如结构缺失,精冲漏冲检测等的情况。检查时,先利用合格产品创建一个模板,在被检查产品与标准产品的图像成像面积进行比较,正确判断3C产品结构以及外形形状。第二,以产品表面外观品质特征为基础进行检查,对于产品表面出现的磨损、裂纹、划痕、凹陷等,采用机器视觉进行检查,最终可以分级或者判断产品品质,做出相应措施。第三,以产品空间特征为基础进行检查,在制造业中,对产品尺寸的检查通常是以产品是否具有正确形状或者在容许范围内进行。该检查方法主要涉及如圆度、方向、位置、形状等被检产品2维或3维几何特性,也可以说是检查其空间特征。

3、 机器视觉在扫描机的应用

之所以在扫描机中应用机器视觉技术,因其有着其自身的研发背景。在研磨段常出现漏精冲、精冲反带等孔内堵塞现象,严重的会对公司的利益和形象产生直接的影响,导致客户端无法组装。为了预防漏精冲、精神反带,采用了防呆检具,但是,防呆针的断裂又成为了生产中新问题、新隐患。以此为背景,将先进的视觉系统应用与扫描机中,可对产品进行扫描,最终可达到对产品缺陷进行检测的目的。扫描检测机由处理器、显示器、视觉光源、线扫相机四部分构成了扫描机。扫描机的工作原理如图所示。掃描机是用于通孔检测的设备,产品在传送带上运动的过程中遇到光电触发信号开始采图检测,检测工件孔位是否有漏加工或是否有精沖反带等不良现象发生,当有不良現象发生时立即进行声光报警,挑出不良品,此设备每小时产能高达达到1000片。

使用扫描机安全注意事项有:一、严谨在机器运行或者放料的过程中在亚克力板间缝中放入手指,以防伤手。二、传送带在运行的过程中,若有硬物掉入,应立即按下急停,运行在取出硬物后方可继续。三、紧急情况出现时,应及时按下急停按钮。四、禁止私改电路或打开电控箱,电控专业人员除外。五、严谨私自挪动右导正板,而左导正板可调。六、严谨任意挪动电脑桌。

在扫描机中应用了机器视觉技术后,效果良好,其优点如下:①检测效果稳定、可靠。②可在无限多个机种上应用适用性广。③节省了人力、效率高。④机器稼动率,效益高。⑤一次投入,维修方便,且环保。

结束语

文章介绍了在现代3c电子产品制造业中,推广及应用机器视觉技术的效果,并通过其在防呆检测扫描仪中的应用实例,说明了机器视觉的优点与可行性,未来的工业制造将向自动化,无人化,快速化发展,机器视觉技术必将成为重要的组成部分,大量替代人眼判断系统。

参考文献:

[1]魏志强,李兵,屈玉丰,沙群. 基于激光雷达三维图像建模的机器人拆码垛控制系统[J]. 机械与电子,2013(4).

[2]ABB赢得宝马集团2400台机器人订单——机器人将应用于宝马工厂的搬运、涂胶和点焊工序[J]. 国内外机电一体化技术,2013(2).

[3]宋树伟,阮毅,李正. 基于多传感器的超高压输电线路巡检机器人越障控制[J]. 机床与液压,2013(7).

计算机视觉技术基础篇7

关键词:计算机视觉分析;微小尺寸;精密校正;阈值;图像分割

中图分类号:TP274.4

计算机视觉分析理论是基于精密模式识别和人工智能程序化校验技能进行综合整编的方法,利用光学信息对真实物理结构的实时反映,配合人机协调手段进行二维图像的呈现。在工件表面进行质量检测和图片制备要素分析的系统环节中,阐述物体在空间环境之间的关系样式,争取三维场景的科学搭建。集合要素内容包括边缘、线条和曲面的配备,建立以工业部件为中心的坐标体系,并适当运用不同符号表现模式实现必要三维结构和空间关系的调整,促进精密仪器细节检验工作质量的不断提高。

1 计算机视觉检测技术的相关理论研究

1.1 技术原理分析

渗透性计算机辅助支持结构的视觉鉴定技术在被测实体中的图像显示支持功能基础形势上进行质量状况的把控,这其实就是根据既定的偏差标准实现规模物件的逐个排查。细致的检测工作在深度零件的诱导性特征和完整性配件的支持下,对整体完好效果的几何制备模型进行测量[1]。近阶段的视觉规范系统利用电耦合器件和摄像机进行主题元素的捕捉,并利用计算机内部程序的数字信号转化工具实现图像的并行处理。采用目标图像的特殊坐标记录,利用灰度分布图内的多种综合功能处理系统改善的要务。常规视觉下的检测过程相对比较繁琐,主要是将被检测物体放置于照明效果相对均匀的可控制背景环境中,联结CCD技术和图像卡实现被测部件和数字图像的共性要素融合,保证计算机自动化处理程序的录入。当然,这类研究系统是需要利用相关软体进行放大的,其主要必备功能就是进行图像的预处理、识别和有效分析,将整个过程内部的实际结果数值,包括被测部件的自身缺陷、尺寸等进行整理。

1.2 计算机视觉微小尺寸精密检测工业应用技术的现状

在科学设计信息内容和工业加工制备要领集成化对待的环节中,通常不会直接进行部件表面的接触,一般运用计算机程序下的扫描认知和图像即时呈现功能进行快速的比对检测,整体信号抗干扰能力较强,因此在现代工业生产技术领域内部广受好评。电子工业是在建立计算机视觉分析工艺之后表现最为活跃的行业类型,在此基础上衍生的印刷电板路和集成电路芯片就是利用标准模型的整改,实现规模工序的紧密排列。目前,时下流行的汽车生产、纺织、商品包装等也逐渐向这类手段靠拢,全面改善了现代化工业制备的应用效果。

2 应用视觉微小尺寸分析技术内部拓展机能的补充

灰度图像的主要分割方法包括灰度阈值校正、边缘检测制备等手段。

2.1 灰度阈值校正

这是区域分割方法中一种常见的手段,主要配合多个或单个阈值将图像自身的灰度级别划分为几个项目组,对相同像素的单位数据进行整编。根据实效范围进行分类,包括局部和全局阈值探究两种手段,全局规模下的阈值分析方法就是利用整幅图的灰度直方分布图进行内部最优阈值分割,包括单阈值和多阈值两种形式;同时还可以将初始分析的图像进行子元素的拆解,之后利用单个子图像的既定阈值范围进行最优化分割[2]。分割的基本原理公式为:

其中,合理阈值的选取是非常重要的,目前阈值确定的手段主要包括直方图双峰对照法和最大类间方差累积法等。这种利用灰度阈值实现精准质量的划分手段,计算执行工作相对比较简单,并且实际工作效率水平较高,即便是实际需要分割的物体与图像背景对比深度较强也可以收放自如,但唯一的缺点就是缺少对空间信息的掌控,涉及亮度不足的图像问题,这种阈值分割技术的施工质量往往不会太高。

2.2 边缘检测制备工序

图像内部元素的分割其实就是进行部件边界效益的提取,而边缘检测制备工序则是利用像元及邻域的整体状态进行物体边界相关结构的搭建。边缘检测分割制备技术具体包括并行和串行两种模式,并行手法是运用梯度信息的提取实现不同类别算子的整理;串行边界分割原理则是根据适当强度标准和相似走向的两个边缘端点位置实现连接,主要代表算法包括启发式智能搜索手段等。这种串行算法较并行边界积累统计原则来说具有更强的抗干扰能力,但实际的边缘检测同样不能完好地维持连续效果,需要利用其余技术内容进行边缘制备技巧的修复。

(1)原始图像 (2)Robert算子边缘检测 (3)Sobel算子边缘检测

(4)Prewitt算子边缘检测 (5)Kirsch算子边缘检测 (6)Gauss-Laplace算子检测

图1 微小双联齿轮边缘检测

3 视觉检测系统的创新性改进

根据以上现状问题,创新式视觉整改校验系统利用照明光源、摄像机和图像采集卡等结构实现计算机输出结果质量的补充。其主要运行过程如下:利用被测部件在均匀照明背景的全面优化控制基础,实现物体结构的全面清晰呈现,使用摄像机对相关图像信号进行梳理并转化为电荷信号,配合相关的图像资源采集卡进行部件数字化图像的格式转化;计算机内部软体操作程序将得到的数字图像进行处理和识别,并将最终结果数据输出,实现现代工业技术整体质量规模控制的既定要求。

系统硬件在实现部件转化图像信息的环节中,连接检测机理下的连续软件规划和照明光源等相关设备进行图像适当分辨率的调整,维持图像较为清晰的对比效果。全面控制获取数字图像的时间,抵抗不良因素的干扰影响,维持内部成本经济规模的合理控制,促进科技应用和可持续发展经济战略双重价值标准的同步进展。其中,光源设备的选择必须落实到部件既定的几何形状条件下,利用相关性能参数进行实际工作要求的提供,包括光源位置、亮度、寿命特性等因素的堆积,常用的可见光源包括水银灯、荧光灯等,但这类光源使用寿命有限,因此现下多配用LED光源进行快捷反应、小功耗标准的补充,并且长期使用后的照明效果比较稳定[3]。而摄像机等结构主要还是校正参数的表达方式,进行图像合理分辨率的整改,促进图像采集数字化协调功能的发展,提高系统工作速度等。

4 结束语

计算机视觉检测系统在进行一定部件性能评比的活动中有着很高的贡献,不仅配合硬件的照明、参数制备要领制备功能,同时促进数字化图像对比的速度,使得工业生产环节中的部件检查工序得到大范围整改,满足可持续发展战略规模的视觉意义,促进现代智能化分析处理技术的全面覆盖。

参考文献:

[1]陆春梅.基于数字图像处理技术的接杆激光环焊焊缝视觉检测系统研究[D].上海交通大学,2008.

[2]罗敏.基于机器视觉的黑片缺陷检测图像边缘提取算法研究[D].沈阳理工大学,2010.

[3]邵泉钢.弱透光环境下微构件机器视觉检测关键技术研究[D].浙江大学,2011.

计算机视觉技术基础篇8

关键词:戏剧舞台设计;数字时代;灯光

在戏剧艺术发展的漫漫历史进程中,人们在惊叹于其艺术表现力之余更是对以文学叙事的戏剧艺术司空见惯。直到近代以来,以数字3D虚拟影像技术、CG技术为代表的数字化技术的演变与推进,使戏剧艺术重新得到关注,而作为其重要组成部分的舞台灯光造型元素,更是成为人们关注的焦点。以计算机技术为标志的数字技术的出现,拓展并完善了戏剧舞台设计在传统意义上以镜框式舞台设计为标志的时空观念与纪实主义美学的基础。数字技术时代背景下,灯光作为舞台设计造型元素中重要的组成部分,对戏剧艺术叙事美学进行了多维度的改变与完善,并把戏剧艺术的发展推向一个新的高潮,为他人研究灯光艺术在舞台设计中的影响拓展了一个崭新的视角。

1 符号学视角下的舞台设计艺术

从本体论上来讲,舞台设计可以定义为在戏剧演出活动中空间、时间、意义和交往的组织。舞台空间即具有符号与造型的所指,同时兼具审美装饰的美学内涵,并在一定的思想和美学原则支配下对戏剧演出空间按照一定的美学原则进行崭新的结构与组合,既有幻觉的营造又有美学的升华并蕴含有丰富的哲理,是一门综合的艺术形式。戏剧是一种交流活动是“人与人之间思想感情交流的一种方法”。戏剧不仅仅是主体与客体之间的关系更是认识现实的一种方式,认识的中介是形象。灯光作为信源到达信道的媒介被作为观众的信宿所接受。灯光作为舞台进行文化表达的中介,在戏剧中的交流是多层次的、不限于演出者与观众的。舞台灯光不仅可以通过光的元素对观众进行视觉引导,而且通过其冷暖、色调、明暗变化向观众传达出强烈的情感和深刻的内涵,在戏剧艺术的发展中占有十分重要的地位和作用。舞台空间作为一个对演员创造有用的物质空间,同时还作为审美对象的审美空间。任何东西已经放在舞台上就会产生超出该东西感性物质意义从而成为一个记号或符号。

作为现代科技的产物,戏剧舞台美术的设计形态一直随着技术的发展而处于一种不断的动态变化之中。从黑白到彩色、从二维布景绘画到三维影像画面表达,舞台设计在表现艺术、生活的同时更是在仿真手段的技术基础上营造出一种视幻觉的生理与心理真实。传统的舞台置景已经对戏剧的时空观与纪实美学做出了许多尝试。而舞台灯光借助现在虚拟影像技术手段更是焕发出新的生命与活力,进一步提升了戏剧舞台设计的真实美学基础。

感官刺激与视觉消费是当代艺术文化发展的趋势所在。后现代消费性社会的形成为现代舞台灯光技术的应用提供了坚实文化语境。并一定程度上改变了传统戏剧与观众之间的观演关系,给受众客体一种“如临其境”的感觉。

舞台如同生活艺术进行表达和诠释的符号,约翰・迪利符号学观点认为“一切符号都是关系,其中交织着自然与文化,独立于人类思维之物与人类思维所创造之物,进而形成一个经验的世界,并且展现出一个人类既不脱离自然,也不被自然所吸收,而是与之互为依存的整体。[1]可见,舞台设计中的符号具有认知性、普遍性、约束性与独特性的特点,从符号的角度研究灯光将更好地处理视觉、空间、戏剧与交流之间的关系。

2 数字化技术背景下的舞台灯光设计

后消费时代背景下的数字技术发展对于艺术领域的推动是不可或缺的,其以崭新的视觉形式与独特的舞台形象、空间塑造魅力带来了舞台设计艺术的革新,颠覆并打破了传统舞台设计中的诸多“哥德巴赫猜想”。数字技术支持下的布景、道具、灯光依据计算机独特的虚拟性可以实现人机的有效合作,可以保证整个舞台设计的灯光、布景、道具、服饰、化妆及效果等各个方面都能够依据剧情发展实现完美结合,进而能够创作出优良的演出环境。

声光电的运用与互动拓展了舞台空间。运用计算机技术合理配置灯光可以产生无可比拟的感情力量。现代科学技术的发展促进了舞台灯光技术和设备的现代化,灯光技术和设备的迅猛发展和在舞台中的广泛应用,使舞台中灯光的形式日新月异。既能通过灯光的基本造型元素对时间、季节环境进行立体化的表现,还可以塑造舞台的空间形象与纵深,影响并左右着舞台前景、中景与近景的可见性。捷克著名的舞台设计家斯沃博达曾说过“视觉与空间的运动不只是舞台装置的特性,更重要的是戏剧的本质,活动性成为组织舞台空间生气勃勃的力量。”[2]可见灯光的重要性,既可以表达时间流逝、创造环境、再现雷电风云、日月星辰等自然现象,还可以代替传统的布景道具表达空间的转换,其还可以利用机械的手段创造活动布景与舞台进行流动的、美的空间表达。《猫》的灯光设计师运用计算机技术合理调配声、光、电,制造出了逼真完美的舞台效果,震撼的视听效果使观众感受到了猫的真实世界。新技术新设备的不断出现与广泛应用更是对舞台设计艺术的发展起到了难以比拟的推动作用。高科技影像设备应用于舞台设计空间,led技术以及全息虚拟影像技术的应用都展现出了超强的功能意味。以舞台和音效为代表的视听特效技术在舞台中的广泛应用更是为其提供照明、塑造人物与场景的技术。并能配合节目内容渲染气氛,以增强节目的感染力,增强舞台的整体视觉效果。计算机技术为舞台设计提供了新的动力和灵感,从根本上影响和改变舞台设计的形式等,其优越性使人们相信计算机技术在将来的舞台设计中将成为绝对的中坚力量。同时,它的优越性使人们了解未来舞台设计发展的多元化,它也为设计者提供了广阔的设计空间去展示和发挥舞台的魅力。

3 结语

从真实美学的角度来说,计算机数字技术背景下产生的对戏剧空间假定性的突破为角色表演提供了广阔空间。在传统戏剧舞台艺术中,戏剧表演必须要有一个“真实的场景”才能激发出震撼人心的表演能量。而数字计算机技术对演员的表演则提出了挑战,它打破了传统戏剧的假定性场景,由于数字技术能够制造出现实世界不存在的虚拟事物,当演员和这些虚拟物相搭配演对手戏时,就打破了以体验为基础的现实主义表演美学。

参考文献:

[1] 胡妙胜.戏剧与符号[M].上海文艺出版社,2002:95.

上一篇:对建筑经济管理的认识范文 下一篇:土地节约集约利用概念范文