图像法论文范文

时间:2023-11-18 12:15:21

图像法论文

图像法论文篇1

    从历史实践上看,作为人类交往活动中最常见的两种媒介形式,图像与语言文字相比所处的地位不一样。在文字发明之前,图像是先民表达和记录的方式;当文字出现之后,文字以语法和修辞结构来表达具有丰富的联想性和多义性的意义,而图像被降低为识字的辅助手段。因此,在很大程度上,图像被认为是感性的、直观的、平面的、零碎的,人们重视语言的理性逻辑,强调语言与图像的异质性,而忽视图像与语言之间的辩证关系,以及图像的独立性和意义的建构性。米歇尔发起了对语言主导文化的解构性批判,他认为:“文化的历史部分就是图像符号与语言符号之间争取支配地位的漫长斗争的历程,任何一方都是为自身而要求一个可以接近‘自然’的特权。在某些时刻,这种斗争似乎进入了沿着开放边界展开的自然交流;而另一些时刻(恰如莱辛的《拉奥孔》)这些边界关闭了,彼此相安无事。

    所谓的颠覆关系就存在于这一斗争最有趣和最复杂的种种形态中”[2](P187)。在这里,米歇尔强调了语言与图像之间漫长的斗争过程,认为两者之间辩证复杂的张力关系构成了文化的发展。如果说传统文化是语言实施着对图像的压制和控制,那么,进入当代的视觉文化时代,图像应该站在与语言构成对立面的基础上,消解语言中心主义的局面,通过制造图像和观看图像承担世界意义的建构。但是,图像的兴起以及形成的对语言的挑战,并不意味着图像取代语言成为知识体系和文化秩序的主宰,而是将图像在语言中心论的框架中解放出来,摆脱语言论的控制,在关注语言与图像之间的“互文”性阐发中重新挖掘和创造图像,让图像再度被发现,让图像彻底释放出自己的知识能量。

    图文之争与当代文学理论研究的新思路

    图文之争的介入给当代文学理论注入了新鲜血液。随着图像意识的增强,文学与传媒、文学与图像、文本形式、文学的存在方式、图像叙事与文本叙事等诸多问题越来越多地进入到文学理论研究的视野,成为人们关注的热点问题。如米歇尔在《图像理论?序》所说的那样:我们生活在一个视觉文化时代,所有的媒体都是混合媒体,所有的再现都是异质的,文学与视觉艺术之间的互动关系构成了再现,它们与权力、价值和人类的利益纠缠在一起,影响到文化模式的变化。一种阅读文化与一种观看文化之间的差异不仅是一个形式问题;它含蓄地指出社会性和主体性所采取的形式,一种文化所构成的各种个体和制度。在这里,我们可以发现:文学与图像的关系问题可以在媒体再现中找到交汇点。换句话说,图像与语言之间的关系并不是一种单纯的异质关系,两者之间的研究也不是一种简单的、毫无价值的平行对照,相反,两者之间内在的互动关系以及构成的外部关联使得不同艺术之间的关系研究成为可能。从这个意义上说,图像与语言的关系为文艺理论和美学研究提供了更广阔的空间,因为两者之间的关系在很大程度上突破了传统文艺理论观念。

    从历史上看,在语言学研究范式的框架中,文学理论研究的中心和旨归是文学语言本身,认为语言是一种线性的、稳定和逻辑的符号,先行地设定文化、文学发展变迁的规律。在这种观念中,语言占据主导优势,而图像只是语言之外与人的感性层面相关联的不可靠的形式,图像与语言根本无法联袂,亦无法在一种张力的结构中生发出更高意义上的思维模式。20世纪后期以来,随着视觉文化和读图时代的来临,单纯的语言学思维方法已经不能完整有效地对当今文学图像化和传媒化趋势作出有力的阐发,同时它也无法表征当前层出不穷的文学审美现象。

    因此,当前文艺理论研究必须摆脱传统文艺理论研究中的不合理方式,关切当代传媒视野中的文学现实问题,在正视语言学等研究方法的同时,侧重考虑在图像与文字之间寻找文艺理论研究的生长点。本雅明是建构此种研究范式的积极实践者和探索者,他在研究摄影与电影的过程中预言电影将成为未来语言的者,认为以文字和书籍为代表的传统印刷文化必将受到以图像为主的机械复制文化的冲击,这昭示着图文之争在现代文学艺术发展过程中将成为一个待解的问题。与本雅明不同,利奥塔从解构理论的角度对西方传统文艺理论中存在的理性与感性、理智与欲望、话语与图像、推论和感知等二元对立模式进行批判性考察,为感性、欲望、图像和想象力的存在寻找依据,解构西方传统的元叙事话语和思维模式,达到攻击现代性的目的。鲍德里亚比本雅明和利奥塔走得更远,他在由电脑所创造的虚拟图像世界中,反思和批判传统的文学生成和存在方式,认为虚拟图像比真实存在更完美真实。

    在此观念下,文学艺术与现实之间的关系应该重新设置和厘定,也就是说:图像与现实的脱节、虚拟与真实界限的消解,使得传统的“文学艺术模仿生活”的观念出现问题,这无疑对当代文艺理论研究产生重要影响。本雅明、鲍德里亚在文化和艺术层面上对图文关系的探索,深刻地表明文艺理论对图文关系的重视源于当代文化给作者和读者带来的新的创作和阅读感觉经验,它是对当下文学艺术发展的理论总结和建构。显然,西方文化领域对图文关系的研究已达到了一个很高的水平,其方法和思路不同于传统的美学与文艺理论研究,已进入到图像文化分析、社会历史分析、符号政治经济学分析的综合、交叉的层面,其研究主旨是在揭示图像与文学差异、互动和互通的特征,进而进入图文生产、消费与社会权力表达、文化模式变迁之间的复杂关系的探究上。

    当前国内文学理论研究领域,图文关系的研究也逐渐深入展开,这主要沿着两种思路进行:一是在文化研究的语境中,探讨图像与语言文字的关系,强调图像的强势原因、表现方式和审美效果等。这是当前文学遭遇图像时代问题的一种“宏大理论”式的阐发,这种研究并没有在图像与语言之间折叠、缠绕的复杂关系中解决文学变化的具体问题;二是沿着“文学是语言的艺术”的历史命题,在文学与传媒的关系日益紧张的今天,根据文学和视觉艺术两者的交叉渗透,从文学语言的角度来关注视觉艺术,同时强化从图像的角度来审视文学,试图在文学与图像之间建构一种互文性的文学理论。具体而言:从文学语言的角度研究视觉图像,就是理解图像如何借助物理时空的张力结构,来接近文学并通过语言立“象”达到充满想象力的审美至境。

    反之,从图像的角度来分析文学语言,就是理解图像如何赋予文学语言新的意义,探索图像在文学语言塑造过程中所具有的重要功能,比如研究表明两者之间的关系可以归纳为三种历史形态:以图言说、语图互仿和语图互文,以此揭示语图关系发展的规律。显然,以上所说两种研究的价值取向不同:前者侧重语言与图像的对立,以此勾画出当代文化模式的变迁,以及带来的审美方式的变化;后者则侧重语言与图像两种媒介所具有的思维方式交融凝聚到文学本身,回答文学在传播过程中因媒介不同而发生了怎样的变化。如果说前者侧重外部研究,那么后者则是从内部探讨文学的根本性问题。

    值得注意的是:在叙事学中,传统的文字叙事所固化的领域开始成为语图关系研究的重要目标,从而形成一种崭新的叙事文本研究,此研究围绕图像与文字两种不同的叙事特点,主要从叙事学的角度来考察图像与文字之间错综复杂的关系,突出图像对叙事文本的模仿和再现问题,旨在解构文字叙事在叙事传统中的绝对主流,摆脱与语词共存和竞争中图像的压抑性地位。通过图像与文字之间复杂关系的梳理,让两者在交互叙事中建构不同的价值维度,以此彰显不同的审美意义。诸如此类的研究对于我们今天重新理解文学有太多的启示,这昭示着当前文艺理论研究观念的重要转变,这些探索对于建构文学理论研究范式具有启发性和创新意义。

    图文之争与当前文学理论研究的几点反思

    20世纪80年代以来,国内文艺理论界关于本质主义与反本质主义一直存在论争,不同观点的研究者在本质建构和拆解的论争中宣扬自己的文学理论观念。图像与文学的关系问题作为文艺理论研究的现实问题,在为文艺理论营建新的研究思路的同时,跳出本质主义、历史主义和解构主义等思维模式,力求返回文学活动本身,沿着亚里士多德所设定的文学媒介理论的路线寻求“拯救文学现象”,这无疑将为我们重新反思文学理论研究提供了契机。

    首先,文艺理论研究应从文学现实出发,避免抽象化。何谓文学现实?在我看来,其实质就是被文学本质思维模式所遮蔽的文学发展过程中文学与其他文化形式交织、文学本身新变的现实问题。在本质主义与反本质主义理论观念指引下,文学理论研究大都围绕原典或抽象概念的演绎展开讨论,试图勾画出一幅以理念存有为深层基础的文学图景。这是一种本质先行的理论模式,此种模式直接规定文学之为文学的本质,达到一种理论自身的自洽性和完美性,最终,文学现象被置换成一个抽象化、一元化的世界,文学活动的朴素性和现实性逐渐消失。

图像法论文篇2

“语言学转向”强调的是世界是由语言建构的,语言符号之间的不断转换产生了世界的意义,换句话说:意义的产生不过是一种语言到另一种语言的转换过程,这种转换完成了语言对世界的编码。从这个意义上说,我们生活的世界不是一个经验和实体的世界,而是一个语言符号的世界,我们的知识和认识是由语言来塑造的,在语言的主宰下,语法、句法、语用、词汇、话语、语境、意义、文本、叙事、修辞等跟语言学相关知识被广泛运用到其它学科领域中,以至于语言学的模式和方法成为人文科学普遍的思维模式和方法,因此,“语言与存在”取代了传统的“思维与存在”的命题成为整个知识范式转换的重要表征,这也从根本上揭示了语言的本体含义,它远非工具,而被看作存在本身,正如维特根斯坦所宣称:全部哲学就是语言批判,想象一种语言就意味着想象一种生活方式。从历史实践上看,作为人类交往活动中最常见的两种媒介形式,图像与语言文字相比所处的地位不一样。在文字发明之前,图像是先民表达和记录的方式;当文字出现之后,文字以语法和修辞结构来表达具有丰富的联想性和多义性的意义,而图像被降低为识字的辅助手段。因此,在很大程度上,图像被认为是感性的、直观的、平面的、零碎的,人们重视语言的理性逻辑,强调语言与图像的异质性,而忽视图像与语言之间的辩证关系,以及图像的独立性和意义的建构性。米歇尔发起了对语言主导文化的解构性批判,他认为:“文化的历史部分就是图像符号与语言符号之间争取支配地位的漫长斗争的历程,任何一方都是为自身而要求一个可以接近‘自然’的特权。在某些时刻,这种斗争似乎进入了沿着开放边界展开的自然交流;而另一些时刻(恰如莱辛的《拉奥孔》)这些边界关闭了,彼此相安无事。所谓的颠覆关系就存在于这一斗争最有趣和最复杂的种种形态中”[2](P187)。在这里,米歇尔强调了语言与图像之间漫长的斗争过程,认为两者之间辩证复杂的张力关系构成了文化的发展。如果说传统文化是语言实施着对图像的压制和控制,那么,进入当代的视觉文化时代,图像应该站在与语言构成对立面的基础上,消解语言中心主义的局面,通过制造图像和观看图像承担世界意义的建构。但是,图像的兴起以及形成的对语言的挑战,并不意味着图像取代语言成为知识体系和文化秩序的主宰,而是将图像在语言中心论的框架中解放出来,摆脱语言论的控制,在关注语言与图像之间的“互文”性阐发中重新挖掘和创造图像,让图像再度被发现,让图像彻底释放出自己的知识能量。

图文之争与当代文学理论研究的新思路

图文之争的介入给当代文学理论注入了新鲜血液。随着图像意识的增强,文学与传媒、文学与图像、文本形式、文学的存在方式、图像叙事与文本叙事等诸多问题越来越多地进入到文学理论研究的视野,成为人们关注的热点问题。如米歇尔在《图像理论•序》所说的那样:我们生活在一个视觉文化时代,所有的媒体都是混合媒体,所有的再现都是异质的,文学与视觉艺术之间的互动关系构成了再现,它们与权力、价值和人类的利益纠缠在一起,影响到文化模式的变化。一种阅读文化与一种观看文化之间的差异不仅是一个形式问题;它含蓄地指出社会性和主体性所采取的形式,一种文化所构成的各种个体和制度。在这里,我们可以发现:文学与图像的关系问题可以在媒体再现中找到交汇点。换句话说,图像与语言之间的关系并不是一种单纯的异质关系,两者之间的研究也不是一种简单的、毫无价值的平行对照,相反,两者之间内在的互动关系以及构成的外部关联使得不同艺术之间的关系研究成为可能。从这个意义上说,图像与语言的关系为文艺理论和美学研究提供了更广阔的空间,因为两者之间的关系在很大程度上突破了传统文艺理论观念。从历史上看,在语言学研究范式的框架中,文学理论研究的中心和旨归是文学语言本身,认为语言是一种线性的、稳定和逻辑的符号,先行地设定文化、文学发展变迁的规律。在这种观念中,语言占据主导优势,而图像只是语言之外与人的感性层面相关联的不可靠的形式,图像与语言根本无法联袂,亦无法在一种张力的结构中生发出更高意义上的思维模式。20世纪后期以来,随着视觉文化和读图时代的来临,单纯的语言学思维方法已经不能完整有效地对当今文学图像化和传媒化趋势作出有力的阐发,同时它也无法表征当前层出不穷的文学审美现象。因此,当前文艺理论研究必须摆脱传统文艺理论研究中的不合理方式,关切当代传媒视野中的文学现实问题,在正视语言学等研究方法的同时,侧重考虑在图像与文字之间寻找文艺理论研究的生长点。本雅明是建构此种研究范式的积极实践者和探索者,他在研究摄影与电影的过程中预言电影将成为未来语言的者,认为以文字和书籍为代表的传统印刷文化必将受到以图像为主的机械复制文化的冲击,这昭示着图文之争在现代文学艺术发展过程中将成为一个待解的问题。与本雅明不同,利奥塔从解构理论的角度对西方传统文艺理论中存在的理性与感性、理智与欲望、话语与图像、推论和感知等二元对立模式进行批判性考察,为感性、欲望、图像和想象力的存在寻找依据,解构西方传统的元叙事话语和思维模式,达到攻击现代性的目的。鲍德里亚比本雅明和利奥塔走得更远,他在由电脑所创造的虚拟图像世界中,反思和批判传统的文学生成和存在方式,认为虚拟图像比真实存在更完美真实。在此观念下,文学艺术与现实之间的关系应该重新设置和厘定,也就是说:图像与现实的脱节、虚拟与真实界限的消解,使得传统的“文学艺术模仿生活”的观念出现问题,这无疑对当代文艺理论研究产生重要影响。本雅明、鲍德里亚在文化和艺术层面上对图文关系的探索,深刻地表明文艺理论对图文关系的重视源于当代文化给作者和读者带来的新的创作和阅读感觉经验,它是对当下文学艺术发展的理论总结和建构。显然,西方文化领域对图文关系的研究已达到了一个很高的水平,其方法和思路不同于传统的美学与文艺理论研究,已进入到图像文化分析、社会历史分析、符号政治经济学分析的综合、交叉的层面,其研究主旨是在揭示图像与文学差异、互动和互通的特征,进而进入图文生产、消费与社会权力表达、文化模式变迁之间的复杂关系的探究上。当前国内文学理论研究领域,图文关系的研究也逐渐深入展开,这主要沿着两种思路进行:一是在文化研究的语境中,探讨图像与语言文字的关系,强调图像的强势原因、表现方式和审美效果等。这是当前文学遭遇图像时代问题的一种“宏大理论”式的阐发,这种研究并没有在图像与语言之间折叠、缠绕的复杂关系中解决文学变化的具体问题;二是沿着“文学是语言的艺术”的历史命题,在文学与传媒的关系日益紧张的今天,根据文学和视觉艺术两者的交叉渗透,从文学语言的角度来关注视觉艺术,同时强化从图像的角度来审视文学,试图在文学与图像之间建构一种互文性的文学理论。具体而言:从文学语言的角度研究视觉图像,就是理解图像如何借助物理时空的张力结构,来接近文学并通过语言立“象”达到充满想象力的审美至境。反之,从图像的角度来分析文学语言,就是理解图像如何赋予文学语言新的意义,探索图像在文学语言塑造过程中所具有的重要功能,比如研究表明两者之间的关系可以归纳为三种历史形态:以图言说、语图互仿和语图互文[3],以此揭示语图关系发展的规律。显然,以上所说两种研究的价值取向不同:前者侧重语言与图像的对立,以此勾画出当代文化模式的变迁,以及带来的审美方式的变化;后者则侧重语言与图像两种媒介所具有的思维方式交融凝聚到文学本身,回答文学在传播过程中因媒介不同而发生了怎样的变化。如果说前者侧重外部研究,那么后者则是从内部探讨文学的根本性问题。值得注意的是:在叙事学中,传统的文字叙事所固化的领域开始成为语图关系研究的重要目标,从而形成一种崭新的叙事文本研究,此研究围绕图像与文字两种不同的叙事特点,主要从叙事学的角度来考察图像与文字之间错综复杂的关系,突出图像对叙事文本的模仿和再现问题,旨在解构文字叙事在叙事传统中的绝对主流,摆脱与语词共存和竞争中图像的压抑性地位[4]。通过图像与文字之间复杂关系的梳理,让两者在交互叙事中建构不同的价值维度,以此彰显不同的审美意义。诸如此类的研究对于我们今天重新理解文学有太多的启示,这昭示着当前文艺理论研究观念的重要转变,这些探索对于建构文学理论研究范式具有启发性和创新意义。

图文之争与当前文学理论研究的几点反思

图像法论文篇3

    “语言学转向”强调的是世界是由语言建构的,语言符号之间的不断转换产生了世界的意义,换句话说:意义的产生不过是一种语言到另一种语言的转换过程,这种转换完成了语言对世界的编码。从这个意义上说,我们生活的世界不是一个经验和实体的世界,而是一个语言符号的世界,我们的知识和认识是由语言来塑造的,在语言的主宰下,语法、句法、语用、词汇、话语、语境、意义、文本、叙事、修辞等跟语言学相关知识被广泛运用到其它学科领域中,以至于语言学的模式和方法成为人文科学普遍的思维模式和方法,因此,“语言与存在”取代了传统的“思维与存在”的命题成为整个知识范式转换的重要表征,这也从根本上揭示了语言的本体含义,它远非工具,而被看作存在本身,正如维特根斯坦所宣称:全部哲学就是语言批判,想象一种语言就意味着想象一种生活方式。从历史实践上看,作为人类交往活动中最常见的两种媒介形式,图像与语言文字相比所处的地位不一样。在文字发明之前,图像是先民表达和记录的方式;当文字出现之后,文字以语法和修辞结构来表达具有丰富的联想性和多义性的意义,而图像被降低为识字的辅助手段。因此,在很大程度上,图像被认为是感性的、直观的、平面的、零碎的,人们重视语言的理性逻辑,强调语言与图像的异质性,而忽视图像与语言之间的辩证关系,以及图像的独立性和意义的建构性。米歇尔发起了对语言主导文化的解构性批判,他认为:“文化的历史部分就是图像符号与语言符号之间争取支配地位的漫长斗争的历程,任何一方都是为自身而要求一个可以接近‘自然’的特权。在某些时刻,这种斗争似乎进入了沿着开放边界展开的自然交流;而另一些时刻(恰如莱辛的《拉奥孔》)这些边界关闭了,彼此相安无事。所谓的颠覆关系就存在于这一斗争最有趣和最复杂的种种形态中”[2](P187)。在这里,米歇尔强调了语言与图像之间漫长的斗争过程,认为两者之间辩证复杂的张力关系构成了文化的发展。如果说传统文化是语言实施着对图像的压制和控制,那么,进入当代的视觉文化时代,图像应该站在与语言构成对立面的基础上,消解语言中心主义的局面,通过制造图像和观看图像承担世界意义的建构。但是,图像的兴起以及形成的对语言的挑战,并不意味着图像取代语言成为知识体系和文化秩序的主宰,而是将图像在语言中心论的框架中解放出来,摆脱语言论的控制,在关注语言与图像之间的“互文”性阐发中重新挖掘和创造图像,让图像再度被发现,让图像彻底释放出自己的知识能量。

    图文之争与当代文学理论研究的新思路

    图文之争的介入给当代文学理论注入了新鲜血液。随着图像意识的增强,文学与传媒、文学与图像、文本形式、文学的存在方式、图像叙事与文本叙事等诸多问题越来越多地进入到文学理论研究的视野,成为人们关注的热点问题。如米歇尔在《图像理论?序》所说的那样:我们生活在一个视觉文化时代,所有的媒体都是混合媒体,所有的再现都是异质的,文学与视觉艺术之间的互动关系构成了再现,它们与权力、价值和人类的利益纠缠在一起,影响到文化模式的变化。一种阅读文化与一种观看文化之间的差异不仅是一个形式问题;它含蓄地指出社会性和主体性所采取的形式,一种文化所构成的各种个体和制度。在这里,我们可以发现:文学与图像的关系问题可以在媒体再现中找到交汇点。换句话说,图像与语言之间的关系并不是一种单纯的异质关系,两者之间的研究也不是一种简单的、毫无价值的平行对照,相反,两者之间内在的互动关系以及构成的外部关联使得不同艺术之间的关系研究成为可能。从这个意义上说,图像与语言的关系为文艺理论和美学研究提供了更广阔的空间,因为两者之间的关系在很大程度上突破了传统文艺理论观念。从历史上看,在语言学研究范式的框架中,文学理论研究的中心和旨归是文学语言本身,认为语言是一种线性的、稳定和逻辑的符号,先行地设定文化、文学发展变迁的规律。在这种观念中,语言占据主导优势,而图像只是语言之外与人的感性层面相关联的不可靠的形式,图像与语言根本无法联袂,亦无法在一种张力的结构中生发出更高意义上的思维模式。20世纪后期以来,随着视觉文化和读图时代的来临,单纯的语言学思维方法已经不能完整有效地对当今文学图像化和传媒化趋势作出有力的阐发,同时它也无法表征当前层出不穷的文学审美现象。因此,当前文艺理论研究必须摆脱传统文艺理论研究中的不合理方式,关切当代传媒视野中的文学现实问题,在正视语言学等研究方法的同时,侧重考虑在图像与文字之间寻找文艺理论研究的生长点。本雅明是建构此种研究范式的积极实践者和探索者,他在研究摄影与电影的过程中预言电影将成为未来语言的者,认为以文字和书籍为代表的传统印刷文化必将受到以图像为主的机械复制文化的冲击,这昭示着图文之争在现代文学艺术发展过程中将成为一个待解的问题。与本雅明不同,利奥塔从解构理论的角度对西方传统文艺理论中存在的理性与感性、理智与欲望、话语与图像、推论和感知等二元对立模式进行批判性考察,为感性、欲望、图像和想象力的存在寻找依据,解构西方传统的元叙事话语和思维模式,达到攻击现代性的目的。鲍德里亚比本雅明和利奥塔走得更远,他在由电脑所创造的虚拟图像世界中,反思和批判传统的文学生成和存在方式,认为虚拟图像比真实存在更完美真实。在此观念下,文学艺术与现实之间的关系应该重新设置和厘定,也就是说:图像与现实的脱节、虚拟与真实界限的消解,使得传统的“文学艺术模仿生活”的观念出现问题,这无疑对当代文艺理论研究产生重要影响。本雅明、鲍德里亚在文化和艺术层面上对图文关系的探索,深刻地表明文艺理论对图文关系的重视源于当代文化给作者和读者带来的新的创作和阅读感觉经验,它是对当下文学艺术发展的理论总结和建构。显然,西方文化领域对图文关系的研究已达到了一个很高的水平,其方法和思路不同于传统的美学与文艺理论研究,已进入到图像文化分析、社会历史分析、符号政治经济学分析的综合、交叉的层面,其研究主旨是在揭示图像与文学差异、互动和互通的特征,进而进入图文生产、消费与社会权力表达、文化模式变迁之间的复杂关系的探究上。当前国内文学理论研究领域,图文关系的研究也逐渐深入展开,这主要沿着两种思路进行:一是在文化研究的语境中,探讨图像与语言文字的关系,强调图像的强势原因、表现方式和审美效果等。这是当前文学遭遇图像时代问题的一种“宏大理论”式的阐发,这种研究并没有在图像与语言之间折叠、缠绕的复杂关系中解决文学变化的具体问题;二是沿着“文学是语言的艺术”的历史命题,在文学与传媒的关系日益紧张的今天,根据文学和视觉艺术两者的交叉渗透,从文学语言的角度来关注视觉艺术,同时强化从图像的角度来审视文学,试图在文学与图像之间建构一种互文性的文学理论。具体而言:从文学语言的角度研究视觉图像,就是理解图像如何借助物理时空的张力结构,来接近文学并通过语言立“象”达到充满想象力的审美至境。反之,从图像的角度来分析文学语言,就是理解图像如何赋予文学语言新的意义,探索图像在文学语言塑造过程中所具有的重要功能,比如研究表明两者之间的关系可以归纳为三种历史形态:以图言说、语图互仿和语图互文[3],以此揭示语图关系发展的规律。显然,以上所说两种研究的价值取向不同:前者侧重语言与图像的对立,以此勾画出当代文化模式的变迁,以及带来的审美方式的变化;后者则侧重语言与图像两种媒介所具有的思维方式交融凝聚到文学本身,回答文学在传播过程中因媒介不同而发生了怎样的变化。如果说前者侧重外部研究,那么后者则是从内部探讨文学的根本性问题。值得注意的是:在叙事学中,传统的文字叙事所固化的领域开始成为语图关系研究的重要目标,从而形成一种崭新的叙事文本研究,此研究围绕图像与文字两种不同的叙事特点,主要从叙事学的角度来考察图像与文字之间错综复杂的关系,突出图像对叙事文本的模仿和再现问题,旨在解构文字叙事在叙事传统中的绝对主流,摆脱与语词共存和竞争中图像的压抑性地位[4]。通过图像与文字之间复杂关系的梳理,让两者在交互叙事中建构不同的价值维度,以此彰显不同的审美意义。诸如此类的研究对于我们今天重新理解文学有太多的启示,这昭示着当前文艺理论研究观念的重要转变,这些探索对于建构文学理论研究范式具有启发性和创新意义。

    图文之争与当前文学理论研究的几点反思

    20世纪80年代以来,国内文艺理论界关于本质主义与反本质主义一直存在论争,不同观点的研究者在本质建构和拆解的论争中宣扬自己的文学理论观念。图像与文学的关系问题作为文艺理论研究的现实问题,在为文艺理论营建新的研究思路的同时,跳出本质主义、历史主义和解构主义等思维模式,力求返回文学活动本身,沿着亚里士多德所设定的文学媒介理论的路线寻求“拯救文学现象”,这无疑将为我们重新反思文学理论研究提供了契机。首先,文艺理论研究应从文学现实出发,避免抽象化。何谓文学现实?在我看来,其实质就是被文学本质思维模式所遮蔽的文学发展过程中文学与其他文化形式交织、文学本身新变的现实问题。在本质主义与反本质主义理论观念指引下,文学理论研究大都围绕原典或抽象概念的演绎展开讨论,试图勾画出一幅以理念存有为深层基础的文学图景。这是一种本质先行的理论模式,此种模式直接规定文学之为文学的本质,达到一种理论自身的自洽性和完美性,最终,文学现象被置换成一个抽象化、一元化的世界,文学活动的朴素性和现实性逐渐消失。图像与文学的关系问题不同,它是当代传媒文化现实中文学发展出现的真问题,它带动文学活动各要素在传媒世界中发生了新变。比如依照新媒体观念,图像、语言和其他文本都混杂其中构成超文本文类,读者面对如此复杂而丰富的文本世界目不暇接,此种变化打乱了以往文学理论设定和裁量文学的标准。因此,文学理论必须真正面对这些问题,从学理层面加以阐发,进而把当代文学理论研究向前推进。其次,回归文学本身的问题也是一个值得反思的文学理论问题。传统的语言学研究范式注重文学的文学性研究,认为语言是文学的内在规定性和永恒性。这是它的功绩,也是它的偏颇。因为,它在把文学的文学性研究推上高峰的同时忽视了语言以外、或者与语言相关的知识场域(比如,文学与其他艺术语言之间的关系)。当前盛行的文化研究,打破了文学理论学科的界限,以超越文学社会学的姿态,把触角渗透到生活的各个方面,使得文学研究的边界变得模糊,文学本身的问题几乎成了一个被遗忘的话题。在这样的情形下,我们也深切地感受到文学基础理论知识体系的松散和脆弱。在两种研究方式面前,我以为,图像与文学的关系是文学理论重新思考文学自身问题反弹的重要表现,它介乎语言和文化之间,寻找理解和阐发文学的新维度,同时这也是对强调文学性研究的形式主义文论和强调文化权力的文化研究的一种反驳和超越。从这个意义上说,语图关系研究意味着在经典意义上的理论研究之外拓展出新的文艺理论研究思路。最后,应该提倡文学理论研究的多元主义理念。文学是复杂

图像法论文篇4

论文摘要:分割的目的是将图像划分为不同区域。图像分割算法一般是基于亮度值的两个基本特性之一:不连续性和相似性。第一类性质的已用途径是基于亮度的不连续变化分割图像,比如图像的边缘。第二类的主要应用途径是依据事先制订的准则将图像分割为相似的区域。门限处理、区域生长、区域分离和聚合都是这类方法的实例。遗传算法具有简单、鲁棒性好和本质并行的突出优点。其在应用领域取得的巨大成功,引起了广大学者的关注。在图像分割领域,遗传算法常用来帮助确定分割阈值。

本文介绍讨论了几种目前广泛应用的图像边缘检测、图像阈值分割的各种算法,并给出了对比分析;对遗传算法的基本概念和研究进展进行了综述;给出了标准遗传算法的原理、过程、实验结果及分析.实验结果表明,本文提出的遗传分割算法优于传统分割算法。

第一章绪论1.1图像分割综述

图像分割就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程。这里所说的特性可以是灰度、颜色、纹理等,而目标可以对应单个区域,也可以对应多个区域。图像分割是数字图像处理中的一项关键技术,它使得其后的图像分析,识别等高级处理阶段所要处理的数据量大大减少,同时又保留有关图像结构特征的信息。而且,在数字图像处理工程中,一方面,图像分割是目标表达的基础,对特征测量有重要的影响;另一方面,图像分割是自动目标识别的关键步骤,图像分割及其基于分割的目标表达、特征提取和参数测量等将原始图像转化为更抽象更紧凑的形式,分割中出现的误差会传播至高层次处理阶段,因此分割的精确程度是至关重要的。只有通过细致精细的图像分割,才能使得更高层的图像分析和理解成为可能。因此,图像分割是由图像处理进到图像分析的关键步骤,在图像工程中占据重要的位置。

1.2图像分割的研究意义与发展现状

作为计算机视觉和图像处理中的难点和热点之一,图像分割的研究受到了研究工作者的高度重视,对图像分割进行了深入、广泛的研究。作为一种重要的图像技术,图像分割在不同领域中有时也用其它名称:如目标轮廓(objectdelineation)技术,阈值化(thresholding)技术,图像区分或求差(imagediscrimination)技术,目标检测(targetdetection)技术,目标识别(targetrecognition)技术,目标跟踪(targettracking)技术等,但这些技术本身或其核心实际上也就是图像分割技术。图像分割作为图像处理、分析的一项基本内容,其应用非常广泛,几乎出现在有关图像处理的所有领域,并涉及各种类型的图像。在工业自动化、在线产品检验、生产程控、文件图像处理、遥感图像、保安监视、以及军事、体育、农业等行业和工程中,图像分割都有着广泛的应用。例如:在遥感图像中,合成孔径雷达图像中目标的分割、遥感云图中不同云系和背景分布的分割等;在医学应用中,脑部MR图像分割成灰质(GM)、白质(WM)、脑脊髓(CSF)等脑组织和其它脑组织区域(NB)等;在交通图像分析中,把车辆目标从背景中分割出来等;在面向对象的图像压缩和基于内容的图像检索中将图像分割成不同的对象区域等。在各种图像应用中,只要需对图像目标进行提取,测量等都离不开图像分割。

自20世纪70年代至今,已提出上千种各种类型的分割算法。如:门限法、匹配法、区域生长法、分裂-合并法、水线法、马尔可夫随机场模型法、多尺度法、小波分析法、数学形态学等。随着新理论、新技术的发展,一些新的图像分割方法也随之出现,但这些分割算法都是针对某一类型图像、某一具体的应用问题而提出的,并没有一种适合所有图像的通用分割算法。通用方法和策略仍面临着巨大的困难。另外,还没有制定出选择适用分割算法的标准,这给图像分割技术的应用带来许多实际问题。

1.3本论文所作的工作

据此,在本论文中只对常用的、并在实践中行之有效的边缘检测方法和阈值分割方法进行深入的了解,并对阈值分割方法中的灰度直方图双峰法和基于遗传算法的最大类间方差法进行详细的讨论,同时用Matlab对上述两种方法进行验证并给出结果。

1.4本论文的论述内容

本文对图像分割的整个过程中的一些常用的,经实践检验行之有效的算法进行了讨论和改进。全文共七章。第一章为绪论,主要介绍了现阶段图像分割技术的发展现状和研究意义。其他六章分别在以下几个方面介绍了本文所做的工作:

1.对本文所采用的试验测试工具Matlab进行简介。

2.简介数字图像的基础问题。概述了数字图像的基本概念和特点,简介了各种图像格式的特点和应用,为全文的讨论作一铺垫。

3.详细讨论了图像分割中的基于阈值的图像分割方法,给出了直方双峰法的算法和验证结果,并简要介绍了普通最大类间方差法的算法过程。

4.对遗传算法理论进行简介。详细讨论了遗传算法的定义和标准遗传算法的流程和要素。为应用此方法对最大阈值进行迭代寻优打下基础。

6.应用遗传算法改进了最大类间方差法。给出了整个遗传操作的使用函数与具体进程,并对实例图片进行处理,得到处理结果并得到迭代最优阈值M。

本文研究了图像分割的相关理论和常用技术,并对遗传算法进行了介绍,对遗传算法应用于图像分割进行了验证.

第二章Matlab简介2.1MATLAB的概况和产生背景2.1.1MATLAB的概况

MATLAB是矩阵实验室(MatrixLaboratory)之意。除具备卓越的数值计算能力外,它还提供了专业水平的符号计算,文字处理,可视化建模仿真和实时控制等功能。MATLAB的基本数据单位是矩阵,它的指令表达式与数学,工程中常用的形式十分相似,故用MATLAB来解算问题要比用C,FORTRAN等语言完相同的事情简捷得多.

当前流行的MATLAB包括拥有数百个内部函数的主包和三十几种工具包(Toolbox).工具包又可以分为功能性工具包和学科工具包.功能工具包用来扩充MATLAB的符号计算,可视化建模仿真,文字处理及实时控制等功能.学科工具包是专业性比较强的工具包,控制工具包,信号处理工具包,通信工具包等都属于此类.开放性使MATLAB广受用户欢迎.除内部函数外,所有MATLAB主包文件和各种工具包都是可读可修改的文件,用户通过对源程序的修改或加入自己编写程序构造新的专用工具包.

2.1.2MATLAB产生的历史背景

在70年代中期,CleveMoler博士和其同事在美国国家科学基金的资助下开发了调用EISPACK和LINPACK的FORTRAN子程序库.EISPACK是特征值求解的FOETRAN程序库,LINPACK是解线性方程的程序库.在当时,这两个程序库代表矩阵运算的最高水平.到70年代后期,身为美国NewMexico大学计算机系系主任的CleveMoler,在给学生讲授线性代数课程时,想教学生使用EISPACK和LINPACK程序库,但他发现学生用FORTRAN编写接口程序很费时间,于是他开始自己动手,利用业余时间为学生编写EISPACK和LINPACK的接口程序.CleveMoler给这个接口程序取名为MATLAB,该名为矩阵(matrix)和实验室(labotatory)两个英文单词的前三个字母的组合.在以后的数年里,MATLAB在多所大学里作为教学辅助软件使用,并作为面向大众的免费软件广为流传。1983年春天,CleveMoler到Standford大学讲学,MATLAB深深地吸引了工程师JohnLittle.JohnLittle敏锐地觉察到MATLAB在工程领域的广阔前景.同年,他和CleveMoler,SteveBangert一起,用C语言开发了第二代专业版.这一代的MATLAB语言同时具备了数值计算和数据图示化的功能.1984年,CleveMoler和JohnLittle成立了MathWorks公司,正式把MATLAB推向市场,并继续进行MATLAB的研究和开发.

在当今30多个数学类科技应用软件中,就软件数学处理的原始内核而言,可分为两大类.一类是数值计算型软件,如MATLAB,Xmath,Gauss等,这类软件长于数值计算,对处理大批数据效率高;另一类是数学分析型软件,Mathematica,Maple等,这类软件以符号计算见长,能给出解析解和任意精确解,其缺点是处理大量数据时效率较低.MathWorks公司顺应多功能需求之潮流,在其卓越数值计算和图示能力的基础上,又率先在专业水平上开拓了其符号计算,文字处理,可视化建模和实时控制能力,开发了适合多学科,多部门要求的新一代科技应用软件MATLAB.经过多年的国际竞争,MATLAB以经占据了数值软件市场的主导地位.

在MATLAB进入市场前,国际上的许多软件包都是直接以FORTRANC语言等编程语言开发的。这种软件的缺点是使用面窄,接口简陋,程序结构不开放以及没有标准的基库,很难适应各学科的最新发展,因而很难推广。MATLAB的出现,为各国科学家开发学科软件提供了新的基础。在MATLAB问世不久的80年代中期,原先控制领域里的一些软件包纷纷被淘汰或在MATLAB上重建。

时至今日,经过MathWorks公司的不断完善,MATLAB已经发展成为适合多学科,多种工作平台的功能强大大大型软件。在国外,MATLAB已经经受了多年考验。在欧美等高校,MATLAB已经成为线性代数,自动控制理论,数理统计,数字信号处理,时间序列分析,动态系统仿真等高级课程的基本教学工具;成为攻读学位的大学生,硕士生,博士生必须掌握的基本技能。在设计研究单位和工业部门,MATLAB被广泛用于科学研究和解决各种具体问题。在国内,特别是工程界,MATLAB一定会盛行起来。可以说,无论你从事工程方面的哪个学科,都能在MATLAB里找到合适的功能。

2.2MATLAB的语言特点

一种语言之所以能如此迅速地普及,显示出如此旺盛的生命力,是由于它有着不同于其他语言的特点,正如同FORTRAN和C等高级语言使人们摆脱了需要直接对计算机硬件资源进行操作一样,被称作为第四代计算机语言的MATLAB,利用其丰富的函数资源,使编程人员从繁琐的程序代码中解放出来。MATLAB最突出的特点就是简洁。MATLAB用更直观的,符合人们思维习惯的代码,代替了C和FORTRAN语言的冗长代码。MATLAB给用户带来的是最直观,最简洁的程序开发环境。以下简单介绍一下MATLAB的主要特点。

1.语言简洁紧凑,使用方便灵活,库函数极其丰富。MATLAB程序书写形式自由,利用起丰富的库函数避开繁杂的子程序编程任务,压缩了一切不必要的编程工作。由于库函数都由本领域的专家编写,用户不必担心函数的可靠性。可以说,用MATLAB进行科技开发是站在专家的肩膀上。更为难能可贵的是,MATLAB甚至具有一定的智能水平,所以用户根本不用怀疑MATLAB的准确性。

2.运算符丰富。由于MATLAB是用C语言编写的,MATLAB提供了和C语言几乎一样多的运算符,灵活使用MATLAB的运算符将使程序变得极为简短。

3.MATLAB既具有结构化的控制语句(如for循环,while循环,break语句和if语句),又有面向对象编程的特性。

4.程序限制不严格,程序设计自由度大。例如,在MATLAB里,用户无需对矩阵预定义就可使用。

5.程序的可移植性很好,基本上不做修改就可以在各种型号的计算机和操作系统上运行。

6.MATLAB的图形功能强大。在FORTRAN和C语言里,绘图都很不容易,但在MATLAB里,数据的可视化非常简单。MATLAB还具有较强的编辑图形界面的能力。

7.MATLAB的缺点是,它和其他高级程序相比,程序的执行速度较慢。由于MATLAB的程序不用编译等预处理,也不生成可执行文件,程序为解释执行,所以速度较慢。

8.功能强大的工具箱是MATLAB的另一特色。MATLAB包含两个部分:核心部分和各种可选的工具箱。核心部分中有数百个核心内部函数。其工具箱又分为两类:功能性工具箱和学科性工具箱。功能性工具箱主要用来扩充其符号计算功能,图示建模仿真功能,文字处理功能以及与硬件实时交互功能。功能性工具箱用于多种学科。而学科性工具箱是专业性比较强的,如control,toolbox,signlproceessingtoolbox,commumnicationtoolbox等。这些工具箱都是由该领域内学术水平很高的专家编写的,所以用户无需编写自己学科范围内的基础程序,而直接进行高,精,尖的研究。

9.源程序的开放性。开放性也许是MATLAB最受人们欢迎的特点。除内部函数以外,所有MATLAB的核心文件和工具箱文件都是可读可改的源文件,用户可通过对源文件的修改以及加入自己的文件构成新的工具箱。

2.3MATLAB遗传算法工具箱简介

鉴于Matlab强大的扩展功能和影响力,各个领域的专家相继突出了许多基于Matlab的专用工具箱。本文所采用的遗传算法工具箱,就是由英国谢菲尔德(Sheffield)大学设计推出的。相对于其他版本的遗传算法工具箱,如:美国北卡莱罗纳州立大学推出的遗传算法优化工具箱GAOT(GeneticAlgorithmOptimizationToolbox),以及MathWorks公司最新的一个专门设计的Matlab遗传算法和直接搜索工具箱(GeneticAlgorithmandDirectSearchToolbox),本工具箱的出现最早,影响较大且功能较为完备。文中所采用的所有遗传操作函数大部分出自本工具箱。

第三章数字图像基础简介

图像处理的首要一步,就是要了解图像的基本性质与特点。只有充分了解和掌握了所要处理得图像的特点和性质,才能在接下来的处理中根据图像的特点获取所需的信息,并对其进行相应的处理。

本章将介绍数字图像的基础知识,以及图像在计算机处理中的信息表达形式,并对几种常用的图像文件格式Bmp,Jpeg以及Png等做简要的介绍。

3.1图像的基本概念及其特点

要对图像进行处理,必须清楚图像的概念。一般来说,二维或三维景物呈现在人眼中的样子就是图像。图像具有以下三个方面的特点:

①图像带有大量的信息,一幅图像顶得上千言万语;

②图像种类繁多,包括照片、绘图视频图像等;

③人类从外界获得的大部分信息来自视觉系统。

人们看到的任何自然界的图像都是连续的模拟图像。其形状和形态表现由图像各位置的颜色来决定。可以用f(x,y)表示一幅模拟图像,其中x,y表示空间坐标点的位置,f表示图像在点(x,y)的某种性质的数值,如亮度、颜色等,f、x、y可以是任意的实数。而把连续空间的图像在坐标空间(X,Y)和性质空间F都离散化,以便于计算机进行加工处理的离散化的图像则称为数字图像。数字图像用I(r,c)来表示,其中:r=row为行,c=col为列,表示空间离散点的坐标,I表示离散化的图像f。I,r,c都是整数。实际中仍习惯用f(x,y)表示数字图像。图像存储画面的形式为栅格结构:即将图像划分为均匀分布的栅格(像素),显式的记录每一像素的亮度和颜色;而将像素的坐标值规则地隐含起来,其位置排列规则,通常为矩形排列。

3.2图像的格式

组成数字图像的基本单位称为像素(Pixel),把像素按不同的方式进行组织和存储,就得到不同的图像格式;把图像数据存为文件就得到图像文件。图像文件按其格式的不同一般具有不同的扩展名。常用的图像文件格式有位图文件、JPEG文件、GIF文件、PNG文件等。每一种格式都有它的特点和用途,在选择输出的图像文件格式时,应考虑图像的应用目的以及图像文件格式对图像数据类型的要求。下面我们介绍几种常用的图像文件格式及其特点。

3.2.1BMP图像格式

这是一种DOS和Windows兼容计算机系统的标准图像格式。BMP格式支持索引色、灰度等色彩模式。图像存储为BMP格式时,每一个像素所占的位数可以是1位、4位、8位或32位,相对应的颜色数也从黑白一直到真彩色。对于使用Windows格式的4位和8位图像,可以指定采用RLE压缩。BMP图像文件含文件头、调色板数据和图像数据三个层次。其中文件头由定义文件标识、大小即图像数据偏移量的BITMAPF工LEHEADER以及指定BMP图像自身的若干参数的BITMAPINFOHEADER两部分组成。这种格式在PC机上应用非常普遍。

3.2.2JPEG图像格式

JPEG是由联合照片专家组(JiontPhotographicExpertsGroup)开发的一种图像文件格式。它采用有损压缩方式去除冗余的图像和彩色数据,在获取极高的压缩率的同时也能展现十分丰富生动的图像。也就是说,可以用较少的磁盘空间得到较好的图像质。另外,JPEG还是一种比较灵活的格式,当将图像保存为JPEG格式时,允许用户用不同的压缩比例对文件进行压缩,就是可以指定图像的品质和压缩级别。

3.2.3TIFF图像格式

TIFF文件主要由三部份组成,包括文件头、标识信息区和图像数据区。T工FF文件的图像数据区以行扫描的方式存取图像,存储图像前先将图像分割成若干部分,压缩后再存储。存储时,单色图像一个字节存储8个点,16色图像一个字节2个点,而256色图像就是一个字节存储一个点。TIFF图像格式是一种应用非常广泛的位图图像格式,几乎被所有绘画、图像编辑和页面排版应用程序所支持。TIFF格式常常用于在应用程序之间和计算机平台之间交换文件。

3.2.4GIF图像格式

CIF是GraphicsInterchangeFormat(图形交换格式)的缩写,是由ComputerServe公司推出的一种图像格式。该种图像格式的特点是压缩比高,可以极大地节省存储空间。最初的GIF只是简单的用来存储单幅静止图像,后来可以同时存储若干幅静止图像从而形成连续的动画;同时,GIF格式支持透明背景,可以较好地与网页背景融合在一起。因此,GIF常常用于保存作为网页数据进行传输的图像文件,成为网络和BBS上使用频率较高的一种图像文件格式。但是GIF最多只能处理256种色彩,不能用于存储真彩色的图像文件。

3.2.5PNG图像格式

这种格式称为可移植网络图像文件格式(PortableNetworkGraphics),由ThomasBoutell,TomLan。等人提出并设计。其特点是:①支持48位真彩色图像、16位灰度图像和颜色索引数据图像;②主要面向网络图像传输和图像编辑,其提供的二维交叉存储机制使用户在图像网络传输过程中能更快的观察到接近真实的近似图像;③对用户完全透明且无专利限制,用户可以从Internet上随时下载与PNG文件格式配套的图像数据压缩算法源程序代码:④具有比GIF高5-20%的压缩效率;⑤具有可扩展性。

作为目前最不失真的图像格式,PNG格式图像吸取了GIF和JPEG二者的优点。它可以把文件压缩到极限以利于网络传输,但由于采用无损压缩方式来减少文件大小,PNG格式能保留所有与图像品质有关的信息。同时,PNG支持图像背景透明,显示速度快。

本文的所有图像的处理都是对由JPG格式图像通过图像格式转化得来的Bmp格式的索引色图像进行的,其具体转换程序参见附录[一]。

第四章图像分割4.1图像分割算法的定义与分类

在图像的研究和应用中,人们往往只对一幅图像中的某些部分感兴趣,这些感兴趣的部分一般对应图像定的、具有特殊性质的区域(可以对应单个区域,也可以对应多个区域),称之为目标或前景;而其它部分称为图像的背景。为了辨识和分析目标,需要把目标从一幅图像中孤立出来,这就是图像分割要研究的问题。所谓图像分割,从广义上来讲,是根据图像的某些特征或特征集合(包括灰度、颜色、纹理等)的相似性准则对图像象素进行分组聚类,把图像平面划分成若干个具有某些一致性的不重叠区域。这使得同一区域中的象素特征是类似的,即具有一致性;而不同区域间象素的特征存在突变,即具有非一致性。从集合的角度出发,图像分割定义如下:

设整个图像空间为一集合R。根据选定的一致性准则P,R被划分为互不重叠的非空子集(或子区域):{R1,R2,L,Rn},这些子集必须满足下述条件:

(1)R=

(2)对于所有的i和j,当i≠j,=空集

(3)P(Ri)=True,对所有的i

(4)所有i≠j;Ri,Rj相邻,P(RiURj)=False

(5)对i=1,2,L,n,Ri是连通区域

其中:P(Ri)为作用于Ri中所有象素的形似性逻辑谓词,i,j=1,2,L,…n。上述条件

(1)指出分割后的全部子区域的总和应包含图像中的所有元素,或者说分割应将图像中每个象素都分进一个子区域中。

(2)指出各个子区域相互不重叠。

(3)指出分割后得到的属于同一区域中的元素应该具有某种相同特性。

(4)指出对于分割后得到的属于相邻两个区域中的元素具有某种不同的特性。(5)要求同一个子区域内的元素应当是连通的。

其中分割准则P适用于所有象素,由它来确定各区域元素的相同特性。上述数学条件说明了图像分割算法的一些特点,凡不符合以上特点的图像处理算法则不能称为图像分割算法。

目前,在己提出的多种类型的分割算法中,大致可以分为基于边缘检测的方法和基于区域的方法。而在实际应用中,这些方法主要又可划分为三种类型:边缘检测型、阈值型和区域跟踪型。本文的讨论正是基于阈值型图像分割方法展开的。

4.2基于阈值的分割4.2.1方法定义与特点

基于阈值的分割方法是一种应用十分广泛的图像分割技术。所谓阈值分割方法的实质是利用图像的灰度直方图信息得到用于分割的阈值。它是用一个或几个阈值将图像的灰度级分为几个部分,认为属于同一个部分的象素是同一个物体。它不仅可以极大的压缩数据量,而且也大大简化了图像信息的分析和处理步骤。因此,在很多情况下,是进行图像分析、特征提取与模式识别之前必要的图像预处理过程。它特别适用于目标和背景占据不同灰度级范围的图像。阈值分割方法的最大特点是计算简单,运算效率高,在重视运算效率的应用场合,它得到了广泛的应用。

4.2.2阈值的分割的描述

设(x,y)是二维数字图像的平面坐标,图像灰度级的取值范围是G={0,1,2,…L-1}(习惯上0代表最暗的像素点,L-1代表最亮的像素点),位于坐标点(x,y)上的像素点的灰度级表示为f(x,y)。设t∈G为分割阈值,B={b0,b1}代表一个二值灰度级,并且b0,b1∈B。于是图像函数f1(x,y)在阈值t上的分割结果可以表示为:

阈值分割法实际就是按某个准则函数求最优阈值t的过程。域值一般可写成如下的形式:

T=T[x,y,f(x,Y),p(x,y)]

其中f(x,y)是在像素点(x,y)处的灰度值,p(x,y)是该点邻域的某种局部性质。4.3.3阈值分割方法的分类

通过上文的讨论,结合所给公式,可以将阈值分割方法分为以下3类:

1)全局阈值:T=T[p(x,y)〕,即仅根据f(x,y)来选取阈值,阈值仅与各个图像像素的本身性质有关。

2)局部阈值:T=T[f(x,y),p(x,y)],阈值与图像像素的本身性质和局部区域性质相关。

3)动态阈值:T=T[x,y,f(x,y),p(x,y)],阈值与像素坐标,图像像素的本身性质和局部区域性质相关。

全局阈值对整幅图像仅设置一个分割阈值,通常在图像不太复杂、灰度分布较集中的情况下采用;局部阈值则将图像划分为若干个子图像,并对每个子图像设定局部阈值;动态阈值是根据空间信息和灰度信息确定。局部阈值分割法虽然能改善分割效果,但存在几个缺点:

1)每幅子图像的尺寸不能太小,否则统计出的结果无意义。

2)每幅图像的分割是任意的,如果有一幅子图像正好落在目标区域或背景区域,而根据统计结果对其进行分割,也许会产生更差的结果。

3)局部阈值法对每一幅子图像都要进行统计,速度慢,难以适应实时性的要求。

图像法论文篇5

关键词:图像分割;直方图;粗糙集;粗糙度;阈值分割

中图分类号:TP18 文献标识码:A文章编号:1009-3044(2011)10-2356-02

Image Segmentation Based on Rough Set Theory

LI Ran

(School of Electronic and Communication Engineering, North China Electric Power University, Baoding 071003, China)

Abstract: Image segmentation is an important problem in digital image processing. Threshold segmentation method is a typical image segmentation method, and the choice of thresholds is an important aspect that affects the quality of image segmentation. For improving accuracy of segmentation, rough set theory is applied to determine threshold in this paper. Histogram is defined as the lower approximation of the rough set of image, and the Histon is defined as the upper one. Thus roughness is calculated, and then the effective segmentation threshold can be determined. Experimental results show that the algorithm has high segmentation accuracy compared with classical threshold segmentation method.

Key words: image segmentation; histogram; rough set; roughness; threshold segmentation

在图像分析和计算机视觉中,如何把目标物体从图像中有效分割出来一直是一个经典的难题,它决定图像的最终分析质量和模式识别的判别结果。图像分割就是将图像中有特殊意义的不同区域分割开来,使这些区域互不重叠。很多应用领域,最终的对象分类质量和场景解释在很大程度上取决于高质量的分割输出[1]。

图像分割方法的选择,在很大程度上依赖于特定的成像方式以及成像中的可变因素和不变因素(如噪声和纹理等),这些都会在很大程度上影响后继的分割[2]。现今国内外常用的图像分割方法主要包括阈值法[3-6]、区域生长法[7-8]、边缘检测法[9-10]、结合特定理论工具的分割方法等[11-13]。

粗糙集理论是一种具有不精确、不确定、不完整和不一致信息的全新数学工具,它可以从大量的数据中分析、推理、挖掘隐含知识及规律。本文将粗糙集理论中上近似和下近似的概念引入图像的直方图中,将粗糙度和直方图阈值分割法结合起来,确定最佳分割阈值,最终实现图像分割。

1 粗糙集理论的基本思想

粗糙集理论是20世纪80年代初由波兰数学家Z.Pawlak提出的,是一种用于研究不完整数据和不精确知识的表达、学习归纳的数学分析理论。粗糙集理论的核心思想是在保持分类能力不变的前提下,通过对知识的简化,导出问题的决策或分类规则。

基于粗糙集理论进行数据分析的全部对象的数据集合称为信息系统(IS),也称知识表达系统。一个信息系统可以用一个四元组来定义:IS=(U,A,V,f),其中U={x1,x2,…,xn}是对象的非空有限集合,称为论域;A={a1,a2,…,an}是属性的非空有限集合;V是属性A所构成的域,即V=∪Va,,Va是属性a∈A的值域;f:U×A->V是一个信息函数,U中任一元素取属性a在Va中有唯一确定值,即a∈A,x∈U,f(x,a) ∈Va。

在粗糙集理论中,主要讨论能够在论域U上形成划分或覆盖的知识[14]。通常,在问题求解过程中,处理的是论域U上的一簇划分。因此,定义论域U及论域U上的一簇等价关系S,称二元组K=(U,S)是关于论域U的一个知识库或近似空间。论域上的等价关系代表划分和知识。这样,知识库就表示了论域上由等价关系(属性特征及其有限个属性特征的交)导出的各种各样的知识,即划分或分类模式,同时代表了对论域的分类能力,且隐含着知识库中概念之间存在的各种关系。

粗糙集理论中还定义了不可分辨关系的概念。U/S表示论域U中的对象根据关系S构成的所有的等价类簇,若PS,且P≠,则∩P(P中的全部等价关系的交集)也是论域U一种等价关系,称为P上的不可分辨关系[15],记为:

不可分辨关系是对象P由属性集表达时在论域U中的等价关系。不可分辨关系是粗糙集理论的基石,它揭示出论域知识的颗粒状结构。

2 直方图分割法

基于直方图的图像分割方法属于阈值分割法的一种。目标区域和背景区域对比足够大的图像,借助直方图可方便地确定物体图像和背景的灰度突变位置,并把此处确定为阈值来进行图像分割。

图像的灰度直方图反映了一幅图像中各灰度级像素出现的频率,它能反映出图像的灰度分布情况。对于目标区域和背景区域有较大对比度的图像,其直方图会呈现明显的双峰结构,根据直方图的这一特点,可以方便地找到判决门限。但是这种经典的直方图阈值分割法只适用于目标物体有明显的灰度特征并且背景简单的图像分割,对于目标和背景没有明显灰度差异的图像则不能实现完美的分割。

3 基于粗糙集理论的图像分割方法

3.1 粗糙度基本概念

这里特别说明一下粗糙度的概念。给定知识库K=(U,S),则XU和论域U上的一个等价关系R∈IND(K),定义子集(概念或信息粒)X关于知识R的下近似和上近似分别为式(1)和式(2):

(1)

(2)

等价关系R定义的集合X的近似精度和粗糙度分别为式(3)和式(4):

(3)

精度αR(X)反映了在知识R下对于集合X表达的范畴了解的程度。粗糙度恰恰相反,它反映了在知识R下对于集合X表达的范畴了解的不完全程度。显然0≤αR(X)

3.2分割算法及其步骤

图像的直方图可以由粗糙集理论中近似空间的概念映射。设论域 为图像的灰度直方图,则知识库K=(U,S)为图像直方图的近似空间。图像的直方图根据像素的灰度值把像素划分为很多子集,每个像素被明确地归为某个子集中,因此被看作下近似。关于上近似的确定可以引入一个Histon直方图[16],它考虑了各像素和周围像素颜色间的近似关系。由下近似和上近似可根据式(4)确定粗糙度为:

(5)

式(5)中hi(g)表示图像基本直方图函数,Hi(g)为图像的Histon直方图函数,g为灰度值。当Hi(g)>>hi(g)时,ρi(g)接近于1,此时灰度为g的像素点大部分位于像素值变化比较小的区域,即图像的分割区域块内部;当Hi(g)

根据上面的分析,分割算法步骤设计如下:1) 由基本直方图求取下近似;2) 根据Histon直方图求取上近似;3) 求取粗糙度;4) 依据粗糙度选取最佳分割阈值。

4 仿真结果

选取256×256的cameraman图进行分割实验。图1(a)为原始图像,图1(b)为基本直方图分割法得到的分割结果,图1(c)为依据粗糙度选取最佳阈值的分割结果。由图1(c)可以看出,选用本文给出的分割方法相对于基本直方图分割法目标区域的提取更为完整,背景去除更为彻底。

5 结论

本文将粗糙集理论引入传统的直方图阈值图像分割法,提出了一种高效的图像分割方法。该方法利用粗糙集理论中的近似空间概念,将基本直方图和Histon直方图分别归为下近似和上近似,由此计算出粗糙度,来选取最佳的分割阈值,提高了区域划分的准确度。实验结果表明,基于粗糙度选取阈值的分割方法对于目标和背景没有明显差异并且背景复杂的图像会得到较好的分割结果。

参考文献:

[1] Lin Kai-yan, Wu Jun-hui, Xu Li-hong. A survey on color image segmentation techniques[J].Journal of Image and Graphics,2005,10(1):1-10.

[2] 何俊,葛红,王玉峰.图像分割算法研究综述[J].计算机工程与科学,2009,31(12):58-61.

[3] 任明武,杨静宇,孙涵.一种基于边缘模式的直方图构造新方法[J].计算机研究与发展,2001,38(8):972-976.

[4] 薛景浩,章毓晋,林行刚.基于最大类间后验交叉熵的阈值化分割算法[J].中国图象图形学报,1999,4(2):110-114.

[5] 付忠良.基于图像差距度量的阈值选取方法[J].计算机研究与发展,2001,38(5):563-567.

[6] Otsu N.A Threshold Selection Method from Gray Level His-togram[J].IEEE Trans on System Man and Cybernetics,1979,9(1):62-66.

[7] Pohle R, TENnies K D. A New Approach for Model-Based Adaptive Region Growing in Medical Image Analysis [C].Proc of the 9th Int'1 Conf on Computer Analysis and Patterns,2001:238-246.

[8] 王楠,黄养成.一种改进的彩色图像区域分割和边缘提取算法[J].装备指挥技术学院学报,1999,10(4):106-110.

[9] 应骏,叶秀清,顾伟康.一个基于知识的边沿提取算法[J].中国图象图形学报,1999,4(3):239-242.

[10] 王宇生,卜佳俊,陈纯.一种基于积分变换的边缘检测算法[J].中国图象图形学报,2002,7(2):145-159.

[11] KIM Jinsang, CHEN Tom. Multiple Feature Clustering for Image Sequence Segmentation[J].Pattern Recognition Letters,2001,(22):1207-1217.

[12] 陈燕新,戚飞虎.基于竞争Hopfield网络的自动聚类图像分割方法[J].模式识别与人工智能,1998,11(2):215-221.

[13] Chen D,Sun Y. A Self-Learning Segmentation Framework The Taguchi Approach[J].Comput Med Imaging Graph,2000,24 (5):283-296.

[14] 苗夺谦,李道国.粗糙集理论、算法与应用[M].北京:清华大学出版社,2008.

[15] Pawlak Z. Rough sets[J].International Journal of Computer and Information Science,1982,11(5):341-356.

图像法论文篇6

在西方英语国家学术界,对视觉文化的研究,大致有英国学派和美国学派二者。尽管二者间的交流既多且频,甚至主要人物也跨越大西洋而在英美两国从事教学和研究,如英国学者诺曼· 布莱逊(norman bryson),但二者却有一些区别。就方法论而言,二者大同小异,基本上都借用了二十世纪的欧美哲学理论、文化研究理论、美术史研究方法和美术批评方法,并采纳了当代影视理论、传播学理论和大众传媒的方法。但在研究领域和研究对象方面,二者却同中有异。其异在于,英国学者的视觉文化研究,包括了视觉艺术,例如绘画。相对而言,美国学者的视觉文化研究,则跨出了视觉艺术的界线,主要研究美术之外的图像及其功用,例如新闻媒体和商业广告所使用的图像。

美国学派的代表学者是芝加哥大学教授米歇尔(w.j. thomas mitchell,1942-),他任教于该校英文系和美术史系,并任著名学术期刊《批评探索》的主编。米歇尔的学术专长在于比较文学和美术史论,他对二十世纪的批评理论和方法比较了解,并站在当代学术前沿,引领美国视觉文化研究的方向。米歇尔在中国的影响也比较大,其“图像转向”(pictorial turn)的概念,甚至成为国内文化商业界一些从业人员鼓吹文盲式“读图时代”的理论根据。米歇尔著述甚丰,涉及视觉文化之图像理论的主要有三部,《图像学:图像、文本、意识形态》(iconology: image, text, ideology,1986)、《图像理论》(picture theory,1994)和《恐怖的克隆:图像战争,从美国九一一到伊拉克虐囚》(cloning terror: the war of images, 9-11 to abu ghraib),其中《图像理论》有中文译本,由陈永国、胡文征翻译,北京大学出版社2006年出版 。WwW.133229.COM

2008年1月,米歇尔应邀到加拿大蒙特利尔,在康科迪亚大学美术学院讲学,介绍他的图像学新著《恐怖的克隆:图像战争》,研讨视觉文化与当代图像学。其间,笔者有机会向米歇尔请教诸多问题,尤其是与笔者正写作的专著《视觉文化传播》相关的一些具体观点和概念。

在涉及视觉文化的研究领域和对象时,笔者专门向米歇尔求证其观点:您主张的视觉文化研究,包括不包括视觉艺术,诸如美术或绘画?米歇尔的答复非常明确:不包括。作为视觉文化研究之美国学派的领军人物,米歇尔早在八九十年代就对潘诺夫斯基的传统图像学进行了挑战,并以“图像转向”为号召,主张超越绘画和视觉艺术,使图像研究成为后现代以来之文化研究的一个重要内容。为此,他弃用潘诺夫斯基图像学的专业术语iconology,转而使用一个极其普通的日常词汇picture(图画),以示自己的大众文化研究与前者的精英文化研究相区别。

要之,视觉文化研究中的美国学派,是指以米歇尔为代表的学者,他们主张从大众传媒的角度去研究非艺术的图像,而不再局限于美术的角度和作为艺术作品的图像。本文作者赞同超越美术领域去探讨美术,也认为美术研究不应该局限于大师及经典作品。但是,笔者不认可美术研究同视觉文化研究相对立的观点,不认为二者相互排斥。相反,笔者认为,美术研究是视觉文化研究的一个重要组成部分,美术研究与视觉文化研究的关系是,视觉文化研究包括了美术研究,并为美术研究提供了一个超越美术的视角,这使研究者有可能从其它视角去发掘美术的更广、更深的意义,及其可能被美术研究所忽略的潜在价值。

二 三种图像

虽然笔者不能全盘接受米歇尔关于视觉文化之研究领域和研究对象的褊狭主张,但这并不妨碍笔者向他进一步请教相关问题:美术史研究与视觉文化研究有何区别?米歇尔回答说,美术研究和美术史研究,是将美术作为一种艺术现象来看待,即研究“艺术的图像”(artistic image),正如文学研究之于语言,是探讨怎样艺术地使用语言。相反,视觉文化研究关注的是“非艺术的图像”(non-artistic image),也即世俗的图像(vernacular image),尤如语言研究中对日常用语及其使用方法的关注。

在这样的意义上讲,所谓“图像转向”就不符合我们国内一些学者为“读图时代”的视觉狂欢而寻找舶来理论的初衷。就这个问题,笔者特意向米歇尔求证:您说“图像转向”,是否意味着语言文字的表意功能被图像取代了,是否意味着语言文字在当代文化研究中不重要了?米歇尔的回答十分清楚:绝不是这样。他说,语言文字自有其价值,不可能被视觉图像所取代。今天,所谓图像转向,是说图像研究超越了美术研究的疆界,而进入了摄影、电视等新的大众传播领域。这个观点,正是米歇尔新著《恐怖的克隆:图像战争》的理论前提。

米歇尔的当代图像学涉及三个“图像”术语,颇能说明“图像转向”及美国学派之视觉文化研究所关注的新对象。第一个是潘诺夫斯基采用的图像学术语iconology,源出古希腊语和拉丁语中的“肖似”一词,后来指基督教的图像,自19世纪初则被东正教用来指称圣像。潘诺夫斯基将这个词发展为专业术语,用于他对中世纪和文艺复兴之宗教艺术的阐释。第二个术语picture以其通俗化和大众化而具有后现代主义之平民文化色彩,不仅是对潘诺夫斯基之专业术语的颠覆,也是对其图像学基本概念的颠覆。然而,在米歇尔新著《恐怖的克隆:图像战争》中,他又使用了一个比较中性的术语image。于是,笔者向米歇尔请教:在当代图像学和视觉文化研究中,image与picture这两个概念有什么异同?

米歇尔用形象的语言来解释这个问题:一个picture就象一张画片,你可以用电脑软件来修改它,也可以把它撕毁,但画片上的原初图像却无法被改变或毁掉,这原初图像就是image,它以不同的方式存在于不同的地方,例如,它以数码方式存在和传播。于是笔者问:这是不是说,picture指图像的物理(physical)存在,而image则是原初图像本身,超越了物理的存在,而隐身于变形的picture中?米歇尔回答说是这样,并进一步解释道:作为原初图像的image不能被人为地任意扭曲,而被扭曲的只能是picture。经过人为扭曲后的图像,已经不再是最早那个未被扭曲的原初图像,而是一个具有实际用途的picture,例如商业或宣传用途。然而,在这被扭曲的picture中,却以基因密码的方式保存着原初image的信息。米歇尔的当代图像学和视觉文化研究,关注image怎样变成了picture,关注image所携带的信息,以及image经过了加工或人为的扭曲而成为picture后,这picture所具有的信息传播和宣传功能。

米歇尔的新著《恐怖的克隆:图像战争》便是对这一理论的阐述和实践。在涉及image转化为picture的过程和方式时,米歇尔提出了一个关于当代图像学的关键词“生物图像”(biopictures)。

三 生物图像

米歇尔对“生物图像”这一概念的阐释,是从人工智能、遗传基因、生物工程、数码复制等角度进行的。他的基本看法是,当作为image的图像借助大众传播工具而被广泛复制和传输时,不会出现失真的情况,因为这是一个数码复制和传输的过程。在这个过程中,数码信息保留了image原初的dna编码。与此相对,失真的图像是人为操作时出现的有意扭曲,是操作者出于某种目的而特意为之。他认为,当代大众传媒对于图像的使用,有意利用了人为失真的picture,但我们透过这图像的表象,却能把握其原初图像的真实信息。

照我的理解,任何图像一旦经过传播,无论是image还是picture,都会失真。传播是一个大规模复制并散发的过程,处于传播之另一端的图像,与原初图像有时间和空间的距离,这使复制和传播的图像,失去了它原初的语境。图像携带的原初信息,在相当程度上由其语境所确定,一个失去了自身时空语境的图像,只能是一个失真的图像,这就像本雅明所言,失去了该图像产生时的特定“光晕”(aura)。因此,无论以何种方式传播图像,都是无根漂浮,在相当程度上失去了原初的本真。

针对笔者提出的这个疑问,米歇尔说,本雅明所说的图像复制,是机器复制,与今日数码复制完全不同。数码复制所传输的是图像的生物信息dna,而不是机器复制所传输的图像外观。生物信息虽然脱离了原初的“光晕”,但所携遗传密码并未改变,因此不存在失真问题,这是今日数码传输的要义。我在此注意到,米歇尔的探讨转入了技术层面,他绕过了图像文本与其语境的关系问题,而开始了形而下的解说。虽然笔者坚持认为,图像的信息受制于原初的语境,但“生物图像”之说,却仍然具有启发意义。

对我而言,这启发就在于“仿生学”(bionics)和仿生艺术。仿生学是二十世纪兴起的一门工程技术科学,它研究生物功能,并转而将其应用于工程设计。例如在潜艇的设计中,为了降低航行的噪音,设计师们研究鲨鱼皮肤的内部构造,并模仿其构造而设计出具有静音功能的人工鲨鱼皮,用以制成消音瓦,将其覆盖于潜艇外壳,从而降低潜航噪音。这种生物仿制,是一种仿生学复制,尽管不必复制生物的外在表象,但却把握了生物遗传的信息编码,这使工程技术中的复制得以实现高保真。仿生艺术在西方兴起于八十年代末九十年代初,是环境保护主义的产物,多是以装置为外在形态的观念艺术,旨在传播环保意识。

由于米歇尔强调图像所携带的信息是以生物编码的方式来复制和传输,于是笔者便问他为何不用现成的术语“仿生图像”(bionic pictures),而要生造一个新术语“生物图像”,并问及二者有何种关系。米歇尔回答说,“生物图像”是一种用类似于克隆技术复制的图像,与机器复制的图像不同,不仅没有失真,反而因基因改造而优化了图像,而机器复制却因“光晕”不再而失去了原初的本真,因此,“生物图像”与“仿生图像”并无本质区别。

笔者由此想到,借助仿生学技术来复制图像,涉及的不仅仅是图像的外形,更重要的是涉及了特定外形所携带的内部基因密码。正是由于这生命遗传的密码,才使生物的外形与其功能密不可分,而生物外形与其生命功能的关系,又是达尔文进化论的要义,在今天不仅涉及到科学技术的进步,也涉及到文化和学术的发展。在此,“生物图像”关注的是生物外形与生命信息的编码,关注二者间的功能关系,并与当代艺术的方式发生了某种关联。

四 恶搞图像

关于这种关联,在我看来,米歇尔的上述理论虽然不是关于美术的,但这理论的意义,却在于它可以帮助我们理解当代艺术。例如,生物图像的复制,可以帮助我们从理论渊源上认识今日艺术中的“恶搞”方式。恶搞是视觉艺术的一种修辞方式,然而西方当代艺术中的恶搞与今日中国时髦的恶搞却有本质的区别。尽管两者都以幽默为基调,但前者带有相对强烈的政治信息,而后者则大多出于赢利的商业目的和庸俗趣味。我这样说并不是要无条件地赞同西式恶搞或一概否定中式恶搞,我说的只是今日艺术中的一种倾向。

西式恶搞的政治内含,与米歇尔所说的“图像战争”(war of images)密切相关。米歇尔的讲座,从头至尾贯穿了他对美国总统布什及其发动伊拉克战争的指责,他在讲座中使用的图像,也大多是伊拉克战争的新闻图片。照他的说法,发动战争和反对战争的双方,都利用了战地新闻图像。布什发动战争,其视觉依据之一,是九一一恐怖袭击中纽约世贸中心浓烟滚滚的图像,而后来人们反对伊拉克战争,其视觉依据之一,则是伊拉克阿布格拉监狱的虐囚照片和视像资料。

在虐囚图像中有一令人触目惊心者,是一个囚徒从头披着一身破麻布,双手接通两条电线。这个图像经过新闻媒介和网络而迅速传向世界各个角落,成为布什战争罪行的一大证据。由于这一图像广为流传而且极具感召力,美国苹果公司便将其借用来作商业推销,把原初图像中受电刑的囚徒,修改为一个听ipod的人正载歌载舞。这个被修改被扭曲了的图像作为广告推出后,招来社会各界的一片责难,苹果公司只好收回了这一不道德的广告,并灵机一动,又改头换貌赶制了嘲讽伊拉克战争的广告,继续推销自己的产品。

苹果公司对虐囚图像的两次修改利用,其实就是一种恶搞,先是商业恶搞,然后涂上了政治色彩。的确,除了这种商业恶搞,在西方有更多人对虐囚图像作了政治恶搞。米歇尔展示的一幅政治恶搞图像,是利用图中人的外形相关性,而将受电刑的伊拉克囚徒与西方文化传统中经典的耶稣受难图重叠起来,由此赋予这一虐囚图像以强烈的政治性,表达了恶搞者对布什发动战争的不满。从米歇尔之当代图像学的角度看,原初的虐囚图像image和被修改的虐囚图像picture之间,虽然经过了复制和传播,外貌发生了变化和失真,但其生命遗传的编码却得到了保存。换言之,原初图像中的生命密码,通过数码复制和传播而被转移到扭曲的图像中。这生命密码所携带的信息就是有关人类蒙难的信息。正因为人类蒙难的基因密码以数字方式保存了下来,所以虐囚图才与耶稣受难图有了内在的同构,这类似于仿生学的同构,于是进一步唤起了读图者对这二者之视觉外形的认同,从而使政治恶搞的目的得以实现。

虽然米歇尔的视觉文化研究不涉及美术,但在虐囚图像的话题上,他却言及了旅居纽约的著名哥伦比亚画家费南多·博特罗(fernando botero),因为这位以描绘傻笨肥俗的浅薄形象而闻名于世的当代大师,近年绘制了一系列关于美军在伊拉克监狱虐待囚徒的作品,以幽默的恶搞,来表达了艺术家明确的反战态度。博特罗的作品在纽约和欧美各地展出后,引起了广泛的反响,应和了西方世界的反战呼声。

在博特罗的绘画中,作为一种寓言的政治恶搞,发挥了图像的修辞功能,显示了图像的威力。米歇尔的当代图像学是一种具有强烈政治色彩的视觉文化理论,他超越了美术的领域,将视觉文化研究引入了传媒政治中,使我们可以从大众传媒的角度来阐释博特罗绘画的政治性和批评价值。然而非常有趣的是,米歇尔却口口声声说自己是一个“死心塌地的形式主义者”(i am a die-hard formalist)。我猜测,米歇尔的视觉文化研究,关注图像的构成、存在、复制、扭曲和传播方式,因此他是形式主义的。但是,我们应该看到,在这一切的背后,以生命密码的方式潜藏着米歇尔的政治态度和批判精神,这使他成为一个具有批判性的文化政治学者。

如果借用他自己的术语,我想这样说:米歇尔之视觉文化研究的政治性,以生命遗传的密码方式而成为其当代图像学内在的原初图像image,而他从形式角度对图像构成和传播方式的研究,则是其外在的picture。反过来说,在这个image中,以生命密码的方式,潜藏着他的政治信息。唯其如此,我们才明白他为什么会批评布什发动的战争,而不是去进行浅薄的商业恶搞。

结语

图像法论文篇7

关键词:光照不均图像;图像增强;幂次变换;多尺度Retinex

中图分类号:TP391文献标识码:A文章编号:1009-3044(2012)22-5456-03

Non-uniform Illumination Image Enhancement Based on the Power Low Transformation and MSR

ZHANG Ya-fei

(Department of Communication Engineering, Nanjing Institute of Technology, Nanjing 211167, China )

Abstract: Concerning the loss of details in the dark areas of non-uniform illumination images, the algorithm of non-uniform illumination image enhancement based on the power transform and MSR(Multi-Scale Retinex) is proposed. Firstly, the power low transformation on non-uniform illumination image is used to expand the dynamic range of the gray value in the dark areas and enhance the image details in the dark areas. Then, the result of the power low transformation is processed further based on MSR to improve the image contrast. The experiments show that the algorithm can eliminate non-uniform illumination and maintain the high contrast of the image, at the same time, enhance the details of dark areas in the original image.

Key words:non-uniform illumination image; image enhancement; power low transformation; MSR(Multi-Scale Retinex)

在图像采集过程中,由于光照环境或物体表面反光等原因会造成图像光照不均。光照不均在一定程度上改变了图像的原始面貌,增加了进一步处理的难度[1]。因此,需要对光照不均图像进行增强处理。常见的光照不均图像的增强方法有直方图均衡、Retinex增强方法[2]以及梯度域增强方法[3]等。直方图均衡化有利于图像对比度的提高,但由于该方法将原始图像中的多个灰度级合成一个新的灰度级,因此,原始图像中的一些细节信息会丢失。Retinex增强方法在滤掉了照射光的时候仅保留了反射光,从而导致增强后的图像具有较好的边缘细节,但对比度较差。而且,Retinex理论对图像中的照射分量还没有统一的理论模型,现有各种Retinex算法都只是在实验中验证了各自对光照补偿的有效性,并且都假设图像中的照明是平滑的,因此Retinex算法在全局上对图像的光照补偿有较好的效果,但对于局部光照变化较大的图像,其通过光照补偿的图像增强效果不太理想[4]。

该文针对光照不均图像的特点和常用图像增强算法的不足,提出了基于幂次变换和MSR的光照不均图像的增强算法。为了验证该算法的有效性,分别将幂次变换和MSR算法与该文算法的实验结果进行比较,结果表明该文的算法可以达到更好的增强效果。

1 MSR算法

Retinex(视网膜“Retina”和大脑皮层“Cortex”的缩写)是E. land[5-6]提出来的关于人类视觉系统如何调节感知到物体的颜色和亮度的模型,这个模型诠释了为什么同样的物体在不同光源或光线下颜色是恒定的。在Retinex理论中,一幅图像s(x,y)主要由两部分构成,分别是照射分量l(x,y)和物体的反射分量r(x,y),用公式表示为:

2图像的幂次变换

图像幂次变换的基本形式为

3该文算法描述

Retinex算法的物理意义是,在对数空间中,将原图像减去高斯函数与原图像的卷积的值,实际上是原图像被减去了平滑的部分,从而突出原图像中的细节。前面已经给出Retinex算法实现的前提是假设光照的平滑性,因此对于光照不均的图像其增强效果不太理想。因此,该文首先对光照不均图像进行幂次变换,在一定程度上改善光照的不均匀性对图像的影响。然后再利用Retinex算法进行增强处理。算法具体实现如下[12]:

1)对原始图像进行幂次变换,增强原始图像暗区的细节,参数γ取0到1之间的值;

2)根据输入的高、中、低三个尺度确定高斯环绕函数F(x,y);

3)用高斯函数和原始图像做卷积,得到低通滤波后的图像,即照射分量l(x,y),见公式(4);

4)从原始图像中除去低频的照射分量,得到增强后的信息,即R(x,y),见公式(5);

5)根据步骤3)和4)分别计算三个尺度下的增强信息,然后加权求和,见公式(6);

6)对R(x,y)进行指数变换,将其从对数域转换到实数域,得到增强后的图像r(x,y)。

4实验结果与分析

基于上述的图像增强算法,实验使用的是Matlab编程环境,并对不同方法的实验结果进行比较。图1为光照不均图像及其增强结果。其中,(a)为原始图像,(b)为幂次变换增强结果(c)为MSR增强结果,(d)为该文算法增强结果。

从图中可以看出,原始图像的光照不均匀;经过幂次变换后图像暗区的细节得到了增强,但图像整体的对比度较低。对原始图像进行MSR增强后,图像的对比度增强,但部分暗区的细节人眼仍无法辨别;而该文的算法在消除不均匀光照、保持图像较高的对比度的同时,有效地增强了图像中暗区的细节。为了评价图像增强的客观效果,该文采用熵和交叉熵来定量地进行评价[13]。

熵是衡量图像信息丰富程度的一个重要指标,熵的大小表示图像所包含的平均信息量的多少。图像的熵定义为:

5结论

光照不均影响了图像的视觉效果,同时增强了进一步图像处理的难度。针对光照不均的图像,该文提出了基于幂次变换和MSR的图像增强方法。实验表明该文的算法在增强光照不均图像中暗区的细节有明显的优势,为光照不均图像的进一步处理奠定了基础。

参考文献:

[1]梁琳,何卫平,雷蕾,等.光照不均图像增强方法综述[J].计算机应用研究,2010,27(5):1625-1628.

[2] JOBSON D J, RAHMAN Z, WOODELL G A. Properties and performance of a center/surround Retinex[J]. IEEE Trans. on Image Processing, 1997, 6(3):451-462.

[3] FATTAL R, LISCHINSKI D, WERMAN M. Gradient domain high dynamic range compression[C]//Proc of the 29th Annual Conference on Computer Graphics and Interactive Techniques. New York:ACM Press, 2002: 249-256.

[4]蒋永馨,王孝通,徐晓刚,等.一种基于光照补偿的图像增强算法[J].电子学报,2009,37(4A):151-155.

[5] LAND E H, MCCANN J. Lightness and retinex theory[ J] . Journal of Optical Society of America, 1971, 61( 1) : 1- 11.

[6] LAND E H. The Retinex theory of color vision[J]. Scientific American, 1977, 237(6):108-128.

[7]汪荣贵,朱静,杨万挺,等.基于照度分割的局部多尺度Retinex算法[J].电子学报,2010,38(5):1181-1186.

[8]储昭辉,汪荣贵,方帅.基于Retinex理论的小波域雾天图像增强方法[J].计算机工程与应用,2011,47(15):175-179.

[9]江兴方,陶纯堪. Retinex彩色图像增强理论的物理思考及其截断区间对图像质量的影响[J].光学技术,2007,33(1):127-129.

[10] Rahman Z, Jobson D J, Woodell G A. Multi-Scale retinex for color image enhancement[J]. IEEE Image Processing, 1996,3:1003-1006.

[11]刘茜,卢心红,李象霖.基于多尺度Retinex的自适应图像增强方法[J].计算机应用,2009,29(8):2077-2079.

[12]艾玲梅,乔丽,申军.多尺度Retinex方法在车辆胎痕图像增强方面的应用[J].计算机工程与应用,2011,47(30):192-194.

图像法论文篇8

提到图像解读必然离不开对图像学理论的介绍与运用。图像理论最重要的艺术史学家帕诺夫斯基曾在《图像学研究》一书中对图像学的研究理论与方法进行过深入阐述。他曾说过:“在一件艺术作品中,形式不能与内容分离。色彩、线条、光影、体积与平面的分布,无论在视觉上多么赏心悦目,都必须被理解为承载着多种含义。”因此,他将图像学研究分为三个层次:前图像志、图像志、图像学。同时,他对这三个概念进行了系统的阐述分析,认为前图像志阶段主要用于分析画面的基本形式,图像志阶段的用意在于识别图像的主题故事,图像学阶段的目标则是要阐释图像背后隐含的深层意义。贡布里希则在此基础上引入了情境分析的理论,力图将图像放置在更为广阔的历史背景中。另一方面,贡布里希也将帕氏的图像学研究视角拓展至广告、摄影、图片、漫画等一系列现代图像范畴,为此后的现代图像学的发展乃至“图像转向”的到来开拓了新的方向。因此,我们完全有必要也有理由在美术鉴赏教学活动中对此方法加以简化运用,以增加美术课堂的知识性与系统性。

那么如何在教学中运用图像学的方法呢?首先,我们应该知道一个前提,那就是图像学方法并不是万能的,它不适用于所有图像,应当警惕将其滥用的可能。但从另一个角度说,我们也可以将图像学简化为四个层次的模式,形式、主题、意义、背景,在中学美术鉴赏教学中对绝大多数的视觉文化图像从这四个方面切入。

例如,当我们分析库尔贝《画家的画室》时,可以首先探讨画家的构图样式、人物布局、表现手法、创作技法等内容,分析画面三段式布局与写实主义油画技法在当时的使用,给同学们一个较具体的形式层面的印象。其次,适当加入画家本人在书信中对作品的描述,逐一辨析每个人物的特征、身份与现实原型,为下一步的意义解读做准备。第三,对整幅作品的创作理念与意义进行剖析,指明库尔贝创作这幅作品的目的在于“通过绘画形式向世人展现:即希望通过艺术家、文学家、哲学家的人文思想与进步力量,改变当前世界纷繁复杂而激烈的社会矛盾,最终到达一种真善美的自然和谐世界。”[3]最后,要将整幅作品以及库尔贝写实主义艺术放到十九世纪艺术发展的大的时代背景中看。我们会发现整个19世纪的欧洲一直处于社会变革的激荡之中,当时很多的艺术家包括库尔贝在内,都主动地以自己的方式去寻求社会变革的方法,甚至如库尔贝本人那样希望以绘画的形式为社会变革进步寻求方向。通过这样的分析我们不难看出,库尔贝在《画家的画室》中所揭示的意义,就是对此时代潮流观念的图绘性解读。

通过以上分析我们可以发现,图像学方法在中学美术鉴赏教学中具有比较突出的优势。其一,可以让我们在面对图像的时候不怯场,不会不知所云,但这一点更多地建立在我们课后的广泛阅读与准备中,准备的素材越充分,课堂所包含的知识量就越丰富。其二,可以使我们在具体的鉴赏过程中能够对所见图像的教学解读条分缕析,娓娓道来。其三,可以使我们的教学既充满知识性又能够融入趣味性,提高学生对相关知识的吸引度,而不只是照本宣科,使学生失去对美术应有的感悟。

正如本文开头所说的那样,21世纪已经是一个图像世界,我们早已进入了读图时代,对于图像的把握与教学是当下高中美术课程教学新的热点问题。如果将图像学的理论融入到课堂教学的情境中,将高深的理论知识进行合理的简化,必然会进一步适应读图时代大众尤其是学生的需求,提升人们的美术素养。

参考文献:

[1]丹尼尔·贝尔.资本主义的文化矛盾[M].上海:三联书店,1989.156.

[2]海德格尔.海德格尔选集[M].上海:三联书店,1996.下卷904.

[3]周渝.画家的画室——一个隐含社会变革进步理想的真实寓言[J].新美术.2011(2).

上一篇:唱歌教学范文 下一篇:函数概念范文