图像分析论文范文

时间：2023-09-26 17:08:05

图像分析论文

图像分析论文篇1

关键词：嵌入式系统，图像采集，电路设计

Abstract:Inthispaper,wepresenttwodifferentinterfacesbetweendigitalaimagesensorsandaprocessorforembedsystems,I/OmodeandDMW(DirectMemoryWrite)mode.InI/Omode,processorcanreadimagedatathroughI/Oport,andtheinterfaceissimple.InDMWmode,imagedatacanbewriteintoRAMdirectlywhileaprocessorissuspended.

Keywords:EmbedSystem,ImageCapture,ElectronicCircuit

一、引言

随着半导体技术的飞速发展，具有图像功能的嵌入式应用愈来愈多。从数码相机、可视电话、多功能移动电话等消费产品到门禁、数字视频监视等工业控制及安防产品，图像采集和处理已成为重要的组成部分之一。图像采集需要进行同步信号的处理，比通常的A/D数据采集过程复杂，电路的设计也较为困难。传统PC上的图像采集卡都是在Philips、Brooktree等半导体公司提供的接口芯片基础上，由专业公司开发生产。在嵌入式系统中不同的处理器和图像传感器的信号定义及接口方式不同，没有通用的接口芯片。另外，利用系统中的现有资源设计图像采集电路，可以减少器件数量、缩小产品体积和降低系统成本。所以，通常嵌入式系统中要求自行设计图像采集接口电路。本文针对不同采集速度的要求，提出了两种图像采集接口电路的设计方法。

目前市场上主流的图像传感器有CCD、CMOS两种器件，其中CMOS器件上世纪90年代产生，近年来得到了迅速发展。传感器的输出有模拟和数字两种。由于CMOS器件功耗小、使用方便，具有直接数字图像输出功能，作者在设计时选用了CMOS数字输出图像传感器件。其他方式器件的接口设计与此类似，将在讨论中说明。

本文内容做如下安排：第二部分简述图像信号的特点；第三、四部分分别介绍I/O和内存直接写入两种接口设计方法；最后部分是讨论。

二、图像信号介绍

图1给出了采样时钟(PCLK)和输出数据（D）之间的时序关系。在读取图像数据时用PCLK锁存输出数据。除采样时钟（PCLK）和数据输出(D)外，还有水平方向的行同步信号(HSYNC))和垂直方向的场同步信号（VSYNC）。对于隔行扫描器件，还有帧同步信号（FRAME）。如图2，一帧包括两场。图2中窄的矩形条是同步脉冲，同步脉冲期间数据端口输出的数据无效。

PLCK存在时，图像数据端口连续不断地输出数据。由于行之间以及场之间输出数据无效，在采集图像数据必须考虑同步信号，读取有效数据才能保证图像的完整性。

三、I/O接口设计

对于MCU、DSP处理器，I/O是最方便的访问方式之一。以I/O方式读取图像数据不仅可以简化电路设计，而且程序也很简单。但由于读取每一个像素都要检测状态，在处理器速度低的情况下，读取图像慢。在处理器速度快或图像采集速度要求不高的应用中，I/O接口方式是一个较好的选择。

1、电路原理和结构

在图像传感器和处理器之间，利用两个锁存器分别锁存状态和图像数据，处理器通过两个I/O端口分别读取。图3中，在采样时钟的上升沿数据锁存器保存传感器输出的图像数据，当处理器通过I/O口读取图像时，数据锁存器输出数据。其它情况下，锁存器输出处于高阻状态。处理器通过状态锁存器读取同步信号和图像就绪（Ready）指示信号。在数据锁存器保存图像数据的同时，状态锁存器产生Ready信号（从‘0’到‘1’）。处理器读取图像数据时，Ready信号自动清除（从‘1’到‘0’）。处理器读取状态时锁存器驱动总线，其他情况下输出处于高阻状态。

2、图像读取流程

要保证图像的完整性就必须从一场图像的第一行开始读取，对于隔行扫描输出的图像则必须从一帧的第一行开始读取。读取每行图像数据时，则从该行的第一个像素开始。因此，在读取图像数据前应先判断场和行的起始位置。图4是通过I/O接口方式读取图像数据的流程。读取每个像素数据前先查询数据状态，如果数据已准备好则读取数据。

3、同步信号检测

为了简化电路设计，用处理器直接读取同步信号，然后找出场和行的起始位置。

从图2可以看出，处理器读取同步信号时，信号可能处在同步脉冲状态（‘1’）或正常状态（‘0‘）。对于那些同步信号反向的器件，则分别为‘0’和‘1’。如果信号处于同步脉冲状态，第一次检测到的正常状态就起始位置。如果信号处于正常状态，则首先检测到脉冲状态，然后用同样的方法确定起始位置。

通过上述方法可以检测出场的起始位置和行起始位置。

4、用VHDL设计锁存器

在应用中，以上两个锁存器的功能和其他逻辑集中在一起，用可编程逻辑器件实现。下面分别为它们的VHDL表示。

设DO(0-7)是锁存器输出端，DI(0-7)是锁存器输入端，DM(0-7)是中间状态，Data_R是数据读信号（低电平时有效），则数据锁存器的VHDL描述为：

Process(reset,PCLK)--锁存图像数据

Begin

Ifreset=''''0''''then

DM<="00000000";--清除数据

ElseifPCLK''''eventandPCLK=''''1''''then

DM<=DI;--锁存数据

Endif;

Endprocess;

Process(DM,Data_R)--读取图像数据

Begin

IfData_R=''''0''''then

DO<=DM;--输出图像数据

Else

DO<="ZZZZZZZZ"--输出高阻

Endif;

Endprocess;

进一步设数据有效状态为Dstatus,状态读写信号为Status_R(低点平时有效)，则状态锁存器的VHDL描述为：

Process(reset,PCLK，Data_R)--数据有效状态控制

Begin

Ifreset=''''0''''orData_R=''''0''''then

Dstatus<=''''0'''';--清除状态

ElseifPCLK''''enentandPCLK=''''1''''then

Dstatus<=''''1'''';--设置状态

Endif;

Endprocess;

Process(Dstatus,Status_R)--读取状态和同步信号

Begin

IfStatus_R=''''0''''then

DO0<=Dstatus;

DO1<=VSYNC;

DO2<=HSYNC;

DO3<=FRAME;

Else

DO<="ZZZZZZZZ";--高阻状态

Endif;

Endprocess;

四、内存直接写入接口设计

在处理器速度较慢且图像数据输出的频率不能降低的情况下，采用上述I/O接口方法不能得到完整的图像。另外，有些应用中要求能够实时采集图像。为此，我们设计了高速数据图像采集方法―内存直接写入法。由于SRAM访问控制简单，电路设计方便，被大量嵌入式系统采用，本文以SRAM作为存储器。

1、电路原理和结构

内存直接写入方法通过设计的图像采集控制器（以下简称控制器）不需处理器参与，直接将图像数据写入系统中的内存中，实现高速图像采集。

图5是接口结构图，当需要采集图像时，处理器向控制器发出采集请求，请求信号capture_r从高到低。控制器接到请求脉冲后，发出处理器挂起请求信号HOLD,使处理器的外总线处于高阻状态，释放出总线。控制器收到处理器应答HOLDA后管理总线，同时检测图像同步信号。当检测到图像开始位置时，控制器自动产生地址和读写控制信号将图像数据直接写入内存中。图像采集完成后，控制器自动将总线控制权交还处理器，处理器继续运行，控制器中与采集相关的状态复位。控制器可以根据同步信号或设定的采集图像大小确定采集是否完成。

在图5中，控制器包括同步信号检测、地址发生器、SRAM写控制器、总线控制器和处理器握手电路等主要部分。同步信号检测确定每一场（帧）和每一行的起始位置；地址发生器产生写SRAM所需的地址；SRAM写控制器产生写入时序；总线控制器在采集图像时管理总线，采集完成后自动释放；处理器握手电路接受处理器命令、发总线管理请求和应答处理器。

2、SRAM写控制时序

采集图像过程中，控制器自动将数据写入到硬件设定的内存中。写内存时，控制器产生RAM地址（A）、片选信号(/CS)、读信号(/RD)和写信号(/WD)，同时锁存传感器输出的数据并送到数据总线(D)上。每写入一个数据后，地址(A)自动增1。采集时/CS保持有效（‘0’）状态而/RD处于无效状态（‘1’）。地址A的变化必须与/WD和数据锁存器协调好才能保证图像数据的有效性。

图6是控制器产生的SRAM信号时序图。用PCLK作为地址发生器的输入时钟，且在其上升沿更新地址值。同样，在PCLK的上沿锁存数据并输出到总线上。将PCLK反相，作为/WD信号，使得在/WD的上升沿地址和数据稳定，确保写入数据的有效性。

3、控制器主要功能的VHDL描述

描述控制器中全部功能的VHDL代码较长，而且有些部分是常用的（如计数器等）。图像采集状态产生和同步信号的检测是其中重要的部分。下面介绍这两部分的VHDL描述。

图像采集状态capture_s:

处理器的采集请求信号capture_r使capture_s从‘0’到‘1’，场地址发生器（计数器）的溢出位vcount_o，清除capture_s。

process(capture_r,reset,vcount_o)

begin

ifreset=''''0''''orvcount_o=''''1''''then

capture_s<=''''0'''';--清除

elseifcapture_r''''eventandcapture_r=''''0''''then

capture_s<=''''1'''';--置状态位

endif;

endprocess;

同步信号检测：

只有在采集状态capture_s有效时（‘1’）才检测场同步信号，场同步信号下降沿置场有效状态（vsync_s），场地址发生器溢出位vcount_o清除场有效状态。只有在vsync_s有效情况下才检测行同步信号，行同步信号下降沿置行有效状态（hsync_s），行计数器溢出信号hcount_o清除行状态。只有在行状态有效的情况下计数器才工作，且将数据写入RAM。

Process(capture_s,reset,vcount_o,vsync)

Begin

Ifreset=''''0''''orvcount_o=''''1''''orcapture_s=''''0''''then

Vsync_s<=''''0'''';--清除

Elseifvsync''''eventandvsync=''''0''''then

Vsync_s<=''''1'''';--置状态位

Endif;

Endprocess;

Process(vsync_s,reset,hcount_o,hsync)

Begin

Ifvsync_s=''''0''''orreset=''''0''''orhcount_o=''''1''''then

Hsync_s<=''''0'''';--清除

Elseifhsync''''eventandhsync=''''0''''then

Hsync_s<=''''1'''';--置状态位

Endif;

Endprocess;

五、讨论

我们在基于TI公司的TMS320C3X系列DSP开发的嵌入式指纹图像处理模块中分别用上述两种方法成功实现了指纹图像的采集。

采用I/O接口方式最关键的是要求处理器的频率远高于图像数据输出的频率。例如，如果处理的指令周期为20ns，读取每个数据需要10个指令周期，则数据的输出频率不能超过5MHz，它低于一般的CMOS图像传感器件最快的数据输出频率。例如国内使用较多的OV7610和OV7620，其正常输出数据频率为13.5MHz。在应用过程中，通常改变传感器中寄存器的设置值，降低其数据输出频率。

本文选用的是CMOS数字输出图像传感器。对于模拟视频信号，在设计时应加同步分离和A/D转换电路。图像采集的数字接口和逻辑控制与本文相同。

在我们系统中所采集的是单色图像，如果采集彩色图像逻辑设计是相同的所不同的只是数据宽度和后期处理方式。

图像分析论文篇2

关键词模糊数学理论；图像处理；计算机；应用

中图分类号O1 文献标识码A 文章编号 1674-6708（2012）81-0117-02

模糊数学理论于1965年提出，它是对模糊性现象进行研究和处理的方法和理论，模糊数学理论的基本概念是模糊集合。近年来，关于模糊数学理论的研究进一步加深，模糊技术在众多领域得到了应用。计算机图像处理技术是借用计算机的识别和运算功能来进行图像的处理，在图像处理的过程中也会用到模糊数学理论，简化图像处理和调整的方法，提高图像处理的准确度和精确度。

1模糊数学理论概述

在日常生活中，我们经常会用到高个、胖子、年轻、漂亮热、善、好等形容词，这些词语只是对事物的大致描述，边界比较模糊，在范围上不能进行明确的界定，这就和模糊数学理论相关。模糊数学理论就是对模糊性现象进行分析和研究的方法和理论，该理论要重点把握模糊数学和随机数学以及精确数学之间的关系，对模糊性现象进行界定。因此，不仅生活中的模糊性现象比较多，工作中还会有许多模糊的问题，比如在确定水是否烧开的时候要对水的状态和温度进行确定，但是由于模糊性，水的温度和状态都不能进行明确的界定，需要运用模糊数学理论来分析和解决问题。近年来，模糊数学理论在模糊识别与控制、模糊评判、系统理论、医学、信息检索以及生物学方面都得到了广泛的应用，而计算机领域是模糊数学的重点研究领域。模糊数学理论可以解决计算机过于精确化的问题，帮助计算机对模糊信息进行敏捷和灵活的处理。

2模糊数学理论在图像处理中的应用分析

图像处理是利用计算机来进行图像的编码、图像数字化、图像分割、图像增强、图像分析和图像复原，虽然图像处理可以通过模拟技术和光学方法实现，但是图像数字处理技术具有方便性和灵活性，数字图像处理技术得到了重要的应用。在用计算机进行图像处理的过程中，要对图像的清晰度、对比度和图像颜色进行处理，对图像的蓝、黄、红三大基色进行模糊的调动和处理，提高图像处理的质量。

模糊数学理论对图像融合的作用。图像融合是提取有利信息来进行高质量图像的综合，提高原始图像的光谱分辨率和空间分辨率，提高计算机对原始图像信息的利用。传统的计算机图像融合方法是对两张图像的简单重叠，图像融合的准确性较低，模糊数学理论在图像处理中的应用就可以避免图像融合准确性较低的问题，图像经过处理之后的偏差率比较小。在图像融合的过程中，图像像素值会有一定程度的灰度值，图像的变化主要是由这些灰度值来决定的，如果灰度值达到了一定的程度，图像的性质就会发生变化。通过对灰度值和图像的关系分析可以发现，灰度值的变化影响着图像的变化以及图像效果的变化。因此，在利用计算机对图像融合处理的过程中，可以利用模糊理论，对灰度值与图像变化之间的关系进行进行快速的推断。计算机的运算能力和图像处理能力是非常强大的，通过对模糊数学理论的应用可以较快速的得到图像变化的范围和结果，实现图像融合的最佳效果。

模糊数学理论对图像调整的作用。图像调整一般都是对图像颜色的调整，通过不同的颜色来实现不同的视觉效果和应用效果，图像颜色调整可以通过对比度的调整来实现。图像效果有现代、古典、哥伦风、经典影楼以及其他效果，在利用计算机进行图像调整的过程中需要对图像颜色值进行调整，实现图像调整的最佳效果。但是在图像处理的过程中会有一些较为特殊的图像处理，在灰度值较大的图像调整和处理中，要首先对图像的灰度边缘进行调整，增加图像的灰度值，通过对比来进行图像效果的分析。如果图像的灰度值确定，可以通过灰度值的计算来掌握最大灰度值的计算，实现图像的对比调整。模糊数学在图像调整的过程中就是对对象对比度和图像颜色值的调整，由于图像处理效果没有明确的界定，处理人员可以通过模糊的调整来实现不同的图像处理效果。

模糊数学理论在其他图像处理中的应用。除了图像融合和图像调整，图像融合还包括了图像数字化、图像编码、图像分割和图像增强等，模糊数学理论在这些图像处理中的效果也是非常明显的。图像增强是指使图像变得更为清晰，使图像满足人们使用和计算机的要求。图像增强包括了边缘锐化、伪彩色处理和干扰抑制等，图像增强不需要保持原图像的色彩和强度，因此图像处理人员可以采用模糊数学理论来进行图像的增强。而图像分析是指对图像的数据信息以及度量进行抽取，得到图像的数值结果，对图像内容进行相关的描述，实现对图像信息的深度把握，图像分析只是对图像数值的简单抽取，处理人员可以利用模糊数学理论来解决图像分析和图像分割过程中的各种模糊问题，实现较好的图像处理效果，实现图像的增强和复合，解决图像处理中各种模糊问题。

3结论

模糊数学理论于上世纪的60年代提出，近年来在机械、化工、生物、医学以及计算机领域得到了快速的发展，解决了各种模糊性的难题。图像处理包括了图像数字化、图像分割、图像融合、图像增强以及图像分析，模糊数学理论可以对图像灰度值的变化范围进行分析和把握，解决灰度值变化和图像色彩变化之间的关系问题，通过采取合适的灰度值来实现较好的图像处理效果。因此，模糊数学理论可以有效的解决生活和工作中的各种模糊难题，实现问题的最佳解决。

参考文献

[1]郭川军.计算机指纹识别技术研究[J].中国科技信息，2011（5）.

[2]赵永强，潘泉，张洪才.一种新的全色图像与光谱图像融合方法研究[J].光子学报，2010（1）.

[3]冯苍旭，史云，陈实.图像处理技术在地质灾害监测中的应用[J].中国地质灾害与防治学报，2009（2）.

图像分析论文篇3

提到图像解读必然离不开对图像学理论的介绍与运用。图像理论最重要的艺术史学家帕诺夫斯基曾在《图像学研究》一书中对图像学的研究理论与方法进行过深入阐述。他曾说过：“在一件艺术作品中，形式不能与内容分离。色彩、线条、光影、体积与平面的分布，无论在视觉上多么赏心悦目，都必须被理解为承载着多种含义。”因此，他将图像学研究分为三个层次：前图像志、图像志、图像学。同时，他对这三个概念进行了系统的阐述分析，认为前图像志阶段主要用于分析画面的基本形式，图像志阶段的用意在于识别图像的主题故事，图像学阶段的目标则是要阐释图像背后隐含的深层意义。贡布里希则在此基础上引入了情境分析的理论，力图将图像放置在更为广阔的历史背景中。另一方面，贡布里希也将帕氏的图像学研究视角拓展至广告、摄影、图片、漫画等一系列现代图像范畴，为此后的现代图像学的发展乃至“图像转向”的到来开拓了新的方向。因此，我们完全有必要也有理由在美术鉴赏教学活动中对此方法加以简化运用，以增加美术课堂的知识性与系统性。

那么如何在教学中运用图像学的方法呢？首先，我们应该知道一个前提，那就是图像学方法并不是万能的，它不适用于所有图像，应当警惕将其滥用的可能。但从另一个角度说，我们也可以将图像学简化为四个层次的模式，形式、主题、意义、背景，在中学美术鉴赏教学中对绝大多数的视觉文化图像从这四个方面切入。

例如，当我们分析库尔贝《画家的画室》时，可以首先探讨画家的构图样式、人物布局、表现手法、创作技法等内容，分析画面三段式布局与写实主义油画技法在当时的使用，给同学们一个较具体的形式层面的印象。其次，适当加入画家本人在书信中对作品的描述，逐一辨析每个人物的特征、身份与现实原型，为下一步的意义解读做准备。第三，对整幅作品的创作理念与意义进行剖析，指明库尔贝创作这幅作品的目的在于“通过绘画形式向世人展现：即希望通过艺术家、文学家、哲学家的人文思想与进步力量，改变当前世界纷繁复杂而激烈的社会矛盾，最终到达一种真善美的自然和谐世界。”[3]最后，要将整幅作品以及库尔贝写实主义艺术放到十九世纪艺术发展的大的时代背景中看。我们会发现整个19世纪的欧洲一直处于社会变革的激荡之中，当时很多的艺术家包括库尔贝在内，都主动地以自己的方式去寻求社会变革的方法，甚至如库尔贝本人那样希望以绘画的形式为社会变革进步寻求方向。通过这样的分析我们不难看出，库尔贝在《画家的画室》中所揭示的意义，就是对此时代潮流观念的图绘性解读。

通过以上分析我们可以发现，图像学方法在中学美术鉴赏教学中具有比较突出的优势。其一，可以让我们在面对图像的时候不怯场，不会不知所云，但这一点更多地建立在我们课后的广泛阅读与准备中，准备的素材越充分，课堂所包含的知识量就越丰富。其二，可以使我们在具体的鉴赏过程中能够对所见图像的教学解读条分缕析，娓娓道来。其三，可以使我们的教学既充满知识性又能够融入趣味性，提高学生对相关知识的吸引度，而不只是照本宣科，使学生失去对美术应有的感悟。

正如本文开头所说的那样，21世纪已经是一个图像世界，我们早已进入了读图时代，对于图像的把握与教学是当下高中美术课程教学新的热点问题。如果将图像学的理论融入到课堂教学的情境中，将高深的理论知识进行合理的简化，必然会进一步适应读图时代大众尤其是学生的需求，提升人们的美术素养。

参考文献：

[1]丹尼尔·贝尔.资本主义的文化矛盾[M].上海：三联书店，1989.156.

[2]海德格尔.海德格尔选集[M].上海：三联书店，1996.下卷904.

[3]周渝.画家的画室——一个隐含社会变革进步理想的真实寓言[J].新美术.2011（2）.

图像分析论文篇4

（天津商业大学天津300134）

摘要：本文运用Kress & Van Leeuwen提出的视觉语法理论，对一幅计划生育宣传画进行多模态话语分析，解读其再现意义，互动意义和构图意义，揭示了当时社会背景对其创作的影响。

关键词：视觉语法；计划生育宣传画；多模态话语分析

作为一项基本国策，计划生育政策在我国已经实行了数十年。计划生育宣传画是一种典型的多模态政治话语，对于理解计划生育政策有巨大帮助。本文尝试运用Kress和Van Leeuwen提出的视觉语法理论，解读一幅计划生育宣传画的多模态意义。

一、视觉语法理论

20世纪90年代以来，对于多模态话语的意义分析逐渐兴盛起来。但是以往的话语分析集中于语言文字这种单一话语模态上，多模态话语分析的指导理论基本没有。鉴于此种情况，Kress 和 Van Leeuwen（1996）在他们的著作Reading Images： The Grammar of Visual Design中，提出了一种多模态话语分析的理论框架，即视觉语法，认为图像可以表现三种意义，即再现意义，互动意义和构图意义，为解读图像的意义提供了重要的理论依据。

再现意义对应功能语法中的概念功能，表征图像中参与者之间的概念关系。根据图像中是否有向量出现，Kress和Van Leeuwen把再现意义区分为叙事再现和概念再现两种。向量标志了叙事再现，而概念再现中则没有向量。叙事再现又可以进一步分为行动过程，反应过程，以及言语和心理过程。概念再现则主要包括分类过程，分析过程和象征过程。

其次，图像还可以构建观看者和图像中表征参与者之间的关系，即互动意义。互动意义主要通过接触，距离，视角和情态来实现。当图像中表征参与者直视观看者的时候，表征参与者与观看者之间就形成了接触。这时的表征参与者似乎在向观看者索取什么东西，我们称之为 “索取”类图像。如果表征参与者与观看者之间没有接触，则表征参与者只是客观地呈现一些信息，这类图像被称为 “提供”类图像。距离指的是通过表征参与者在图像框架中的大小来表现其与观看者的关系。不同的距离可以表现出不同的亲疏关系。例如，特写可以表现亲近距离，中镜头表现社会距离，而远镜头则表现了一种公共的距离。视角主要反映表征参与者与观看者之间的态度关系。视角可以从水平视角和垂直视角两个维度进行考量。其中正面的水平视角表明观看者属于图像的一部分，而倾斜的水平视角则暗示观看者不属于图像的一部分。垂直视角中的仰视，俯视和平视也可以表现出表征参与者与观看者不同的权势关系。最后情态表现的是图像的真实性和可信性。体现图像情态的资源很丰富，包括颜色饱和度，颜色区分度，再现，深度，照明，语境化等等。每种情态标记都是一个连续体，从最高情态到最低情态。判断情态高低的标准并不是客观的，而是与历史和文化背景息息相关（李战子， 2003）。

构图意义表现的是图像中表征参与者相互联系的方式，以及他们是如何组成一个整体的（Kress and van Leeuwen， 1996： 181）。分析构图意义主要考虑其信息值和显著性。图像参与者的信息值主要由他们在图像中所处的位置决定。一般来说，图像左侧是已知信息，右侧是新信息。图像上方是理想情况，下方是真实情况。图像中心是重要信息，四周是附属信息。显著性指的是图像中表征参与者的重要程度，可以通过大小，前景或背景，色调对比等手段进行实现。

二、计划生育宣传画的视觉语法分析

根据Kress和Van Leeuwen的视觉语法，本文将对一幅计划生育宣传画进行多模态话语分析，解读其中体现的再现意义，互动意义和构图意义。

1.再现意义

这幅宣传画中存在两个向量，构成了两个反应过程。具体来说，图中的父母面带微笑，看向画外的某些东西，在这个过程中，父母是反映者（reactor），而现象（phenomenon）没有直接体现出来。从他们喜悦的表情中，我们可以猜测或许是他们对计划生育和美好生活的向往。第二个过程中，女儿是反映者，她手中的语文课本则是现象。那个年代农村读书的女孩比较少，通过构建这个反应过程，可以表现出计划生育政策对女孩的关注。

2.互动意义

宣传画中的父母看向画外，与宣传画的观看者形成了眼神接触。根据视觉语法理论，这种有“接触”的图像是“索取”类的，即图像中的人物向观看者索取什么东西。考虑到这幅宣传画的计划生育主题，我们可以推断，图中的人物是在索取观看者的认同感，请求观看者加入到计划生育的实践中来。

距离方面，图中人物都被置于前景，并且只有上半身显露出来，这样就与观看者形成了一种亲近的距离，暗示了一种亲密的关系，即计划生育与观看者是息息相关的。

视角方面，图中的人物是水平正面面向观看者的。根据视觉语法理论，“正面视角意味着图中表现的内容是我们世界的一部分，是与我们的世界一体的。”就是说，观看者实际上与宣传画中表现的内容处在同一种社会实践中，这样也可以提高观看者对计划生育政策的参与感。

3.构图意义

信息值方面，我们可以看出一家三口占据了整个宣传画的中心部分。其他元素，比如背景中的电塔，建筑，大桥则分布在图像的四周。这是一种典型的中心-边缘式分布，中心部分是核心信息，而边缘部分则是附属信息。可以看出这幅宣传画重点强调了人物的工农学的阶级身份属性，以及计划生育给他们带来的喜悦和好处。

多模态话语分析强调将各个模态看成一个整体。在这幅宣传画中，图像在上方，标语文字“为革命实现晚婚和计划生育”在下方。根据视觉语法理论，图像上方的元素是理想中的状况，下方的元素是现实的方面。这意味着计划生育的目的是控制人口数量，造就和谐家庭氛围，为了达到这个目的，这幅宣传画把计划生育与当时火热的联系了起来，把计划生育建构成了革命工作的需要，这样能很大程度上激起人们的参与热情。

谈到显著性，可以看出，一家三口在图中是最显著的元素，承担了整幅画中最重要的角色。他们被置于前景之中，并且尺寸巨大，与背景中的建筑，景物形成鲜明对比。并且他们衣着艳丽，色彩饱和度高，夺人眼球。在当时的社会背景下，农村女孩读书也是一件很稀少的事儿。这些因素共同构成了一家三口在图中的显著性作用。

三、结语

上文运用Kress和Van Leeuwen的视觉语法理论，对一幅计划生育宣传画的再现意义，互动意义和语篇意义进行了解析。通过分析我们发现，这幅宣传画通过突出再现一个三口之家，拉近他们与观看者的距离，表现出来计划生育对社会生活的改善，提升了人们的参与感。同时从这幅画的“索取”特征，可以看出其宣传目的是很明确的，就是要求观看者参与计划生育实践。另外一个很明显的特征就是这幅宣传画着重表现了人物工农学的阶级身份特征，并且将计划生育与革命的需要连接起来。70年代，中国的还处于的社会环境中，工人农民是社会的主人，人们充满了革命的热情。这种表现手法正迎合了广大人民群众的身份需求和革命热情，必然会起到很好的宣传效果。

参考文献：

[1]Halliday， M. A. K.An Introduction to Functional Grammar （3rd edition） [M].London： Edward Arnold.2004.

[2]Kress， G. and van Leeuwen， T.Reading Images[M].London： Routledge.1996/2006.

[3]李战子.多模式话语的社会符号学分析[J].外语研究，2003（5）：2.

图像分析论文篇5

关键词：央视新闻微博；多模态话语分析；功能；意义；协同

中图分类号：H319

文献标识码：A 文章编号：1672-1101（2016）03-0077-04

Abstract： The users of micro blog which is a popular platform of social network convey meanings though such modes as words， pictures， videos， creating a multi-modal discourse constituted by many symbols. The article is based on the theory of Halliday’s three meta-functions and Kress’ visual grammar. It analyzes from the perspective of image analysis and words analysis one of CCTV News micro blogs which was posted online on August 27th， 2015， entitled “Are You Willing to Repost for the Elephant at the Moment.” It finds that conveying meanings is the ultimate purpose for the modal design of different micro blogs. Through the synergy between these different modes， the expression of meanings is maximized.

Key words： CCTV news micro blog； multimodal discourse analysis； function； meaning； synergy

随着科学技术的发展，语言不再是交际的唯一形式。人们以图像、声音、动作、动漫、网络等符号资源进行交际构成了多模态话语。多模态话语的研究始于20世纪90年代，它以系统功能语法为基础，认为语言以外的其他符号资源也具有概念功能、人际功能与语篇功能。和语言一样，图像、声音等其它符号资源也可以通过编码实现交际和意义再现。Kress 和 Leeuwen在1996年提出视觉语法，认为“正如语言的语法决定词如何组成小句、句子和语篇，视觉语法所描绘的是人物、地点和事物在不同复杂程度的视觉陈述中的组成方式”[1]43。他们将功能语法中的元功能延伸到视觉模式上，提出了再现―互动―构成的图像分析框架[1]146。O’Halloran通过研究多模态的理论建构将多模态话语分析运用于电影语篇之中[2]。国内学者对于多模态话语的研究也日益增多。张德禄以系统功能学理论为基础，为多模态话语分析建立了理论框架，进一步探讨了多模态话语中各模态的协同[3]24-30；胡壮麟通过分析以文字、图像、乐曲、动作为主体的多模态小品来探讨多模态小品中的主体模态[4]；李战子、陆丹云探讨了多模态符号学的理论基础、研究途径和发展前景[5]。此外，不少学者将多模态话语分析运用到电影海报[6]、电影[7]、天气预报[8]9-15、政治漫画[9]等不同语篇之中。

微博作为一种集图像、文字和声音为一体的新型交际资源，具有典型的多模态性，但至今少有学者对其进行解读与分析。本文以央视新闻微博为研究对象，根据多模态分析方法和理论框架对其进行解析，从而探讨央视新闻微博如何通过构建多模态来实现意义以及各模态之间的协同关系。

一、多模态话语的分析框架

多模态话语指运用听觉、视觉触觉等多种感觉，通过语言、图像、声音、动作等多种手段和符号资源进行交际的现象[3]24。系统功能语言学认为语言是一种社会符号和意义潜势。韩礼德在功能语法中提出了语言的三大功能：概念功能、人际功能和语篇功能。概念功能是人们对现实世界（包括内心世界）的经历进行表达的功能；人际功能指人们运用语言参加社会活动的功能；语篇功能则是语言用于组织信息的功能。多模态话语以功能语法为基础，认为语言以外的其他符号系统也可以交际和实现意义，同样具有三大元功能。Leeuwen将图像也看作社会符号，提出视觉语法，按照功能语法中的三个元功能提出了再现―互动―构图的分析框架[1]146。多模态话语的设计通过选择和组织符号资源来体现功能，实现意义。各模态之间的相互协同和相互配合是意义得到最大实现的基础。利用不同模态之间的关系使不同的模态相互配合，从而构建多模态话语的整体性。因为不同的模态体现的意义属于同一个交际事件，需要整合为一体才具有交际意义[8]10。微博以图像和文字两种形态同时出现。从系统功能语言学角度出发，文字在表达意义的同时需要体现概念功能、人际功能和语篇功能，图像则需实现再现意义、互动意义和构图意义。本文以央视新闻微博2015年8月27日下午17点39分的一则主题为“此刻，你愿为大象转发倡议吗？”（图1）的微博为语料。文字和图像作为微博两种不同的模态，如何在体现功能的同时，相互配合使多模态语篇的意义得到最大实现是本文进行分析的主线。

二、央视新闻微博的多模态话语分析

（一）文字的概念功能和图像的再现意义

概念功能指的是语言对人们在现实世界中各种经历的表达，即反映客观和主观世界中所涉及的人和物以及有关的时间地点等因素。它主要由及物性和语态构成。图像的再现意义是指利用图像再现客观事物及其与外部世界的联系。Kress和Leeuwen根据图像的不同特征将其分为叙事图像和概念图像。叙事图像中，互动参与者（设计者和读者）或再现参与者（图像表现的事物）通过矢量产生互动，如目光的延伸、手指的指向等。而概念图像则表现再现参与者更深层次、相对稳定的本质和特征，不存在矢量的运用。央视新闻微博的文字由两部分组成：作为主标题置前的【此刻，你愿为大象转发倡议吗？流泪表情】和由117字构成的新闻内容。主标题以第一人称的视角和反问的句式提出主题，引出“你”和“大象”两大主体，告知读者该微博内容中“你”和大象存在某种关系，反问的句式和流泪的微博表情暗含了新闻内容所包含的情感，在引发读者好奇心的同时为新闻奠定感情基调，暗示读者新闻内容的严肃性。新闻内容提供了两个信息点，一是近日广州海关查获32件象牙制品，二是昨天泰国销毁2吨走私象牙。通过时间、地点和数量三个要素陈述了人类杀害大象以谋取利益的客观事实。其中，人和大象是杀戮者和被杀戮对象的关系。新闻的后半部分用四个感叹句警示并提出倡议，在引起读者共鸣的同时为人们看待人与大象的关系提供另一切入点。

新闻图像是叙事图像，由九幅图组成，呈九宫格形式。前三幅图中头戴DNP字样帽子的人是动作者，象牙是动作的对象。动作者手拿象牙，两个胳膊构成动作的矢量，形成鲜明的对角。图一和图五中动作者的目光分别望向象牙和大象，也构成了一个矢量。图三中动作者的目光望向读者，赋予了读者极大的想象空间。后六幅图以大象为主体，特写的大象残肢与新闻内容中大象被屠杀过程的描写相呼应。这些图像通过行动过程和反应过程再现了新闻内容中的大部分信息。但是微博如果仅仅以图像的形式出现，则无法表达新闻中所提供的时间和地点信息。因此，文字和图像作为两种不同的模态，在体现概念功能方面是相辅相成的。图像对文字主要起强化作用，提高信息的真值和价值，文字则弥补了图像信息的缺失。

（二）文字的人际功能和图像的互动意义

人际功能指语言所具有的表达说话者身份、地位、态度、动机及其对事物的推断等方面的功能。文字的排列、措词，字体的大小、粗细以及不同句式的运用都可以表达说话者的态度。图像的互动意义是通过接触、社会距离和态度等途径实现的。设计者通过对图像的距离、视点、色彩、饱和度等要素的设计引导读者的态度和情感，实现与读者的互动。央视新闻微博作为中央电视台新闻中心的官方微博，其目的是要准确、及时地向人们报道重大新闻、突发事件，同时引导正确的主流价值观。新闻的主标题部分放在加粗的中括号中，便于引起读者的注意。标题后紧跟的微博流泪表情即暗示了该新闻的情感基调，又拉近了与读者的距离。反问句式的意图是引起人们注意某种现象并参与到某种行动中。新闻正文部分多用数字以显示新闻内容的准确性，语句短小精练便于读者快速接受信息。在描写大象被屠杀的句末以省略号结尾，便于读者思考和想象。正文部分以四个感叹号结尾，感情强烈，给读者视觉上的紧张感和压迫感。

图像可以造成观看者和图像中的特定关系，它们以此和观看者互动，并提示观看者对所再现的景物应持的态度[10]6。新闻图三中动作者手拿象牙望向观看者，存在想象中的“接触”，使观看者感受到动作者渴望获得对大象的关注。从距离来看，图一和图三对动作者的取景都是半身，表示社会的近距离，即图像中的景物是一种与读者息息相关社会现状。从视点分析，观看者与图像成俯视的角度，暗示读者是主导者，具有操纵图中景物的权力。图二则恰好相反，观看者仰视象牙，象牙给人一种触目惊心的压抑感。此外，前三幅图使用高饱和度色彩，增加了图像的真实性。图四、五、六特写大象，观看者与大象成平视角度，表示大象与观看者本是平等的关系，而特写的大象残肢也引起读者的思考。黑白的图像色彩以及对大象残肢细节的最大再现使读者受到感情冲击，传递出一种庄严而又悲伤的感情氛围，与前三幅图形成对比。文字以其直观的方式与读者进行交流，反映社会现象，揭示人与大象的关系。图像以真实的场景再现和色彩的强烈对比使读者在视觉和感觉上得到冲击，更容易引起读者的共鸣。

（三）文字的语篇功能和图像的构图意义

语篇功能是指语义层中把语言成分组织成语篇的功能。语篇功能涉及到主位和述位，以衔接结构为语法系统。构图意义指图像的再现成分和互动成分整合成一个有意义的整体。它通过信息值、显著性和取景体现。各成分在整体图像上的不同位置体现着不同的信息值。显著性可通过位置、大小、颜色、重合等体现。央视新闻微博作为一种多模态语篇，其文字和图片的组织需有其内在的关联性。以大小写首字母对微博正文进行主位[T]、述位[R]标注和衔接标注，则为：

（1）近日[T1]，广州海关[T2]查获了32件象牙制品[R1]，[T3]外观雪白圆润[R2]

（2）你[T4]能想象[R3]吗？大象[T5]半跪着[R4]，[T6]半张脸被砍[R5]，[T7]痛苦死去[R6]，只因人类[T8]要割走它的牙齿[R7]……

（3）就在昨天[T9]，泰国[T10]销毁2吨走私象牙[R8]，每个象牙[T11]背后都是血淋淋的生命[R9]。[T12]没有买卖[R10]！[T13]就没有杀戮[R11]！[T14]绝不购买象牙制品[R12]，[T15]支持的转[R13]！

根据主位分布，可将语篇分为三个部分。第一部分中，T1“近日”和T2“广州海关”为两个独立的主位，R1“象牙”为述位。后半句中，T3“象牙”由述位变为主位，R2是对T3的描写，表明T3的特点。第二部分中，R3“想象”的内容即为R4，R5，R6。它们全部围绕T5展开，显性主语为T5，并与R7成因果关系。第三部分中，T9“昨天”和T10“泰国”与第一部分中T1“近日”，T2“广州海关”对等。T11“象牙”由述位变为主位。T12，T13，T14，T15与T8相同，“人类”为显性主位，R10“买卖”和“R11”为因果关系。由此可见，文字使语篇内容具有关联性，体现了其组篇功能。

图像的构图意义通过信息值，取景和显著性三种资源来表现。新闻上方的三张图片是“理想化”的，最显著的部分。三图中人类通过销毁象牙以阻止象牙买卖以传达人们想要保护大象的美好愿望。而新闻下方的六张大象被宰割后的图片是更细节，更实际的信息。此外，九张图片中五张是大象残肢的特写，黑白着色并置于图像的中心，突出了大象目前所面临的惨状和形势的严峻性。图像再现构图意义强化了文字的组篇功能。图文结合，上下呼应，使整个多模态语篇更加连贯，准确和真实。

（四）模态之间的协同关系分析

文字和图像作为两种不同的模态，在微博中相互协作、相互配合是必要的。张德禄将多模态话语不同模态之间的关系归纳为两类：互补关系（强化和非强化）和非互补关系（交叠、内包和语境）[8]13。在强化型互补关系中，一种模态是主要的交际形式，而另一种或多种是对它的强化。非强化互补关系则表示两种交际模态缺一不可，互为补充。

图像和文字在提供信息，实现概念意义时为强化型互补关系。文字是主要的交际形式，读者通过对文字的阅读把握微博所传递的主信息。图像是辅助的交际形式，它将文字中的部分信息点（销毁象牙和被屠杀的大象）以图像的形式展现出来，突出了整体信息的重点，并扩充了文字意义。文字是前景化的，而图像只提供背景信息。在体现人际功能时，图像和文字是非强化型互补关系，即图像和文字缺一不可，互为补充。央视微博作为中央电视台新闻中心的官方微博，其言论与观点必须使广大人民群众信服，起到引导正确价值取向的作用。文字以描述事实来呼吁人们加入到保护大象的行动中，图像则以记录事实来弥补文字在感染力和号召力上的不足。文字与图像相互联合，相互协调，从而实现微博与读者的互动。文字和图像在实现组篇意义时是强化型互补关系。文字语篇是主模态，它以其内在的衔接、连贯和关联性组织语言。图像取景与文字描写的信息一致，色彩与文字营造的氛围相符合，摆放顺序与位置强化了文字所传递的讯息。两种模态通过相互配合和相互协同来充分表达话语的整体意义。

三、结语

本文以系统功能分析法为理论，从功能语法的三大纯理功能和视觉语法的三大意义两个方面对央视新闻微博的多模态性进行了解析。通过对央视新闻微博的分析发现，微博的文字与图片存在强化型互补和非强化型互补两种关系。二者相辅相成，相得益彰，通过相互作用来充分实现意义的表达。由此可见，微博在选择模态建构时，以意义的表达为最终目的。在整个交际过程中，不同形式的模态经过设计整合后必须相互作用，相互配合，才能将意义的实现达到最大化。

参考文献：

[1] Kress G， T. Van Leeuwen. Reading Images： The Grammar of Visual Design[M]. London： Routledge， 1996.

[2] O’ Halloran K L. Multimodal Discourse Analysis： Visual Semiotics in Film[M]. London：Continuum， 2004：62-67.

[3] 张德禄. 多模态话语分析综合理论框架探索[J]. 中国外语， 2009（1）： 24-30.

[4] 胡壮麟. 论多模态小品中的主体模态[J]. 外语教学， 2011，32（4）： 1-5.

[5] 李战子，陆丹云. 多模态符号学：理论基础，研究途径与发展前景[J]. 外语研究， 2012（2）： 1-8.

[6] 程春松. 电影海报的多模态话语解读[J]. 电影文学， 2008（15）： 34-35.

[7] 李妙晴. 改编电影的多模态话语分析―以《大红灯笼高高挂为例》[J]. 电影文学， 2007（15）： 96-99.

[8] 张德禄. 动态多模态话语的模态协同研究―以电视天气预报多模态语篇为例[J]. 山东外语教学， 2011（5）： 9-15.

[9] 潘艳艳. 政治漫画中的多模态隐喻及身份建构[J]. 外语研究， 2011（1）： 11-15.

图像分析论文篇6

关键词小波变换；遥感图像；高频信息；图像处理

中图分类号TP7 文献标识码A 文章编号 1674-6708（2011）47-0220-02

基于小波变换的遥感图像是处理高频信息形态数据源的主要方法之一，通过对基于小波变换图像技术的分析,总结了基于单小波遥感图像的基本方法和每种方法的优缺点，以及在分析小波图像和小波标架变换的基础上，提出了基于小波变换的图像算法和小波标架变换的图像算法。

1 压缩感知的基本原理

以小波为基的压缩感知的基本原理图像压缩处理对于航空、航天、军事侦察、灾害预报等许多领域至关重要,针对遥感图像噪声大、边界不清楚等问题,提出了应用小波变换对遥感图像进行压缩感知和边缘检测处理的方法。

1.1基于小波变换的边缘检测原理

以小波为基的图像压缩处理是技术关键的之一，寻求性能良好的压缩方法是一个重要的研究领域，通过对小波基设诛预滤波器构造以及图像处理中的问题分析，是解决图像处理的有效途径。因此，遥感图像的先验模型对于图像的视觉处理至关重要，对于图像的先验模型从多个角度进行研究，其代表主要有统计方法、正则化几何建模方法和稀疏表示方法。

小波变换图像融合是将同一场景中多幅图像的互补信息合并成一幅新图像,以便更好地对场景进行观察和理解，为遥感图像提供一种加精确的分析方法，在研究小波变换特性的基础上,提出基于小波变换的图像融合方法。实验证明,该方法具有很好的融合效果。随着小波变换体技术的发展,小波变换数字技术已成为一个研究热点。在分析小波变换数字的基础上,提出基于提升格式小波变换的数字水印算法,该算法在对图像处理方面达到较好的效果。

1.2基于小波变换的图像数据压缩原理

随着现代信息社会对通信业务要求的不断增长,基于小波变换的图像数据压缩原理与通信网容量的矛盾日益突出。特别是具有庞大数据量的数字图像通信,更难以传输与存储,极大地制约了图像通信的发展,已成为图像通信发展中的瓶颈问题。图像压缩编码的目的就是要以尽量少的比特数表征图像,同时保持复原图像的质量,使它符合特定应用场合的要求。

基于小波变换的图像数据压缩原理是图像数据压缩发展史上一个新的里程碑，它在频率和位置上都是可变的，非常适合分析瞬态信号。当分析低频信号时其时窗很大，而分析高频信号时其时窗很小，这恰恰符合实际问题中高频信号的持续时间短、低频信号的持续时间长的自然规律。

2 以小波基为稀疏基的图像压缩处理方法

根据遥感图像中的不同地貌具有不同的频谱特性,人工建筑区相对其他区域具有较高的频率,提出了基于小波变换和数学形态学的遥感图像人工建筑区提取算法。

2.1对遥感图像进行小波变换压缩处理

将不同地貌的信息转换到不同频带,再对高频信息进行融合，并将融合后的高频信息中幅度变化剧烈的区域看作遥感图像的“山峰”,变化平稳的区域看作遥感图像的“盆地”,最后采用形态学重建的方法提取人工图像的压缩图像,实验结果表明,该算法具有快速性和准确性的特点。

目前遥感图像的种类繁多,针对中高分辨率的可见光成像的遥感图像进行分析发现,在遥感图像中不同的地貌呈现出不同的规律,在图像上的表现形式就是具有不同的纹理,所以对遥感图像的纹理进行粗分割，实际上就是对图像中地貌的一种粗分类,纹理分割的主要任务是将图像进行划分。

2.2遥感图像频率分布处理

以小波基为稀疏基的图像压缩处理相对低频，景物处于相对高频。根据小波变换多分辨率特点,图像经多层小波分解,得到的低层细节系数代表图像的相对高频部分,高层细节系数代表图像的相对低频部分。提出通过增大图像的高频细节系数,减小低频细节系数。利用视觉评价、平均梯度等方法评价实验结果,表明分析遥感图像频率算法的有效性。

遥感图像频率分布的特征一般主要有多光谱图像去云、多副图像叠加、云多传感器图像融合，遥感成像小波系数分辨率分析图像处理的成像过程中,由于高层细节系数的遮挡使获得的遥感图像变得模糊。运用图像处理技术,研究如何有效去除影响,成为了提高遥感数据利用率的必要途径。

3 遥感图像压缩处理的质量评价

3.1遥感图像压缩处理的质量评价

与小波相比遥感图像压缩处理的质量评价，不仅具有小波的多分辨率特性和时频特性，还具有很好的方向性和各向异性。小波的支撑域边长在该尺度下的基函数支撑域的纵横比可以任意选择，基函数的支撑域来逼近曲线的过程，由于它的基函数的支撑域表现为“长方形”，因而是一种更为有效稀疏的表示法。与二维可分离小波基函数的方向支撑域的各向同性不同，其支撑域表现出来的是各向异性的特点。

遥感图像压缩处理的质量评价表示方法都是采用单一基，另外一条遥感图像压缩处理的质量评价表示的途径是，基函数原子库的图像系统。通过遥感信号在完备库上的分解,用来表示信号可适应本身的特点，灵活选取以得到遥感压缩图像。小波分析用于平稳信号和图像的处理优于传统的傅里叶变换，已被许多应用领域的事实所证实。

3.2压缩感知处理的形态分量方法分析

基于压缩感知处理的形态分量方法的图像分解，较好的结合了变分方法和稀疏表示方法两类图像分解的优点，为图像处理问题提供了良好的处理机制。首先从关于图像形态分量分解的变分方法来看，研究朝着对图像结构和纹理等形态成分刻画更精细方向发展。通过关于压缩感知处理的形态分量结构和纹理分量的有效分离，由于目前所涉及的表示的主要有正交系统。随着压缩感知处理的形态分量表示理论的发展，通过不同的分类表示、稀疏性度量和正则化方法，可以导出不同的图像形态分量分析算法。

4结论

小波变换在遥感图像处理中的应用是近年迅速发展起来的新兴学科，具有深刻的理论意义和广泛的应用范围。小波变换在遥感图像处理中的应用是一种信号的时间尺度分析方法，它具有多分辨分析的特点，而且在时频两域都具有表征信号局部特征的能力。

参考文献

[1]王仁.小波变换在遥感图像处理中应用思考[J].北京技术，2009(11).

[2]赵厚琴，刘伟.遥感图像处理中探索网络数据应用管理[J].安徽农业科学，2007(8).

图像分析论文篇7

由於在现今资讯流通普遍的社会中，影像的需求量越来越大，影像的数位化是必然的趋势。然而在数位化过的影像所占的资料量又相当庞大，在传输与处理上皆有所不便。将资料压缩是最好的方法。如今有一新的模式，在压缩率及还原度皆有不错的表现，为其尚未有一标准的格式，故在应用上尚未普及。但在不久的未来，其潜力不可限量。而影像之於印刷有密不可分的关系。故以此篇文章介绍小波（WAVELET）转换的历史渊源。小波转换的基础原理。现今的发展对印刷业界的冲击。影像压缩的未来的发展。

壹、前言

由於科技日新月异，印刷已由传统印刷走向数位印刷。在数位化的过程中，影像的资料一直有档案过大的问题，占用记忆体过多，使资料在传输上、处理上都相当的费时，现今个人拥有TrueColor的视讯卡、24-bit的全彩印表机与扫描器已不再是天方夜谭了，而使用者对影像图形的要求，不仅要色彩繁多、真实自然，更要搭配多媒体或动画。但是相对的高画质视觉享受，所要付出的代价是大量的储存空间，使用者往往只能眼睁睁地看着体积庞大的图档占掉硬碟、磁带和光碟片的空间；美丽的图档在亲朋好友之间互通有无，是天经地义的事，但是用网路传个640X480TrueColor图形得花3分多钟，常使人哈欠连连，大家不禁心生疑虑，难道图档不能压缩得更小些吗？如此报业在传版时也可更快速。所以一种好的压缩格式是不可或缺的，可以使影像所占的记忆体更小、更容易处理。但是目前市场上所用的压缩模式，在压缩的比率上并不理想，失去压缩的意义。不然就是压缩比例过大而造成影像失真，即使数学家与资讯理论学者日以继夜，卯尽全力地为lossless编码法找出更快速、更精彩的演算法，都无可避免一个尴尬的事实：压缩率还是不够好。再说用来印刷的话就造成影像模糊不清，或是影像出现锯齿状的现象。皆会造成印刷输出的问题。影像压缩技术是否真的穷途末路？请相信人类解决难题的潜力是无限的。既然旧有编码法不够管用，山不转路转，科学家便将注意力移转到WAVELET转换法，结果不但发现了满意的解答，还开拓出一条光明的坦途。小波分析是近几年来才发展出来的数学理论。小波分析，无论是作为数学理论的连续小波变换，还是作为分析工具和方法的离散小波变换，仍有许多可被研究的地方，它是近几年来在工具及方法上的重大突破。小波分析是傅利叶（Fourier）分析的重要发展，他保留了傅氏理论的优点，又能克服其不足之处。可达到完全不失真，压缩的比率也令人可以接受。由於其数学理论早在1960年代中叶就有人提出了，而到现在才有人将其应用於实际上，其理论仍有相当大的发展空间，而其实际运用也属刚起步，其後续发展可说是不可限量。故研究的动机便由此而生。

贰、WAVELET的历史起源

WAVELET源起於JosephFourier的热力学公式。傅利叶方程式在十九世纪初期由JosephFourier(1768-1830)所提出，为现代信号分析奠定了基础。在十九到二十世纪的基础数学研究领域也占了极重要的地位。Fourier提出了任一方程式，甚至是画出不连续图形的方程式，都可以有一单纯的分析式来表示。小波分析是近几年来才发展出来的数学理论为傅利叶方程式的延伸。

小波分析方法的提出可追溯到1910年Haar提出的小波规范正交基。其後1984年，法国地球物理学J.Morlet在分析地震波的局部性质时，发现传统的傅利叶转换，难以达到其要求，因此引进小波概念於信号分析中，对信号进行分解。随後理论物理学家A.Grossman对Morlet的这种信号根据一个确定函数的伸缩，平移系{a-1/2Ψ[(x-b)/a]；a,b?R,a≠0}展开的可行性进行了研究，为小波分析的形成开了先河。

1986年，Y.Meyer建构出具有一定衰减性的光滑函数Ψj,k(x)，其二进制伸缩与平移系{Ψj,k(x)=√2jΨ(2jx-k)；j,k?Z}构成L2（R）的规范正交基。1987年，Mallat巧妙的将多分辨分析的思想引入到小波分析中，建构了小波函数的构造及信号按小波转换的分解及重构。1988年Daubechies建构了具有正交性（Orthonormal）及紧支集（CompactlySupported）；及只有在一有限区域中是非零的小波，如此，小波分析的系统理论得到了初步建立。

三、WAVELET影像压缩简介及基础理论介绍

一、WAVELET的压缩概念

WAVELET架在三个主要的基础理论之上，分别是阶层式边码(pyramidcoding)、滤波器组理论(filterbanktheory)、以及次旁带编码(subbandcoding)，可以说wavelettransform统合了此三项技术。小波转换能将各种交织在一起的不同频率组成的信号，分解成不相同频率的信号，因此能有效的应用於编码、解码、检测边缘、压缩数据，及将非线性问题线性化。良好的分析局部的时间区域与频率区域的信号，弥补傅利叶转换中的缺失，也因此小波转换被誉为数学显微镜。

WAVELET并不会保留所有的原始资料，而是选择性的保留了必要的部份，以便经由数学公式推算出其原始资料，可能不是非常完整，但是可以非常接近原始资料。至於影像中什度要保留，什麽要舍弃，端看能量的大小储存（跟波长与频率有关）。以较少的资料代替原来的资料，达到压缩资料的目的，这种经由取舍资料而达到压缩目地的作法，是近代数位影像编码技术的一项突破。即是WAVELET的概念引入编码技术中。

WAVELET转换在数位影像转换技术上算是新秀，然而在太空科技早已行之有年，像探测卫星和哈柏望远镜传输影像回地球，和医学上的光纤影像，早就开始用WAVELET的原理压缩/还原影像资料，而且有压缩率极佳与原影重现的效果。

以往lossless的编码法只着重压缩演算法的表现，将数位化的影像资料一丝不漏的送去压缩，所以还原回来的资料和原始资料分毫无差，但是此种压缩法的压缩率不佳。将数位化的影像资料转换成利於编码的资料型态，控制解码後影像的品质，选择适当的编码法，而且还在撷取图形资料时，先帮资料「减肥。如此才是WAVELET编码法主要的观念。

二、影像压缩过程

原始图形资料色彩模式转换DCT转换量化器编码器编码结束

三、编码的基本要素有三点

（一）一种压缩/还原的转换可表现在影像上的。

（二）其转换的系数是可以量化的。

（三）其量化的系数是可以用函数编码的。

四、现有WAVELET影像压缩工具主要的部份

（一）WaveletTransform（WAVELET转换）：将图形均衡的分割成任何大小，最少压缩二分之一。

（二）Filters（滤镜）：这部份包含WaveletTransform，和一些着名的压缩方法。

（三）Quantizers（量化器）：包含两种格式的量化，一种是平均量化，一种是内插量化，对编码的架构有一定的影响。

（四）EntropyCoding（熵编码器）：有两种格式，一种是使其减少，一种为内插。

（五）ArithmeticCoder（数学公式）：这是建立在AlistairMoffatslineartimecodinghistogram的基础上。

（六）BitAllocation（资料分布）：这个过程是用整除法有效率的分配任何一种量化。

肆、WAVELET影像压缩未来的发展趋势

一、在其结构上加强完备性。

二、修改程式，使其可以处理不同模式比率的影像。

三、支援更多的色彩。可以处理RGB的色彩，像是YIQ、HUV的色彩定义都可以分别的处理。

四、加强运算的能力，使其可支援更多的影像格式。

五、使用WAVELET转换藉由消除高频率资料增加速率。

六、增加多种的WAVELET。如：离散、零元树等。

七、修改其数学编码器，使资料能在数学公式和电脑的位元之间转换。

八、增加8X8格的DCT模式，使其能做JPEG的压缩。

九、增加8X8格的DCT模式，使其能重叠。

十、增加trelliscoding。

十一、增加零元树。

现今已有由中研院委托国内学术单位研究，也有不少的研究所的硕士。国外更是如火如荼的展开研究。相信实际应用於实务上的日子指日可待。

伍、影像压缩研究的方向

1.输入装置如何捕捉真实的影像而将其数位化。

2.如何将数位化的影像资料转换成利於编码的资料型态。

3.如何控制解码影像的品质。

4.如何选择适当的编码法。

5.人的视觉系统对影像的反应机制。

小波分析，无论是作为数学理论的连续小波变换，还是作为分析工具和方法的离散小波变换，仍有许多可被研究的地方，它是近几年来在工具及方法上的重大突破。小波分析是傅利叶（Fourier）分析的重要发展，他保留了傅氏理论的优点，又能克服其不足之处。

陆、在印刷输出的应用

WAVELET影像压缩格式尚未成熟的情况下，作为印刷输出还嫌太早。但是後续发展潜力无穷，尤其在网路出版方面，其利用价值更高，WAVELET的出现就犹如当时的JPEG出现，在影像的领域中掀起一股旋风，但是WAVELET却有JPEG没有的优点，JPEG乃是失真压缩，且解码後复原程度有限，能在网路应用，乃是由於电脑的解析度并不需要太高，就可辨识其图形。而印刷所需的解析度却需一定的程度。WAVELET虽然也是失真压缩，但是解码後却可以还原资料到几乎完整还原，如此的压缩才有存在的价值。

有一点必须要提出的就是，并不是只要资料还原就可以用在印刷上，还需要有解读其档案的RIP，才能用於数位印刷上。等到WAVELET的应用成熟，再发展其适用的RIP，又是一段时间以後的事了。

在网路出版上已经有浏览器可以外挂读取WAVELET档案的软体了，不过还是测试版，可是以後会在网路上大量使用，应该是未来的趋势。对於网路出版应该是一阵不小的冲击。

图像压缩的好处是在於资料传输快速，减少网路的使用费用，增加企业的利润，由於传版的时间减少，也使印刷品在当地印刷的可能性增高，减少运费，减少开支，提高时效性，创造新的商机。

柒、结论

WAVELET的理论并不是相当完备，但是据现有的研究报告显现，到普及应用的阶段，还有一段距离。但小波分析在信号处理、影像处理、量子物理及非线性科学领域上，均有其应用价值。国内已有正式论文研究此一压缩模式。但有许多名词尚未有正式的翻译，各自有各自的翻译，故研究起来倍感辛苦。但相信不久即会有正式的定名出现。这也显示国内的研究速度，远落在外国的後面，国外已成立不少相关的网站，国内仅有少数的相关论文。如此一来国内要使这种压缩模式普及还有的等。正式使用於印刷业更是要相当时间。不过对於网路出版仍是有相当大的契机，国内仍是可以朝这一方面发展的。站在一个使用其成果的角度，印刷业界也许并不需要去了解其高深的数理理论。但是在运用上，为了要使用方便，和预估其发展趋势，影像压缩的基本概念却不能没有。本篇文章单纯的介绍其中的一种影像压缩模式，目的在为了使後进者有一参考的依据，也许在不久的将来此一模式会成为主流，到时才不会手足无措。

参考文献：

1.GeoffDavis，1997，WaveletImageCompressionConstructionKit，。

2.张维谷.小宇宙工作室，初版1994，影像档宝典.WINDOWS实作（上），峰资讯股份有限公司。

3.张维谷.小宇宙工作室，初版1994，影像档宝典.WINDOWS实作（下），峰资讯股份有限公司。

4.施威铭研究室，1994，PC影像处理技术（二）图档压缩续篇，旗标出版有限公司。

5.卢永成，民八十七年，使用小波转换及其在影像与视讯编码之应用，私立中原大学电机工程学系硕士学位论文。

6.江俊明，民八十六年，小波分析简介，私立淡江大学物理学系硕士论文。

7.曾泓瑜、陈曜州，民八十三年，最新数位讯号处理技术（语音、影像处理实务），全欣资讯图书。

附录：

嵌入式零元树小波转换、阶层式嵌入式零元树小波转换、阶层式影像传送及渐进式影像传送

目前网路最常用的静态影像压缩模式为JPEG格式或是GIF格式等。但是利用这些格式编码完成的影像，其资料量是不变的，其接受端必须完整地接受所有的资料量後才可以显示出编码端所传送的完整影像。这个现象最常发生在利用网路连结WWW网站时，我们常常都是先接收到文字後，其网页上的图形才，慢慢的一小部份一小部份显示出来，有时网路严重塞车，图形只显示一点点後就要再等非常久的时间才再有一点点显示出来，甚至可能断线了，使得使用者完全不知道在接收什麽图案的图形，无形中造成网路资源的浪费。此缺点之改善，可以使用嵌入式零元树小波转换(EZW)来完成。

阶层式影像传送系统的主要功能为允许不同规格之显示装置或解码器可以从同一编码器中获得符合其要求之讯号，如此不需要对於不同的解码器设计不同的编码器配合利用之，进而增加了其应用的范围，及减低了所架设系统的复杂度，也可以节省更多的设备费用。利用Shapiro所提出的嵌入式零元树小波转换(EZW)技术来设计阶层式影像传送系统时，其编码的效果不是很好。主要的原因是，利用(EZW)技术所设计的编码器是根据影像的全解析度来加以编码的，这使得拥有不同解析度与码率要求的解码器，无法同时分享由编码器所送出来的位元流。虽然可以利用同时播放(Simulcast)技术来加以克服之，但是该技术对於同一影像以不同解析度独立编码时，将使得共同的低通次频带(LowpassSubband)被重复的编码与传送，而产生了相当高的累赘(Redundancy)。

基於上述情况，有人将嵌入式零元树小波转换(EZW)技术加以修改之，完成了一个新式的阶层式影像传送系统。该技术为阶层式嵌入的零元树小波转换(LayeredEmbeddedZerotreeWavelet，简称LEZW技术。这个技术使我们所设计出来的阶层式影像传送系统，可以在编码传送前预先指定图层数目、每层影像的解析度与码率。

LEZW技术是将EZW技术中的连续近似量化(SAQ)加以延伸应用之，而EZW传统的做法是将SAQ应用於全部的小波转换系数上。然而在LEZW技术中，从基层(BaseLayer)开始SAQ一次仅用於一个图层(Layer)的编码，直到最高阶析度的图层为止。当编码的那一图层码率利用完时，即表示该图层编码完毕可以再往下一图层编码之。为了改善LEZW的效率，在较低图层的SAQ结果应用於较高图层的SAQ过程中，基於这种编码的程序，LEZW演算法则可以在每一图层平均码率的限制下，重建出不同解析度的影像。因此，LEZW非常适合用於设计阶层式影像传送系统。

LEZW技术也可以应用於渐进式传送，对於一个渐进式影像传送系统而言，控制其解析度将可以改善重建影像的视觉品质。而常用的渐进式传送方法有使用向量量化器或零元树资料结构编码演算法则。但是向量量化器需要较大的记忆体及对与传送中的错误敏威，而利用EZW技术所设计的渐进式影像传送系统，可以改善这些缺点，所以享有较好的效能。但是它也有缺点就是，应用於渐进式传送时是根据全解析度来做编码及传送，因此在低码率的限制之下时，若用全解析度来显示影像将使得影像模糊不清。所以在低码率传送时的影像以较低的解析度来显示时，则可以使影像的清晰度有所改善。

所以将LEZW技术延伸至渐进式传送，在编码之前可以先设定每一级(Stage)的解析度与传送每一级所累加的码率(AccumulatedRate)，然後再编码与传送之。该系统在低码率时用低解析度来显示影像，在较高码率时则以高解析度来显示影像，将改善渐进式传送的视觉品质。此系统在编码传送的过程中，允许传送的位元流在任一点位置被中断停止，而接收端可以由所接收到的资料，将影像重建在资料中断时的解析度下。

图像分析论文篇8

关键词：图像分割；广义模糊增强；模糊参数；二值化

中图分类号：TP273

在图像处理领域，图像分割技术占有重要地位，它是计算机视觉和图像理解的最基本问题。其分割结果关键性地决定了图像处理系统高层模块的性能，如对图像的分析、理解，识别等。所谓分割[1]就是按照一定的准则把图像分割成若干互不交叠的区域，被分割的区域应满足同质性和唯一性。分割算法的任务就是将图像划分为不同特性的区域，用所分割区域表示图像感兴趣的部分，为实现图像描述方法的转换和图像后续处理提供重要的依据。

在图像的实际成像过程中，由于各种因素的影响，如光照、反射、视角、噪声等，使得图像中各种景物之间存在着不确定性和不精确性（及模糊性）的问题，而不确定性又往往是由其模糊行引起的，这些都会造成图像质量下降的问题，为后续的图像分割工作带来相当大的干扰性。模糊集合理论[2]以其模糊逻辑推理方式，为不确定因素所造成的系统复杂性和决策过程的分析提供了有效手段，利用模糊集合理论处理因多灰度所造成的不确定性问题比用普通集合的思维更加合理。Pal[3][4]等人正是基于此认识，率先将模糊集合理论应用到图像增强处理上，目前在其基础上已经有了不少改进算法[5][6]。为了在分割过程之中避免各种因素对图像质量的影响，提高分割质量，减短分割时间，本文提出一种基于改进广义模糊增强的图像分割方法，并将其应用于多幅图像的分割中，实验表明，图像经过本文算法中的广义模糊增强后，不仅各区域之间层次更加清楚，而且各区域的对比度、边沿强度等也有显著提高，从而便于将图像中的目标和背景很好地分割开来。

1 Pal模糊增强算法及其缺陷

依照模糊集理论，一个灰度级为L的M×N的二维灰度图像，可以表示成一个模糊矩阵：

矩阵中每个元素Pij/xij表示图像中元素（i，j）的灰度xij相对于最大亮度L-1的亮度程度，由P={Pij}构成的平面称为图像模糊特征平面，文献[3]中Pij采用下式求解：

其中xmax为图像的最大灰度值，Fc和Fd为模糊特征参数，一般取Fc=2，称Pij=0.5时的灰度值为渡越点Xc。设定Fc和Xc，即可计算出Fd：

令T（xij=0）=α，则结合式（2）（3）可得：

取Fc=2时显然有α>0。

模糊增强的基本思想是对通过对Pij进行非线性变换，以渡越点为界增大或减小Pij的值，得到新的模糊特征平面P`={P`ij}，其中

n为迭代次数，一般迭代1～3次即可得到很好的增强效果。最后再对P`ij进行逆变换，即可获得原灰度图像X={xij}的模糊增强图像X`={x`ij}：

由上述分析可知α>0，经过式（5）变换后，会出现P`ij

2 广义模糊增强与二值化操作

2.1 基于改进广义模糊增强的图像分割算法

基于上述分析，给出本文的广义模糊增强算法流程图：

图1 广义模糊增强算法

为了克服以上分析的Pal算法的缺陷，本文采用正弦函数实现图像从空间的灰度值X={xij}到广义性质集P={Pij}的变换：

，（8）

其中D为模糊参数，对其取值规定如下：

（9）

其中xmax和xmin分别为图像的最大和最小灰度值。显然在式（9）的制约下，式（8）中的Pij∈[-1，1]，属于广义模糊集，实现了对普通模糊集的扩展，且其α

经过式（8）的操作后，下面需对Pij进行非线性变换，将广义性质集P={Pij}变换为普通性质集P`={P`ij}，式（5）的迭代方式不变，将式（6）中的变换F扩展如下：

可用图2中的曲线表示：

图2

由图2分析可知，F的作用是降低广义模糊集的模糊度，即通过增大-1≤Pij

然后，再进行从普通性质集P`={P`ij}到二维空间域的逆变换，即可获得原灰度图像X={xij}的模糊增强图像X`={x`ij}：

（11）

至此，得到的模糊增强图像，各区域之间层次更加清楚，且边缘两边的灰度对比度增强，边缘信息更加精细，可以选择基于区域的分割方法对模糊增强图像X`={x`ij}进行分割，得到二值图像。

2.2 模糊参数D的选择

由上一节中广义模糊增强算法介绍可见，模糊参数D值是一个待确定参数，以下就如何选择最优D进行研究。

对同一幅图像，随D值选择的不同将映射为不同的广义隶属度P={Pij}，因而会对不同的灰度区间做增强处理，得到不同的区域对比度，这将影响到后续的图像分割效果。通过大量的实验发现，模糊参数D的选择与图像本身存在着一定的关系，实验数据表明D与xmax+xmin存在一定的线性关系，基于式（9）中对D取值范围的限定，给出以下d取值公式：

，（12）

先预设b=0，对多幅遥感图像进行实验，经数值计算发现增强图的区域对比度和边缘能量随k取值的变化而变化总体变化趋势如下：

（1）就“对比度”而言：对于多幅实验图，各自的峰点对应的D值在（xmax+xmin）/20的范围内不尽相同，但在D=（xmax+xmin）/k0后各处增强所得的对比度的变化开始平稳且都比较大；

（2）就“边缘能量”而言：发现多幅实验图的峰点对应位置均为D=（xmax+xmin）/k0处；

（3）就“目视效果（区域对比度）”而言：取D=（xmax+xmin）/k0得到的模糊增强图有较好的区域对比度，表现为各区域内像素的灰度差异比较小（可以细微到2～3个灰度值）。

就以上分析，可将模糊参数D取值公式中的k取为k0，且可根据关系图中对比度值在D=（xmax+xmin）/k0后的附近范围之内有增长的趋势，将b取为-b0，其中b0∈[5，10]。

因为实验图像经模糊增强后区域内的灰度差异都可以细微到2～3个灰度值，所以本文可直接使用区域分割法中的灰度相似性“聚合法”对增强图像进行分割，且其中的灰度差异阈值可根据上述的分析设为2，这样可以解决该分割法中灰度差异阈值很难确定这一“瓶颈”问题，保证了算法的通用性。

3 实验结果及分析

在使用本文方法进行具体的二值化操作之前需要先进行D值的选择，图3和图4两幅图像的对比度和边缘能量随k值变化而变化的情况如图6所示，就图6进行分析可将k值取为3，b取为-5。将得到最优D值应用于本文的改进广义模糊增强算法中，对图像进行广义模糊增强，本文方法采取的迭代次数n为2，图5是图3的模糊增强图，可见得到的模糊增强图像具有很好的灰度层次和区域对比度等。

下面通过对图像进行分割实验，比较本文提出的方法与Otsu法以及FCM2D法的分割效果，对图3和4分别使用上述方法进行分割，分割的效果图如图7，8所示。由分割结果图可以直观看出，Otsu方法的分割目标的面积变化量最大，分割质量最差；FCM2D方法居中；本文方法最好，分割目标的面积变化量最小，很好地实现了背景与目标的分离。此外，三种方法的分割速度也有明显差别，具体数值见表1。以上操作是在Pentium4 2.2G兼容机下进行的，内存为256兆。

由表格可见，本文方法所用分割时间较其他两种方法短，证明本文方法在保证图像分割质量的基础上，在分割速度上也有很大的优势。

4 结论

本文分析了文献[3]中模糊增强算法中存在的问题，提出一种基于改进广义模糊增强算法的图像分割方法。算法弥补了文献[3]的缺陷，且就模糊参数的选择缺乏理论依据的问题进行数值分析，得出一个最优模糊参数，数值分析的结果同时可引导灰度相似性“聚合法”中灰度差异阈值的选择，很好地解决了灰度差异阈值很难选择这一“瓶颈”问题。从实验结果和数据分析可知，本文提出的方法较之Otsu法和FCM2D法，在分割速度和分割质量上都有很好保证，是一种非常有效的图像分割方法。

参考文献：

[1]夏德深，傅德胜.现代图像处理技术和应用.东南大学出版社，1997.

[2]L. A. Zadeh， Fuzzy Sets， Information and Control，1965，vol.8：338-353.

[3]Pal S K， King R A. Image Enhancement Using Fuzzy Sets. Electronics Letters， 1980， 16（10）：376-378.

[4]Pal S K， King R A. Image Enhancement Using Smoothing with Fuzzy Sets. IEEE Trans on Systems， Man， and Cybernetics， 1981， 11（7）：494～501.

[5]陈武凡.彩色图像边缘检测的新算法.中国科学（A辑），1995，25（2）：219-224.

[6]陈武凡，谢新鹏，洪文松.广义模糊集合论及其在图像处理中的新应用. 中国生物医学工程学报，1999，18（1）：66-73.

图像分析论文范文

图像分析论文篇1

图像分析论文篇2

图像分析论文篇3

图像分析论文篇4

图像分析论文篇5

图像分析论文篇6

图像分析论文篇7

图像分析论文篇8

热门文章更多>

热门推荐更多>

精品范文更多>

图像分析论文范文

图像分析论文篇1

图像分析论文篇2

图像分析论文篇3

图像分析论文篇4

图像分析论文篇5

图像分析论文篇6

图像分析论文篇7

图像分析论文篇8

热门文章 更多>

热门推荐 更多>

精品范文更多>

热门文章更多>

热门推荐更多>