多媒体数据压缩技术

时间:2022-09-05 03:41:13

多媒体数据压缩技术

摘要:多媒体技术把电视式的视听信息传播能力与计算机交互控制功能相结合,使计算机多媒体化,具有数字化全运动、播放、编辑和创作多媒体信息功能。多媒体信息经数字化处理后的数据量非常大,如何在多媒体系统有效地保存和传送这些数据就成为多媒体系统面临的一个最基本的问题,也是最大的难题之一。多媒体数据压缩技术有效地解决这一问题。

关键词:数据压缩;JPEG;MPEG;H.261

中图分类号:TP311文献标识码:A 文章编号:1009-3044(2008)11-20332-02

1 引言

多媒体计算机的主要特性是能处理数字化的声音、图像以及视频信号。而数字化的声音、图像以及视频信号的数据量非常大,例如在VGA分辨率为640×480的256色彩色图像显示模式中,一帧画面所占的数据量约为300KB,如果采用NTSC制式标准视频30帧/S,则传输率约为26.4MB/S,一个双通道立体声激光唱盘(CD-A),采样频率为44.1kHz,采样精度为16位/样本,其1秒钟的音频数据量为1.41Mb。处理这样大的数据量单纯靠扩大存储容量、增加通讯干线的传输速率和数量是不现实的, 因此就出现了对多媒体信息数据进行压缩编码的技术。

2 多媒体数据压缩编码的必要性和可能性

2.1 多媒体数据压缩编码的必要性

由于媒体元素种类繁多,构成复杂,即数字计算机所要处理、传输和存储等对象为数值、文字、语言、音乐、图形、动画、静态图像和电视视频图像等多种媒体元素,并且使它们在模拟量和数字量之间进行自由转换,信息吞吐,存储和传输。数字化信息的数据量十分庞大,无疑给存储器的存储量、通信干线的信道传输率以及计算机的速度都增加了极大的压力。如果单纯靠扩大存储器容量,增加通信干线传输率的办法来解决问题是不现实的。通过数据压缩技术可以大大降低数据量,以压缩的形式存储和传输,既节约了存储空间,又提高了通信干线的传输效率,同时也使计算机得以实时处理音频、视频信息,保证播放出高质量的视频和音频节目。

2.2 多媒体数据压缩编码的可能性

数据中间常存在一些多余成分,既冗余度。如在一份计算机文件中,某些符号会重复出现、某些符号比其他符号出现得更频繁、某些字符总是在各数据块中可预见的位置上出现等,这些冗余部分便可在数据编码中除去或减少。冗余度压缩是一个可逆过程,因此叫做无失真压缩,或称保持型编码。 数据中间尤其是相邻的数据之间,常存在着相关性。如图片中常常有色彩均匀的背影,电视信号的相邻两帧之间可能只有少量的变化影物是不同的,声音信号有时具有一定的规律性和周期性等等。因此,有可能利用某些变换来尽可能地去掉这些相关性。但这种变换有时会带来不可恢复的损失和误差,因此叫做不可逆压缩,或称有失真编码、摘压缩等。 此外,人们在欣赏音像节目时,由于耳、目对信号的时间变化和幅度变化的感受能力都有一定的极限,如人眼对影视节目有视觉暂留效应,故可将信号中感觉不出的分量压缩掉或“掩蔽掉”。数据冗余主要有时间冗余、空间冗余、结构冗余、知识冗余、视觉冗余、图像区域的相同性冗余、纹理的统计冗余等。由于数据冗余的存在,在对多媒体数据进行编码时,可以将冗余信息去掉,保留相互独立的信息分量,使得数据压缩编码成为可能。

3 多媒体数据压缩编码技术的分类

多媒体数据压缩方法根据不同的依据可产生不同的分类。

第一种分类方法是根据解码后数据是否能够完全无丢失地恢复原始数据,可分为无损压缩和有损压缩两种。(1)无损压缩,也称为可逆压缩、无失真编码等。工作原理为去除或减少冗余值,但这些被去除或减少的冗余值可以在解压缩时重新插入到数据中以恢复原始数据。典型算法有哈夫曼编码、香农-费诺编码、算术编码、游程编码等。(2)有损压缩,也称不可逆压缩。这种方法在压缩时减少了的数据信息是不能恢复的。在语音、图像和动态视频的压缩中,经常采用这类方法。它对自然景物的彩色图像压缩,压缩比可达到几十倍甚至上百倍。

第二种分类方法是按具体编码算法来分,可分为预测编码、变换编码和统计编码三种。(1)预测编码(Predictive Coding)这种编码器记录与传输的不是样本的真实值,而是真实值与预测值之差。预测值由预编码图像信号的过去信息决定。由于时间、空间相关性,真实值与预测值的差值变化范围远远小于真实值的变化范围,因而可以采用较少的位数来表示。 (2)变换编码(Transform Coding)在变换编码中,由于对整幅图像进行变换的计算量太大,所以一般把原始图像分成许多个矩形区域,即子图像。对子图像独立进行变换。变换编码的主要思想是利用图像块内像素值之间的相关性,把图像变换到一组新的“基”上,使得能量集中到少数几个变换系数上,通过存储这些系数而达到压缩的目的。(3)统计编码。最常用的统计编码是哈夫曼编码,出现频率大的符号用较少的位数表示,而出现频率小的符号则用较多位数表示,编码效率主要取决于需要编码的符号出现的概率分布,越集中则压缩比越高。哈夫曼编码是一种无损压缩技术,在语音和图像编码中常常和其他方法结合使用。

4 多媒体数据压缩编码的技术标准

目前,国际广泛认可和应用的通用数据压缩编码标准主要有: JPEG、H.261、MPEG和DVI。

(1)JPEG标准

JPEG是一种基于DCT的静止图像压缩和解压缩算法,它由国际标准化组织(ISO)和CCITT共同制定。它是把冗长的图像信号和其它类型的静止图像去掉,甚至可以减小到原图像的百分之一。JPEG压缩是有损压缩,它利用了人的视觉系统的特性,去掉了视觉冗余信息和数据本身的冗余信息。在压缩比为25:1的情况下,压缩后的图像与原始图像相比较,非图像专家难辨“真伪”。

(2)H.261标准

H.261由国际电报电话咨询委员会(CCITT)通过的用于音频视频服务的视频编码解码器标准(也称为Px64标准),它主要使用两种类型的压缩:帧中的有损压缩(基于DCT)和帧间的无损压缩编码,并在此基础上使编码器采用带有运动估计的DCT和DPCM的混合方式。H.261与JPEG及MPEG标准间具有明显的相似性,但关键区别是它是为动态使用设计的,并提供完全包含的组织和高水平的交互控制。

(3)MPEG标准

MPEG实际上是指一组由ITU和ISO制定的视频、音频、数据的压缩标准。它采用的是一种减少图像冗余信息的压缩算法,提供的压缩比可以高达200:1,同时,图像和音响的质量也非常高。MPEG版本主要有MPEG-1、MPEG-2、MPEG-3、MPEG-4和MPEG-7。

MPEG-1标准制定于1992年,是针对1.5Mbps以下数据传输率的数字存储媒体运动图像及其伴音编码设计的国际标准。同时,它还被用于数字电话网络上的视频传输,如非对称数字用户线路(ADSL)、视频点播(VOD)、教育网络等。

MPEG-2标准制定于1994年,是针对3~10Mbps的数据传输率制定的运动图像及其伴音编码的国际标准。它广泛用于数字电视及数字声音广播、数字图像与声音信号的传输、多媒体等领域。

MPEG-3最初为HDTV(高清晰电视广播)制定的编码和压缩标准,但由于MPEG-2的出色性能已能适用于HDTV,因此MPEG-3标准并未制定。

MPEG-4于1998年11月公布,它主要针对一定比特率下的视频、音频编码,更加注重多媒体系统的交互性和灵活性。

MPEG-7的应用范围很广泛,既可应用于存储,也可用于流式应用。未来它将会在教育、新闻、导游信息、娱乐、等各方面发挥巨大的作用。

(4) DVI标准

DVI视频图像压缩算法的性能与MPEG-1相当,即图像质量可达到VHS的水平,压缩后的图像数据率约为1.5Mb/s。为了扩大DVI技术的应用,Intel公司后来又推出了DVI算法的软件解码算法,称为Indeo技术,它能将为压缩的数字视频文件压缩为五分之一到十分之一。

5 结语

多媒体计算机技术、计算机网络技术以及现代多媒体通信技术正在向着信息化、高速化、智能化迅速发展。随着各个领域的应用与发展,各个系统的数据量越来越大,给数据的存储、传输以及有效、快速获取信息带来了严重的障碍。数据压缩的概念数据压缩就是用最少的数码来表示信号,以便能较快地传输各种信号,用现有的通信干线并行开通更多的多媒体业务,因此多媒体数据压缩技术成为解决这一问题的关键技术,越来越引起人们的重视。

参考文献:

[1] 沈丰.浅谈多媒体数据压缩技术[J].长江科学院院报,1999(05).

[2] 彭波,韦岗.多媒体技术MPEG系列标准新进展[J].广东通信技术,2000(09).

[3] 丁贵广,郭宝龙.多媒体数据压缩标准化的现状与发展[J].计算机工程与应用,2002(01):104-107.

[4] 于翔.数据压缩技术分析[J].青海大学学报(自然科学版),2002(05):55-57.

上一篇:多Agent系统的研究 下一篇:WMI在计算机管理中的应用研究