多媒体压缩技术

时间:2022-09-10 10:30:19

多媒体压缩技术

摘要:数字化的多媒体数据的存储空间越来越大,给数据的保存和传送带来了困难。本文通过对多媒体数据压缩方法的分类、标准的介绍,说明各种多媒体数据压缩方法的应用范围,为多媒体数据的使用者提供一定借鉴。

关键词:多媒体;压缩技术;数据存储

多媒体是先进的计算机技术和视频、音频、通信等技术集成的产物。多媒体信息主要包括图像、声音、文本三大类。其中视频、音频等信号的信息量是非常大的。例如,NTSC图像以640×480 PPI、24bits/Pixel、每秒30帧的质量传输时,其数据率达28M字节/秒或221M位/秒。以这个速率保存15秒未压缩视频图像将占用420M字节的存储空间,显然一般台式计算机接受是有困难的。另一个原因是图像,音频和视频这些媒体具有很大的压缩潜力。因为在多媒体数据中,存在着空间冗余,时间冗余,结构冗余,知识冗余,视觉冗余,图像区域的相同性冗余,纹理的统计冗余等。它们为数据压缩技术的应用提供了可能的条件。因此在多媒体系统中必须采用数据压缩技术,它是多媒体技术中一项十分关键的技术。

一、多媒体数据压缩标准――无失真压缩方法

无失真压缩技术由于大原理上大多采用概率统计编码,因而一般对在内容上重复较多的文件压缩倍数比较大,而对没有重复或重复较小的文件则压缩倍数就较低。压缩技术分为无失真压缩和有失真压缩两种。无失真压缩就是压缩后再还原出来的数据同没有压缩的原始数据一样,不存在任何误差。常见的压缩软件有zip,Gzip等。平均压缩比一般在两倍左右,如典型的Double Space技术,对硬盘内各类数据及文件的压缩比约为两倍。目前在无失真压缩中压缩效果较好的当属算术编码,常用的算法有预测编码,矢量量化技术、Huffman编码,算术编码等等。有失真压缩后再还原出来的数据和没有压缩的原始数据间相比存在一定的误差。由于允许有一定误差,因而这类技术常常可以取得较大的压缩比。

二、视频图像的压缩编码标准

我们常用的多媒体数据压缩标准中采用较多的MPEG系列。视频图像的压缩编码方法MPEG具有高度的压缩比并保持高质量,它有4个版本。其中前两个版本MPEG-1和MPEG-2应用比较广泛,MPEG-4已推出几年,但近年来才活跃起来,MPEG-7则是更先进的下一个版本,它是一个多媒体内容描述接口。

MPEG-1标准(ISO/IEC111172)1992年制定,是针对1.5Mbps以下数据传输率的数字存储媒体运动图像及其音频码设计的国际标准,主要用于在CD―ROM(包括video-CD、CD-I等)存储彩色的同步运动视频图像,它针对SIF(标准交换格式)帧大小:NTSC制为352×240 PPI;PAL制为352×288 PPI。帧速率:对于NTSC制为29.97fps,PAL为25fps。视频数据速率:1150kbps。帧类型:基于帧。音频设置:立体声,224kbps位速率;44100HZ频率。每秒可播放30帧画面,具备CD音质。常用于用于数字电话网络上的视频传输,如非对称数字用户线路、视频点播、教育网络等。

VCD是一个特殊的CD―ROM格式,它包含一个特殊的MPEG-1格式的视频文件,并且该文件完全符合白皮书的规格,因此使用MPEG-1的压缩算法,可以将一部120min长的电影压缩到1.2GB左右。所以它被广泛地运用到VCD制作和一些视频片段的下载,目前绝大多数VCD都是用MPEG-1格式进行压缩的。

MPEG-2标准ISO/IEC13818,制定于1994年,设计目标是高级工业标准的图像质量以及更高的传输率。是针对3~10Mbps的数据传输率制定的运动图像及其音频编码的国际标准。较新的MPEG-2版本,已用于卫星数码电视和DVD光盘,提供了更大的灵活性和更高的质量,其在NTSC制式下的分辨率可达720×486,PAL制式中可达720×576。视频数据速度6000kbps。Lpcm音频,48000HZ,立体声。能够在MPEG-1兼容的基础上实现了低码率和多声道扩展:MPEG-2可以将一部120min长的电影压缩到4―8GB、音频编码为我们提供了左、右、中及两个环绕声道,一个加重低音声道及多达7个伴音声道。因此它提供的就是平常我们所说的高品质的DVD品质,它可用于8种语言进行配音。由于MPEG-2在设计时的巧妙处理,使得MPEG-2解码器也可播放MPEG-1格式的数据,目前市场上浒的VCD、CD、也适用于HDTV,使得原HDTV设计的MPEG-3还没来得及投放市场就已抛弃了,它传输的视频图像出现轻度扭曲,而MPEG-3设计的传输速率是在20Mbits/sev~40Mbits/sec之间。目前在网络上广泛应用的音乐格式MP3并不是MPEG-3而是MPEG-1的第三层。

三、多媒体应用的带宽和数字影像质量要求

由于MPEG-2改变压缩比有一个较宽的范围的特点,为适应不同的带宽要求,画面的质量高低以及存储容量的要求,除了作为DVD的指定指标外,MPEG-2目前还广泛用于广播、有线电视网、电缆网络等,并提供了广播级别的数字视频,特别是目前高清晰度画面质量的数码电视投放市场,对于普通用户来说都能得到高品质的DVD画面和加重低音、多伴音声道的广泛应用。

MPEG-4于1998年11月公布,而人们是1999年在计算机多媒体应用方面才接触到的。视频编码与音频编码类似,也支持对自然和合成的视觉对象的编码,合成的视觉对象包括2D、3D动画和人面部表情动画等,同时为我们提供了丰富的AV场景。它主要解决交互网络中广播环境下以及磁盘应用中、多媒体应用的操作问题,通过传输多路合成比特信息来建立客户端和服务器端的交互和传输。MPEG-4它不仅支持自然声音,也支持合成声音。将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。

MPEG-4的出现对于数字电视、动态图像、万维网、实时多媒体监控、低比特率下的移动多媒体通信、DVD上的交互多媒体应用、计算机网络的可视化合作实验场景应用、演播电视等都产生较大的推动作用。

MPEG-1、MPEG-2、MPEG-4适用于不同带宽和数字影像质量的要求,优于其它压缩/解压缩方案。它是按国际化标准来研究制定,具有很好的兼容性。这对于多媒体数据库和Internet多媒体应用的发展是至关重要的。它的压缩比最高可以200:1,而且对数据的损失很小。其后继的MPEG-7则是基于内容的描述。它不是一种压缩算法的标准,而是一种面向内容的描述语言和格式的标准。其应用领域十分广泛。最重要的一点是,有了基于内容的描述之后,我们就可以对多媒体信息进行分类、检索、识别和加工制作。

参考文献:

[1]《多媒体技术指南》[M].北京,电子工业园出版社

[2]《多媒体计算机技术》[M].北京,清华大学出版社

[3]《多媒体技术应用基础》[M].西安电子科技大学出版社

[4]陈维亮.视频监控系统中运动检测算法与MPEG-4速率控制的研究[D].北京邮电大学.2003

上一篇:刍议网络侵权问题 下一篇:坚持远见 整体规划