走进数字AV压缩技术(上)

时间:2022-06-22 05:36:27

走进数字AV压缩技术(上)

近20多年来,数字技术迅猛发展,并在音频(Audio)和视频(Video)领域都得到了极大的应用,我们的生活得益于此也更加丰富多彩起来。相对于模拟信号而言,数字信号具有抗干扰能力更强、成本更低、并易于集成、利于传输和便于多路复用等优势。采用数字技术编码的音/视频(简称AV)信号可有效避免误码情况出现,可以说数字化技术使得AV信号处理达到了模拟方式所无法企及的程度。不过数字化的优势虽然是显而易见的,但它也有自身相应的缺点,即对存储容量需求的增加及对传输时信道容量要求的增加。一般来说,制作标准数字化AV信号会产生大量的数据,这就意味着系统的存储能力和传送带宽必须得到扩展。由此人们可以清楚地得出一个结论,即只有降低对存储和带宽的要求,数字AV技术才能更加进一步的发展,而这正是AV压缩技术的目的所在。

传统的AV压缩技术是建立在香侬理论的基础上的。简单解释一下的话,首先我们要将AV信号分成必需的部分和不必需的部分。其中必需的部分即是AV信号中的真实而有用的信息,而不必需的部分就是数据冗余(Data Redundancy)。按照传统的香侬理论,AV数据之所以可以被压缩就是因为其中有数据冗余存在,压缩系统就是要将AV信号的必要部分从冗余中分离出来。而新型的AV压缩技术则突破了香侬理论的框架束缚,在充分考虑人类听/视觉生理特性及信源特性的前提下,不仅去除数据冗余,更通过去除内容冗余(Content Redundancy)来实现压缩。新型的AV压缩技术主要有以下的优点:

需要较小的存储量;

降低了所需的带宽;

允许在介质之间实现比实时更快的传送;

压缩录制格式只需较低的录制密度,从而降低了录制设备对环境因素和维护的敏感性。

音频压缩技术

为了充分了解AV压缩技术,我们首先从音频压缩方面开始讨论。音频压缩技术指的是对原始的数字音频信号经过适当的信号编码处理,来达到压缩的目的,它必须具有相应的逆变换,即解压缩或译码。数字音频压缩技术在目前各种音乐供应或传送体系中,都扮演着极其重要的角色,像我们日常熟知并广泛接触的CD、VCD、DVD等音乐光盘,互联网络、有线电视、卫星电视等网络媒体。在所有这些不同的领域中,我们都发现音频压缩技术已演变为一种流行,甚至是强制性的技术需求。随着音频市场持续地迅速发展,不断涌现出各种各样新型的压缩技术和标准,可以说我们已经进入了新的数字音频时代。

一般来讲,可以将音频压缩技术分为无损压缩及有损压缩两大类。对于无损编码来说,我们主要着重讨论其压缩率,而对于有损压缩来说,我们除了考虑压缩率以外还要考虑其质量,也就是其音质的具体情况。当然,按照压缩方案的不同,音频压缩技术还可以划分为时域压缩、变换压缩、子带压缩,以及多种技术相互融合的混合压缩等等。各种不同的压缩技术,其算法的复杂程度、音频的质量、压缩率,以及时延等都有很大的不同。为了让大家更容易接受,我们这里就不再对下面具体的压缩方案进行详细分类,而是采用我们比较熟悉的名称来简要介绍一下即可。

1、PCM编码

PCM(脉冲编码调制)最早是由一位名叫Alec Reeres的法国工程师Alec Reeres于1937年提出来的。1946年的时候,大名鼎鼎的Bell实验室根据其原理实现了第一台PCM数字电话机。而到了20世纪70年代后期,超大规模集成电路的PCM编码器、译码器的出现,使PCM在卫星通信、数字微波通信、甚至光纤通信中都获得了广泛的应用。因此PCM已经成为数字通信中一个十分基础的编码技术。

PCM编码的最大的优点就是音质好。我们最常见的CD就大多都采用了PCM编码,一张CD光盘的容量最多也就只能容纳72分钟的音乐信息。PCM编码主要包括采样、量化和编码三个过程。采样就是把连续的模拟信号转换成离散的数字信号。从上面的原理图中,我们很明显就可以看出,在一秒中之内抽采样的点越多,获取的声音频率信息就更丰富。按照采样定理,为了复原波形,在声波一次的振动中,必须有2个以上的采样点,换句话说就是采样频率必须大于或等于信号频率的两倍。那么,我们可以简单计算一下,人耳能够感觉到的最高频率为20kHz,因此要满足我们耳朵的听觉要求,采样率至少是40kHz,即每秒钟对信号进行40000次采样。一般我们常见的CD,它们的采样率大多为44.1kHz。

光有频率信息还不够,在PCM编码中我们还必须获得该频率的能量值并量化,以用来表示音频信号的强度。采样信号只表示了原始模拟信号在离散时间内某个点上的值,量化则是要把这些采样信号再进一步转换成真正的数字信号。而所谓的采样大小就是说要用多少bit的二进制数对采样信号值进行标识,量化电平数为2的整数次幂。这个概念比采样率要更难理解一些,因为比较抽象,举个简单的例子吧:假设对一个信号进行8次采样,各采样点对应的能量值分别为A1~A8,一共有八个,但我们如果只使用2bit的采样大小,那么我们就只能保留A1-A8中4个点的值而舍弃另外4个;如果我们进行3bit的采样大小,则刚好记录下8个点的所有信息。我们常见的CD,其采样大小通常为16bit,即可以有2的16次方(等于65536)个不同的采样值。采样率和采样大小的值越大,记录的波形更接近原始信号。而编码过程就是对量化后的信号再进行编码从而形成一个二进制码组来输出。举例来说,2bit的采样大小只包括了00、01、10和11这四个二进制码组,能表示4种不同的采样值;如果采样大小是3bit,则包括了000、001、010、011、100、101、110、111这8个二进制码组,这样就可以表示8种不同的采样值。

相对自然界的音频信号,音频编码技术最多只能做到无限接近,严格地讲,任何数字音频编码方案都是有损编码,因为无法完全还原。在实际应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,比如CD、DVD以及我们常见的WAV文件,所以在目前所有的随身播放设备中,CD机仍然是音质最好的。因此,我们将PCM约定俗成了无损编码,因为它代表了数字音频中最佳的保真水平,但这并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。

(未完待续)

上一篇:卫星电视接收技术小测试 下一篇:英国数字电视普及率呈现上升趋势