频域变换的引入

时间:2022-08-01 11:33:57

摘要:数字信号的频域变换一直是教学中的难点,原因在于缺少必要的引入。本文给出了频域变换的引入方法,从学生熟知的笛卡尔坐标开始,经过以图示的方式给出的信号的合成与分解,逐步将学生引入到频域变换的公式、定理和性质上。实践证明,该引入方法符合学生的认知规律,显著提高了教学效果。

关键词:频域变换;限失真信源编码;信息论与编码理论;信息安全

中图分类号:G642 文献标识码:B

1引言

数字信号的频域变换(或者叫做时频变换),即时域数据与频域数据之间的相互转换,在信息安全专业的“信息论与编码”,计算机专业的“数字信号处理”、“数字图像处理”等课程中都涉及到了。这个概念是信息处理理论的基础概念,透彻理解该概念对于这些专业的学生,尤其是从事音频、视频、图像等多媒体数据处理的研究生来讲至关重要。

然而从作者求学的切身经历以及多年的教学经验,我们感到“频域变换”这个概念很难理解,学生掌握起来有一定困难。只有找到一个合适的切入点,将此概念与学生熟悉的知识联系起来,才能深入浅出,让学生轻松掌握。

2现有方法及其问题

现有讲解方法在介绍了时域离散信号、时域离散系统等概念之后,就开始讲频域变换。频域变换有很多种,一般从Z变换或者离散付里叶变换(Discrete Fourier Transform,DFT)讲起,讲解方法如下(以DFT为例):

设x(n)是一个长度为N的有限长序列,则定义x(n)的N点离散付里叶变换为

1) 理论性过强。无论是讲DFT的定义,还是DFT的性质、采样等内容,基本上是一个公式接着一个公式,而且公式还都比较复杂,缺少对公式必要的解释。这使得很多学生失去了学习兴趣,“看不懂”是学生的普遍反映。

2) 缺少必要的引入。一开始就是DFT的定义,那么这个定义是怎么来的呢?为什么会出现这样一个定义呢?公式中各个变量的作用是什么?有了这个公式有什么好处呢?它都在哪些地方发挥作用呢?等等一系列的问题都没有答案。而实际上,知道一个概念的来龙去脉对于理解该概念是大有好处的。

3频域变换的引入

由于现有的频域变换讲解方法存在一定的问题,因此有必要研究新的讲解方法,尤其是引入方法。从学生熟知的内容开始,先让学生有感性认识,然后逐步过渡到公式、定理和性质上,这样才是真正的深入浅出。作者在多年的教学过程中,总结了一套频域变换的引入方法,其过程是“笛卡儿坐标信号的合成与分解各种常用变换的公式、定理和性质”。

3.1笛卡尔坐标

笛卡儿坐标,这是一个在初中就学过的概念,任何一个学生对它都不会感到陌生。在这个简单概念中就蕴含了频域变换的基本特点。如图1所示,讲解时按如下步骤进行:

1) 坐标中的那个小黑点就是空域数据,之所以称为空域数据,是因为它是空间中的一个点。在信号处理领域时间和空间不严格区分,因此空域(空间域)数据和时域(时间域)数据两个名词经常混用。

2) x轴和y轴说白了就是空间中的两个向量,在频域变换中把它们叫做“基”,直观上这两个基互相垂直,频域变换中“垂直”叫做正交,因此x轴和y轴就组成了一组正交基。

3) 空间中的小黑点在x轴上的坐标为1,在y轴上的坐标为2,因此它的坐标为(1,2),这段话用频域变换的语言描述就是空域数据在基x上的系数为1,在基y上的系数为2,因此(1,2)就是频域数据。

图1笛卡尔坐标中的时频变换

这样,通过笛卡尔坐标这样一个简单的例子,使学生对频域变换中的空域(时域)、频域、基、正交、系数等概念有了初步的感性认识。

3.2信号的合成与分解

虽然学生已经有了对频域变换的初步认识,但这种认识建立在笛卡尔坐标之上,离信号处理领域有一定距离,如果此时直接开始讲各种常用变换的公式、定理和性质,学生难以将两者直接联系起来,会破坏学生刚刚建立起来的概念和兴趣,因此我们以图示的方式描述信号的合成与分解,作为频域变换的第二个引入。如图2所示,讲解时按如下步骤进行:

1)(a)~(d)表示的是四种信号(时域数据),横轴表示的是时间,纵轴表示的是信号的幅度(或者叫做强度)。

2)(a)表示的是一个幅度不随时间发生变化的信号,它的强度是5,像这样的幅度不随时间发生变化的信号叫做直流信号。

3)(b)表示的是信号5sin(x),(c)表示的信号是0.5sin(6x),这两个信号相比较来说:

 (b)变化的慢,是低频信号;(c)变化的快,是高频信号。

 (b)的幅度大(为5),表示该信号能量大;(c)的幅度小(为0.5),表示该信号能量小。

4)(d)是将(a)、(b)、(c)三个信号相加之后的信号,叫做(a)、(b)、(c)的合成信号,可以看到该信号的大体趋势与(b)信号相同,但是在细节上又不是很平滑,这是由(c)信号造成的,因此我们说低频分量表示的是信号的主体,而高频分量表示的是信号的细节。

5) 信号的合成讲完了,反过来考虑信号的分解,(d)信号可以被分解为5、5sin(x)、0.5sin(6x)三个信号,即它可以表示为5+5sin(x)+0.5sin(6x),这其实就是一个频域变换公式。其中的sin(x)和sin(6x)是一组正交基,之所以两者正交,是因为两者的内积为0,内积为0在笛卡尔坐标中的直观几何意义就是互相垂直。5sin(x)中的5是基sin(x)的系数,0.5sin(6x)中的0.5是基sin(6x)的系数。因此如(e)所示,(d)信号对应的频域数据就是(5,5,0.5),其中第一个5是直流分量。

6) 总结上述过程可以看到,所谓的频域变换,需要先确定一组正交基,然后将信号用这组正交基表示出来,直流分量和基的系数放在一起就是频域数据。选择的正交基不同,就产生了不同的频域变换。通常,由时域到频域的变换叫做频域变换,由频域到时域的变换叫做逆频域变换。

讲到这里,学生已经对信号的频域变换有了一个定性的基本认识,进一步了解了强度、直流、交流、高频、低频、能量、正交、变换、逆变换等概念,在此基础上就可以定量地讲解公式、定理和性质了。

4在限失真信源编码中的应用

限失真信源编码是“信息论和编码理论”中一个非常重要的内容,又叫做有损压缩,它指的是通过对信号进行编码来压缩信号的数据量,这种压缩会引起信号一定程度的失真,但是这种失真被控制在一定的范围之内。限失真信源编码应用范围非常广泛,尤其在多媒体编码领域,像常见的JPEG、MPEG等都属于限失真信源编码。有了前面的两个引入,再讲限失真信源编码原理就比较容易了,如图3所示。

图3限失真信源编码

接着“信号的合成与分解”中的信号(d),该信号经过频域变换之后的数据为(5,5,0.5),其中的0.5是高频分量的系数,前面已经讲过,高频分量仅影响信号的细节,因此可以将高频分量去掉而不影响信号的大体趋势,对应在这三个系数上就是保留前两个系数,丢弃高频系数0.5,这样(d)这样一个比较复杂的信号就被编码成了两个实数(5,5)。

由(5,5)经过逆变换得到被还原后的信号,可以看到被还原后的信号和编码之前的(d)信号大体趋势相同,但是被还原后的信号舍弃了细节。两者不同,说明编码过程有失真,但这种失真仅表现在细节上。

原理讲完之后,我们还讲了该原理在JPEG中的应用。数码相机拍摄的照片一般都是“.jpg”格式,该后缀表示采用了JPEG压缩标准来压缩照片的数据量。JPEG的基本原理与图3所示的过程基本相同,它采用的频域变换为离散余弦变换,根据人眼视觉特点舍弃频域系数中人眼感觉不到的系数,被保留下来的系数保存成“.jpg”文件,当我们看照片的时候,照片浏览器对“.jpg”文件进行译码,显示被还原后的信号。不过此时的信号与原始信号相比,质量已经降低了,不过人眼感觉不到这种差别。

5结束语

本文中提到的频域变换的引入是作者结合自己的科研经验,在教学过程中不断总结最终设计出来的。该引入一经在课堂上讲解,立刻引起了学生的兴趣,大家进行了热烈的讨论,并促使学生主动钻研课程内容,收到了很好的教学效果。

参考文献

[1] 姜楠. “信息论”课程本科教学探索与实践[J]. 计算机教育,2007,(24):52-54.

[2] 姜楠. 中美“信息论”课程教学的比较和启示[J]. 计算机教育,2008,(13):120-122,117.

上一篇:《主机银行业务应用案例分析》实践教学模式的... 下一篇:个体差异评价在武警本科课程“C程序设计”教学...