音频信息处理技术

时间：2022-08-11 06:35:00

音频信息处理技术

摘要本文对模拟音频和数字音频、数字音频重要要素分析、数字音频文件的种类、音频卡的使用功能和主要类型、音量正确调整方法及录音、播放设备的选择进行的概括性的分析。

关键词音频信息技术；模拟音频；波形曲线

中图分类号TP391 文献标识码 A 文章编号 1674-6708（2013）90-0012-02

1概念

1）模拟音频和数字音频

（1）模拟音频：声音是由物体的震动产生的。物体的震动引起空气的相应运动，并向四周传播，当传到人耳时又引起耳膜的震动，通过听觉神经传到大脑，人们便可以感觉到声音的存在。由于声音具有振动性，因此当声音经过话筒的转换后，便会使电信号形成，这种形成的电信号被称为模拟音频信号，以磁的形式存储在磁带中；

（2）数字音频：数字音频是由许多0和1组成的二进制数，在磁盘中以声音文件的格式存在着，MmI和WAV是声音文件的两种格式。举例来说，在对音频的AD转换器使用过程中，经过采样、量化处理模拟音频信息后，与之相对应的各种数字音频信号便可很容易的获得。

2）数字音频重要要素分析

数字音频质量与其3个重要要素之间有着密切的联系。其3个重要要素的含义概括如下：

（1）对采样频率的概括：模拟音频到数字音频的转化过程就是采样，其实质就是在时间轴上对声音振动产生的波形曲线进行间隔性的取值。（图1 所示内容）。频率采样的单位为比，是每秒钟对声音波形振动次数的抽取。因此得知，采样频率值越高，对数字音频的音质和声音的保真度就越有提高，但同时增大了生成声音文件的字节数。我国现阶段采样频率的标准值有44.1kHz、11.025kHz；

（2）对量化数位的概括：在模拟音频到数字音频的转换过程中，量化位数就是采样数值的二进制位数。举例来说，当选用的量化位数是16时，对采样数据的表示可以是216=65536个中的任何一个二进制数。数字音频的音质会随着量化位数的增大而越来越好，且声音振动的动态范围也会随之增大。但同时也增大了生成声音文件的字节数。在对声音的动态范围进行定义时是这样进行的，即重放后声音的最高值减去声音的最低值后得到的差值。32位、8位和16位等的量化位数是目前最普遍采用的；

（3）对声道数的概括：对使用的声音通道个数进行统计的数据叫做声道数。一般的，声音的通道个数为1或者2，。这就是说当声音的通道个数是1时，往往是对声音一路波形的表示，说明是单声道。同时，当声音的通道个数为2时，往往是对声音两路波形的表示，说明是双声道。相对来说双声道的音质更好，声音更加优美动听，声音立体感效果很明显。但同时增大了生成声音文件的字节数。

上述的3个重要要素对数字音频的质量都有着很大的影响，同时也是数字音频数据量生成的决定因素。数字音频数文件据量生成的计算公式，对于WAV格式来说就是：声音文件字节数等于上述3个重要要素之积除以8。其中量化位数、采样频率的单位分别为位和Hz。“除以8”中的8表示的是字节。举例分析，对一般的模拟音频信号采样过程中，我们选用的采样频率和量化位数分别为44.1kHz和32，经过双声道4秒钟的录制后，WAV格式中声音文件的字节数=（44100×32×2×4）/8=1411200。

2数字音频文件的种类

数字音频文件的种类很多，有WAV波形、MIDI、MP3、VOC、VOX、PCM、AIFF、MOD和CD唱片等数字音频文件。在多媒体应用中数字音频文件主要有下述几种类型。

1）对WAV波形的数字奇频文件描述

WAV波形的数字奇频文件作为一种标准数字音频文件，在windows中使用中以“wav”为其扩展名。由于该种音频文件较大，因此在实际使用中，常常需要将它进行压缩使用。例如，在Auhorware多媒体设计软件中，可将WAV波形数字音频文件转换为扩展名为“.swa”的数字音频压缩文件，然后再使用。

实际使用中，常常需要将它进行压缩使用。例如，在Auhorware多媒体设计软件中，可将WAV波形数字音频文件转换为扩展名为“.swa”的数字音频压缩文件，然后再使用。

2）对MIDI音频文件的简单描述

MIDI采用合成声音技术。常见的合成声音技术有调频FM技术和波表技术。调频FM技术利用两个或多个正弦声波模拟合成各种自然声音；波表技术是预先将各种自然声音（主要是乐器的声音）录制下来，并存储在音频卡的存储器当中。MIDI音乐的播放有两种方法：一种是采用电子音乐设备，另一种是由应用音箱进行声音的播放。

3）MP3数字音频文件

MP3是MPEGLayer3的简称，它是经过高压缩比（可达12：1）压缩后的数字音频文件。

MP3数字音频的音质与高保真的CD音乐的音质相差很小，这是因为MP3数字音频文件经过高压缩比后MP3数字音频文在格放时需要经过解压缩运算，所以为了达到好的播放效果，对计算机的配置要求比较高，不过目前购置的计算机一般都可以满足上述中有关制作和播放的要求。

3音频卡

3.1音频卡的使用功能和主要类型

1）录制声音：外部声源发出的声音可以通过话筒或线路送到声卡中；

2）声音文件的播放：播放声音文件时，调出声音文件，将它进行解压缩，再经过D/A转换器（数字到模拟的转换器）进行转换，获得模拟声音信号。然后，经过放大，由音频卡输出，再经过外接的功率放大器放大，推动喇叭发出声音；

3）播放CD光盘：音频卡可与CD-ROM光盘驱动器相连，可像CD机那样播放CD光盘中的歌曲；

4）编辑与合成处理：可以对声音文件进行多种特殊效果的处理。例如：增加回音、倒波声音、淡入淡出、交换声道、声音移位（从左到右或从右到左）等；

5）控制MIDI电子乐器：计算机可以通过声卡对MIDI接口的多种电子乐器进行控制；

6）语音识别功能的运用；一般的，较高级的设备中都会有语音识别功能。音频卡的分类主要是根据其采样的量化位数大小。常见的有8位、16位和32位声卡。

3.2音频卡与外部设备的连接

音频卡与外部设备的连接如图2所示。

连接方法如下：

1）U CD―ROM接口用来连接CD―ROM光盘驱动器；

2）线路输入插孔用来连接具有线路输出的音频设备；

3）话筒输入插孔用来连接话筒；

4）线路输出插孔用来连接具有线路输入的音频设备。例如：CD机和录音机等；

5）喇叭输出插孔用来连接耳机成具有功串放大电路的音箱。游戏杆/MIDI接口用来连接游戏杆或删电子音乐设备。也可使用删套件，同时连接游戏杆和MIDI电子音乐设备。

1）音量正确调整方法及录音、播放设备的选择

（1）设置音乐属性时，找到录音机调板上的菜单选项 “音频属性”带到对话框出现时，便可在对话框中进行设置；

（2）麦克音量设置：找出“录音”栏内的“音量”并单击，设备中会调出“捕获”的对话框，如图3所示。用鼠标拖曳滑块，可以调整各种音量和左右声道音量的均衡。如果要调整其他音量，可以单击“声音属性”对话框内的其他栏中的“音量”按钮，调出“音量控制”对话框。利用该对话框，设置麦克音量；

（3）对录音、播放设备的选择：首先要确认所选设备的名称。用上述方法调出对话框之后，对声音对象进行选择。之后按动“立即转换按钮”使其出现“声音选定”的对话框。在“声音选定”对话框中的“名称”下拉列表框内对已有设置进行选择。

2）对多音的料故的处理

（1）音量加大时在菜单选项中按25%；

（2）音星降低时单击“效果”一“菜单；

（3）提高声音的播放速度时在菜单选项按“加速（too%）”；

（4）降低声音的播放速度时在菜单选项按“减速”选项；

（5）在进行回音添加时单击“添加回音”选项即可；

（6）翻转播放声音；单击“效果”一“反转”菜单选项。

参考文献

[1]涂悦.基于内容的音频分类技术及其在多媒体检索中的应用[D].华南理工大学，2012.

[2]黄千.基于支持向量机的音频分类技术研究与应用[D].北京邮电大学，2010.

音频信息处理技术

文档上传者

热门标签更多>

热门推荐更多>

精品范文更多>

音频信息处理技术

文档上传者

热门标签 更多>

热门推荐 更多>

精品范文更多>

热门标签更多>

热门推荐更多>