用于麦克风阵列的球面谐波分解

时间:2022-07-21 10:05:26

摘要:随着麦克风阵列在室内声场分析、声场再现、语音通信中的广泛应用,球面谐波分解在阵列信号处理中的地位变得更加重要。针对球面阵列的球面谐波分解是近年发展起来的波束形成新技术,它还可以扩展到线阵和环形阵等其它阵形中。从球面傅里叶变换着手,在球面谐波域内对不同条件下波束形成算法的原理、性能及其在阵列信号处理中可能的应用进行了全面的综述。

关键词:麦克风阵列;球面谐波;波束形成; 波达方向估计

中图分类号:TP319文献标识码:A文章编号:1672-7800(2013)006-0130-04

作者简介:顾小路(1989-),男,山东大学(威海)机电与信息工程学院硕士研究生,研究方向为麦克风阵列信号处理、波束形成;刘若伦(1971-),男,博士,山东大学(威海)机电与信息工程学院副教授,研究方向为音频信号处理、阵列信号处理。

0引言

球面谐波是波动方程在球坐标系下的解中关于角度的函数,它是球面傅里叶变换的基函数,不同阶次的谐波之间相互正交。球面谐波分解在麦克风阵列处理中的应用是基于入射声场的传播与散射,由傅里叶声学原理[1]提出的,这类方法也称为球面谐波域阵列处理。基于球面谐波分解的波束形成就是首先通过球面傅里叶变换将入射信号的声压变换到球面谐波域内,然后对各阶次的谐波进行加权求和得到整个阵列的输出。

Meyer和Elko[2]通过对声场进行球面谐波分解,得到一种简单、灵活、有效的波束形成器结构,输出波束的形状并不会随着方向的改变而变化。Abhayapala和Ward[3]将类似的阵列应用到高阶声场录音和重构中。Abhayapala[4]还将3D球面阵的分解方法扩展到环形阵中,进一步扩展了球面谐波在不同阵形中的应用范围。随着研究的深入,学者们对球面谐波的提取及球面谐波域波束形成进行了更详细的阐述,提出了许多有效的算法。Rafely[5]曾针对远场窄带情况对球面阵的采样和波束形成进行了总结。

本文结合新近出现的算法,从球面谐波的分解原理和提取方法出发,按照空间域波束形成的分类方法[6],对球面远场窄带波束形成进行分类,并总结了针对近场源和宽带信号提出的新算法。同时也对比分析了球面谐波域中不同阵形波束形成算法的原理和性能,及其在麦克风阵列信号处理中的可能应用,以方便那些从事麦克风阵列应用研究的读者。

1基础理论

球面傅里叶变换是整个算法的基础,它实现了信号从阵元域到球面谐波域的变换,在实际工程应用中,通常利用采样的离散变换来代替连续的变换。本部分将对球面傅里叶变换和空间采样的规则进行介绍。

1.1球面傅里叶变换

1.2空间采样

此外,Vicente[9]提出了两种新的采样方法,将阵元分布在不同的圆环上,每个环可以构成一个子阵,并将圆环按照纬度排列。在保证满足奈奎斯特定理的前提下,增加阵元之间的距离,从而减少阵元的数目。新的方法能够保持较高的方向性和波束响应的对称性。

2球面阵波束形成

2.1远场窄带波束形成

根据Van Veen和Buckly对传统波束形成的分类方法[6],我们将球面阵远场窄带波束形成也分为三大类:固定波束形成、统计最优波束形成和多约束的最优波束形成。

2.1.1固定波束形成

2.1.2统计最优波束形成

在球面谐波域内,统计最优波束形成与空间域类似,权值依赖于阵列接收数据的统计特性。其实,阵列的输出不仅可以表示成球面谐波域的采样结果,也可以直接在空间域中表示,具有类似的表达形式。如式(6)所示。

因此,可以将空间域中的统计最优算法扩展到球面谐波域中使用,例如,MVDR、LCMV、GSC等经典算法,并且在球面谐波域中可以减少运算量,提高运行效率[10]。

2.1.3多约束最优波束形成

多约束最优波束形成是指在保证期望波束的同时,可以对其它方向的信号或者相关的性能指标进行约束,最后得到一个最优化的权值,达到对波束进行优化的目的。

Li和Duraswami[11]、Meyer和Elko[12]提出了权值优化的球面波束形成算法,引入白噪声增益作为性能约束条件,权值w是整个优化过程的结果,在一定条件下是最优的。Rafely[13]提出了能够同时在空间域和球面谐波域中实现的多零陷算法,针对非对称的普通波束,在保证期望波束的同时可以对多个方向的干扰进行抑制,增强期望信号,并应用到室内脉冲响应的测量中。

Shefeng Yan[17]将二阶锥化与波束形成相结合,在球面谐波域内将多约束的最优算法看成是凸优化的二阶锥化过程,权值和输出的波束是对多项性能指标优化后得到的最优结果。例如,鲁棒的最小旁瓣算法[14],在保证期望方向的响应和主瓣宽度的同时,使得旁瓣的峰值最小。最优的模态波束形成[15],它将多个性能参数约束考虑到一个优化过程中,试图从这些相关的参数中得到有效的最优解。与前面提到的算法不同的是,它可以动态地对干扰进行抑制,可以应用到语音增强和去混响中。此外,该思想也可以应用到多波束形成算法[16]中,可以同时对多个期望的波束进行约束。

2.2远场宽带波束形成

球面阵的远场宽带波束形成,也可以分为频域和时域两类进行实现。结合频域的算法,先将宽带信号经过DFT变成窄带信号,然后在球面谐波域内计算各个频率的权值。同样,基于FIR滤波器的时域算法也可以扩展到球面谐波域内,Shefeng Yan[17]提出了一种在时域内实现球面谐波域宽带波束形成的算法,将权值的获取看成是滤波器设计,并带有多约束的最优化过程,得到的权值是多个指标优化后的最优解。在算法实现流程中,借鉴Meyer和Elko[18]的球面波束形成时域处理方法,将球面谐波的实部与虚部分开作为球面傅里叶变换的基,在球面谐波域内得到实数信号,最后经过FIR波束合成模块得到波束响应。该算法有着比空间域宽带处理更小的计算量。此外,V. Tourbabin[19]提出的实权值波束形成算法可以看作是FIR实现的一种特例,只需要一组滤波器系数即可,它指出刚性球更适合用此类算法,并将算法性能和复权值算法进行比对。

2.3近场波束形成

上述算法都是基于远场假设的,但在实际应用,例如,手提电话中信源到阵元的距离变小,远场平面波的假设将不再成立,因为在波束响应中信号的相位和幅度可能会出现误差。Meyer和Elko[20]提出了近距离通话麦克风阵,它基于对近场源声场的球面谐波正交分解, 并通过不同模态间的比值估计出信源的距离,加上角度估计可以对信源进行定位。Fisher和Rafely[21]也已经用阵列的阶数,信号频率和位置等参数定义了近场准则,并对波束响应随径向距离变化的情况进行了研究。最近,Fisher和Rafely[22,23]又将径向滤波器应用到实际的近场球面阵和实际语音信号中,在控制波束响应方向性能的基础上,试图提高阵列的径向性能。常用的滤波器有径向契比雪夫、径向V型滤波器等,分析它们的设计方法和性能,结果表明它们可以提高对不同距离干扰的抑制能力,具有不同的距离分辨力。

3线阵和环形阵波束形成

在进行球面谐波分解时,通常将球面阵作为第一选择,但是它要求阵元的位置必须严格正交,这会限制阵列形状的灵活性。

Kennedy和Abhayapala[24,25]课题组对球面谐波在线阵波束形成中的应用进行了研究。他们根据z轴上线阵波束的轴对称性,简化了波动方程的球面谐波解,并论证了近场和远场波束响应的等价性。通过径向变换、径向互惠关系等将近场宽带响应变换到远场中,利用成熟的远场算法设计相应的波束。

Meyer和Elko[26]试图用环形阵去提取球面谐波,利用了x-y平面内的环形阵和原点处的一个阵元,这种阵列结构对于高度不变的2D声场分析比较有效,不能完全提取出3D场的全部谐波。Abhayapala[4]提出更适用于3D声场分解的阵列结构,阵列由一组互相平行的环形阵组成。在进行球面谐波分解的时候,根据波动方程、勒让德函数和球面贝塞尔函数的性质,将环形阵分为位于x-y平面的、平行于x-y平面的,并在z轴上放置相应数目的阵元,最后将该混合结构应用到远场宽带波束形成中。

4DOA估计

球面谐波域内的高精度DOA估计主要针对用球面麦克风阵列观测相干和/或宽带源的情况。Teutsch[27]提出了球面阵子空间DOA估计的算法,思想类似于阵元域中的算法。接着,Teutsch[28]将球面谐波分解后得到的子波束应用到多个宽带信号源的检测和定位中,在定位过程中用到球面Esprit算法。Goossens和 Rogier[29]对上述的球面Esprit算法进行改进,它可以对方位角和俯仰角自动配对,并进行二维DOA估计,即使在相干情况下,它的运算量更低性能也更好。Sun Haohai[30]等指出球面子空间Esprit算法在现实应用中存在的关键问题,例如,相干源和多个信源的定位问题等,并结合频率平滑、方向矢量扩展等技术来提高算法的性能,利用Eigenmike麦克风阵列进行测试。 Khaykin[31]在利用球面阵对相干源进行DOA估计时,在频域将频率平滑和MUSIC算法结合,并在实际环境中得到了比波束形成更好的性能。Li Xuan[32]等利用球面阵阵元的正交性,提出了球面MUSIC算法,与传统MUSIC、波束空间MUSIC以及很多改进算法相比,该算法有更好的估计精度。Sun Haohai[33]将子波束MVDR算法用到宽带相干源的定位和提取中,在较精确地估计出DOA之后,通过计算TDOA可以确定信号的空间位置。Mabande和Sun Haohai[34,35]等人在室内环境中利用Eigenmike麦克风阵列,对基于子空间和基于波束形成的DOA估计算法的性能进行比对,包括子空间MUSIC,子空间ESPRIT和MVDR等算法,主要测试了不同算法对室内反射体的定位性能。

5结语

本文对球面谐波分解在麦克风阵列信号处理中的应用进行了系统的描述,内容涵盖球面谐波的获取、球面阵的空间采样等理论基础,以及波束的分类和权值的设计等核心部分。在此基础上,将球面阵远场窄带波束形成分为三大类:固定波束形成、统计最优波束形成和多约束最优波束形成,并归纳整理了新近提出的处理近场和/或宽带源的方法。此外,还指出了在非球面阵中应用球面谐波分解时,对不同阵形的约束条件,总结了球面谐波分解在宽带相干源高精度DOA估计中的应用现状。

参考文献:

[1]WILLIAMS E G. Fourier acoustics: sound radiation and nearfield acoustical holography [M]. Cambridge: Academic Press, 1999.

[2]MEYER J, ELKO G. A highly scalable spherical microphone array based on an orthonormal decomposition of the soundfield[C]. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2002.

[3]ABHAYAPALA T D, WARD D B. Theory and design of high order sound field microphones using spherical microphone array[C]. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2002.

[4]ABHAYAPALA T D, GUPTA A. Spherical harmonic analysis of wavefields using multiple circular sensor arrays[J]. IEEE Transactions on Audio, Speech, and Language Processin, 2010(6).

[5]RAFAELY B. Spatial sampling and beamforming for spherical microphone arrays[C]. Hands-Free Speech Communication and Microphone Arrays(HSCMA), 2008.

[6]VAN VEEN B D, BUCKLEY K M. Beamforming: A versatile approach to spatial filtering[J]. IEEE ASSP Magazine, 1988(2).

[7]RAFAELY B, WEISS B, BACHMAT E. Spatial aliasing in spherical microphone arrays[J].IEEE Transactions on Signal Processing, 2007(3).

[8]RAFAELY B. Analysis and design of spherical microphone arrays[J]. IEEE Transactions on Speech and Audio Processing, 2005(1).

[9]VICENTE L M. Adaptive array signal processing using the concentric ring array and the spherical array[D].University of Missouri, 2009.

[10]B RAFAELY, Y PELED, M AGMON, et al. Spherical microphone array beamforming[C]. Speech Processing in Modern Communication: Challenges and Perspectives. Berlin, Germany: Springer, 2010.

[11]LI ZHIYUN, DURAISWAMI R. Flexible and optimal design of spherical microphone arrays for beamforming[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2007(2).

[12]MEYER J, ELKO G W. Spherical microphone arrays for 3D sound recording[M]. Audio Signal Processing for Next-Generation Multimedia Communication System. Boston: Kluwer Academic Publishers, 2004.

[13]RAFAELY B. Spherical microphone array with multiple nulls for analysis of directional room impulse responses[C]. IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP), 2008.

[14]SUN HAOHAI, YAN SHEFENG, PETER SVENSSON U. Robust minimum sidelobe beamforming for spherical microphone arrays[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2011(4).

[15]YAN SHEFENG, SUN HAOHAI, PETER SVENSSON U, et al. Optimal modal beamforming for spherical microphone arrays[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2011(2).

[16]SUN HAOHAI, YAN SHEFENG, PETER SVENSSON U. Robust spherical microphone array beamforming with multi-beam-multi-null steering, and sidelobe control[C]. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), 2009.

[17]YAN SHEFENG, SUN HAOHAI, MA XIAOCHUAN, et al. Time-domain implementation of broadband beamformer in spherical harmonics domain[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2011(5).

[18]ELKO G W, KUBLI R A, MEYER J. Audio system based on at least second-order eigenbeam[P]. United States Patent WO03/061336A1, Jul, 2003.

[19]TOURBABIN V, AGMON M, RAFAELY B. Optimal real-weighted beamforming with application to linear and spherical arrays[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2012(9).

[20]MEYER J, ELKO G W. Position independent close-talking microphone[J]. Signal Processing, 2006(6).

[21]FISHER E, RAFAELY B. The nearfield spherical microphone array[C]. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2008.

[22]FISHER E, RAFAELY B. Near-field spherical microphone array for speech[C]. 2nd International Symposium on Ambisonics and Spherical Acoustics, 2010.

[23]FISHER E, RAFAELY B. Near-field spherical microphone array processing with radial filtering[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2011(2).

[24]KENNEDY R A, ABHAYAPALA T D, WARD D B. Broadband nearfield beamforming using a radial beampattern transformation[J]. IEEE Transactions on Signal Processing, 1998(8).

[25]KENNEDY R A, WARD D B, ABHAYAPALA T D. Nearfield beamforming using radial reciprocity[J]. IEEE Transactions on Signal Processing, 1999(1).

[26]MEYER J, ELKO G. Spherical harmonic modal beamforming for an augmented circular microphone array[C]. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2008.

[27]TEUTSCH H. Modal array signal processing: principles and applications of acoustic wavefield decomposition[M]. Berlin: Springer-Verlag, 2007.

[28]TEUTSCH H, KELLERMANN W. Detection and localization of multiple wideband acoustic sources based on wavefield decomposition using spherical apertures[C] IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2008.

[29]GOOSSENS R, ROGIER H. Unitary spherical esprit:2D angle estimation with spherical arrays for scalar fields[J]. IET Signal Processing, 2009(3).

[30]SUN HAOHAI, TEUTSCH H, MABANDE E, et al. Robust localization of multiple sources in reverberant environments using EB-ESPRIT with spherical microphone arrays[C]. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2011.

[31]KHAYKIN D, RAFAELY B. Coherent signals direction-of-arrival estimation using a spherical microphone array: frequency smoothing approach[C]. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), 2009.

[32]LI XUAN, YAN SHEFENG, MA XIAOCHUAN, et al. Spherical harmonics music versus conventional music[J]. Applied Acoustics, 2011(9).

[33]SUN HAOHAI, MABANDE E, KOWALCZYK K, et al. Joint DOA and TDOA estimation for 3D localization of reflective surfaces using eigenbeam MVDR and spherical microphone arrays[C]. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2011.

[34]MABANDE E, SUN HAOHAI, KOWALCZYK K, et al. Comparison of subspace-based and steered beamformer-based reflection localization methods[C]. European Sig. Proc. Conf. (EUSIPCO), 2011.

[35]SUN HAOHAI, MABANDE E, KOWALCZYK K, et al. Localization of distinct reflections in rooms using spherical microphone array eigenbeam processing[J]. The Journal of the Acoustical Society of America, 2012(4).

上一篇:现实课堂与虚拟课堂互补互融适应性调查研究 下一篇:企业2.0在企业管理中的应用前景和价值分析