远场-近场折中的波束形成器设计及SOPC实现

摘 要:针对语音信号处理中传统的固定波束形成器,需要给定远场声源或近场声源,导致应用场合受到局限的问题,提出了用最小平方方法实现远场-近场折中的固定波束形成器设计,给出了系统在SOPC上的实现过程,验证了该方案具有运算简单,应用广泛而且失真度小的特性。关键词:麦克风阵列; 语音增强; 波束形成; SOPC; FPGA

中图分类号:TN011文献标识码:A

文章编号:1004-373X(2010)15-0107-04

Design of Mixed Near-Filed and Far-Filed Beamformer and Its Application on SOPC

ZHOU Yao, GAO Tian-de, GUO Xiu-yan, WANG Xiang-hui

(College of Marine, Northwestern Polytechnic University, Xi’an 710072, China)

Abstract: Since the near-filed or far-filed sound source has to be configured before the conventional fixed beamformer performs the speech signal processing, a least squares method is proposed to implement the design of a fixed beamformer with the near-filed and far-filed compromise. The implementation procedure of the system on SOPC is presented. It proves that the approach has the characteristics of simple arithmetic operation and less speech distortion.Keywords: microphone array; speech enhancement; beamformer; SOPC; FPGA

0 引 言

高保真音频已成为当代语音通信系统的重要标准。在许多应用领域如PC、免提电话、助听器、语音识别系统等,感兴趣的语音信号不可避免地伴随着噪声、干扰或混响,人们渴望语音可懂度和语音质量的提高[1],尤其随着当今半导体工艺水平的进步,嵌入式处理器的体积不断缩小,性能不断提高,当今MEMS技术取得了突飞猛进的进展,便携式语音增强系统已成为现实,然而一种有效可行的语音增强算法已成为研究的重点。

宽带波束形成是麦克风阵列语音增强理论的重要研究内容,分为固定波束形成和自适应波束形成。波束形成器的优点在于其空间的选择性[2],将波束对准目标声源,从而抑制来自其他方向的干扰和混响。假定的固定波束形成(Fixed Beamforming)目标声源已知,将主瓣限定在声源的一个固定范围,同时抑制旁瓣[3],由于固定波束形成器不能自动适应任意声学环境,其降噪效果并不明显[4],但对于干扰和混响的抑制,其方法简单,效果显著。传统的延时-求和(Delay and Sum) 波束形成器,类似于低通滤波器[5-6]),信号经过延时求和后便引入了失真。其他的固定波束形成如超指向性麦克风、频域不变波束形成、微分麦克风[7]、最小平方(Least Squares)方法、TLS(Total Least Squares)方法[8]等,其中LS方法设计灵活,频域一致性好,因而应用广泛。

由于传统的固定波束形成器需要给定远场声源或近场声源,因而其应用场合受到限制,本文提出了用LS方法实现远场-近场折中的波束形成器设计,从而无需考虑声源位置,为自适应波束形成器性能的提高奠定了基础;同时给出了系统在SOPC上的实现过程,用实验验证了该方案的有效性。

1 固定波束形成算法分析

1.1 远场模型分析

在远场假设中,各阵元接收信号为平面波,忽略各通道的幅度差异,Yong Zhao, Wei Liu 和 Richard Langley给出了基于均匀线阵的宽带波束形成模型[9],如图1所示,信号入射角为θ,角频率为ω,方位-角频率响应函数是ω和θ的二维函数,定义为:

RF(ω,θ)=∑N-1n=0∑L-1k=0wn,ke-jnωΔτe-jkωTs(1)

式中:Δτ=dccos θ;Ts为采样间隔;d为阵元间距;c是声速。令归一化角频率为Ω=ωTs,将式(1)改写为Ω和θ的二维函数:

RF(Ω,θ)=∑N-1n=0∑L-1k=0wn,ke-jnμΩcos θe-jkΩ(2)

式中:μ=dcTs,再将式(2)写成向量形式:

RF(Ω,θ)=wTsF(Ω,θ)(3)

式(3)中w是滤波器系数构成的向量,定义为:

w=[w0,0,w1,0,…,wN-1,0,…,w0,L-1,w1,L-1,…,

wN-1,L-1]T(4)

式(3)中,sF(Ω,θ)是N×L维导向矢量,定义为:

sF(Ω,θ)=sTs(Ω)sΔτ(Ω,θ)(5)

其中表示向量直积且:

sTs(Ω)=[1,e-jΩ,…,e-j(L-1)Ω]T(6)

sΔτ(Ω,θ)=[1,e-jμΩcos θ,…,e-j(N-1)μΩcos θ]T(7)

图1 基于均匀线阵的远场宽带波束形成原理图

1.2 近场模型分析

在近场假设中,各阵元接收信号为球面波,不仅存在相移,而且有幅度差异,Simon Doclo和Marc Moonen在文献[4]中指出,常用的近场判断准则为:

r

式中:r表示声源到均匀线阵中心的距离;dtot表示线阵总长度;fs为采样频率;c为声速。若dtot=0.12 m,fs=16 kHz,则近场假设的最大声源距离为rmax=0.68 m,接下来推导近场方位-频率响应函数的表达式。常见的近场模型如图2所示,阵列中心O为参考点,声源x[k]距离点O为r,且入射角为θ,则第n个阵元与O点的距离rn(θ,r)可以表示为:

rn(θ,r)= (rsin θ)2+(dn+rcos θ)2

=r2+d2n+2dcos θ(9)

时延τn(θ,r)可以表示为:

τn(θ,r)=rn(θ,r)-rc(10)

衰减因子αn(θ,r)定义为:

αn(θ,r)=rrn(θ,r)(11)

根据式(1)、式(2)定义近场方位-归一化角频率响应函数:

RNF(Ω,θ,r)=∑N-1n=0∑L-1k=0wn,kαn(θ,r)e-jμnΩe-jkΩ

其中

μn=rn(θ,r)-rcTs(12)

同理,将RNF(Ω,θ,r)表示成向量形式:

RNF(Ω,θ,r)=wTsNF(Ω,θ)

=wT[sTs(Ω)sτn(Ω,θ,r)](13)

这时,w和sTs(Ω)不变,导向矢量sτn(Ω,θ,r)定义为:

sτn(Ω,θ,r)=[α0(θ,r)•e-jμ0Ω,α1(θ,r)•e-jμ1Ω,…,

αN-1(θ,r)•e-jμN-1Ω]T(14)

可见,近场的方位-归一化角频率响应函数必须是针对某一距离r而言。

图2 基于均匀线阵的近场宽带波束形成原理图

1.3 远场-近场折中的设计方法

Least Squares方法的代价函数定义为:

JLS-D=∫Ωi∫ΘW(Ω,θ)wTs(Ω,θ)-D(Ω,θ)2dΩdθ(15)

式中:Ωi和Θ分别表示感兴趣的频率和角度范围;W(Ω,θ)为权值函数;D(Ω,θ)为期望响应函数。在通带,本文令W(Ω,θ)=1和D(Ω,θ)=1;在阻带,令W(Ω,θ)=β和D(Ω,θ)=0。将Ωi和Θ离散化,用(Ωn,θk)表示其中的任意频点或角度,式(15)中积分表达式可以用如下求和方法来逼近:

JLS=∑Ωn∈Ωi∑θk∈θmwTs(Ωn,θk)-12+

β∑Ωn∈Ωi∑θk∈θswTs(Ωn,θk)2(16)

式中:θm,θs分别表示主瓣和旁瓣角度范围。定义总的代价函数为:

Jtot=JLS-F+JLS-NF=JLS-F+∑Rr=r1δrJLS-NF,r(17)

式中:JLS-F表示远场代价函数;JLS-NF表示近场代价函数,当R→∞,JLS-NF,R→JLS-NF[3] ,JLS-NF,r表示近场距参考点为r时的代价函数;δr为该处的权值。令δr=1,将式(17)展开得到如下二次方程:

Jtot=wT(QLS-F+∑Rr=r1QLS-NF,r)w-2wT(aLS-F+

∑Rr=r1aLS-NF,r)+∑Rr=r1dLS-NF+dLS-F(18)

容易求出,使Jtot值最小的w最优解为:

wLS=Q-1LSa(19)

式(18)中:

dLS-NF=dLS-F=dLS=∑Ωn∈Ωi∑θk∈θm1

式(19)中:

QLS=QLS-F+∑Rr=r1QLS-NF,r,a=aLS-F+∑Rr=r1aLS-NF,r

QLS-F和QLS-NF的求法可以按照QLS的一般表达式:

QLS=∑Ωn∈Ωi∑θk∈θmSR(Ωn,θk)+β∑Ωn∈Ωi∑θk∈θsSR(Ωn,θk)(20)

式(20)中SR(Ωn,θk)为S(Ωn,θk)=s(Ωn,θk)s(Ωn,θk)H的实部,s(Ωn,θk)可以根据假设代替sF(Ω,θ)或sNF(Ω,θ)来求得相应的QLS,同样,aLS-F和aLS-NF,r可根据a的一般表达式:

a=∑Ωn∈Ωi∑θk∈θmsR(Ωn,θk)(21)

求得,式(21)中sR(Ωn,θk)为s(Ωn,θk)的实部。

2 实验及结果

2.1 SOPC实验平台搭建

系统的核心器件为FPGA芯片,选用Altera公司的EP3C55F484C8,该芯片有55 856个LE和260个M9K,足以完成硬件的FFT,LMS等复杂运算,系统输入由8个模拟麦克风和8通道、24位、Σ-Δ ADC芯片ADS1278及模拟运放组成,输出端采用FTDI公司的USB芯片FT2232h,实现了USB 2.0 High-speed连接。由于Matlab事先完成了大量的准备工作,FPGA只需对输入信号做空间。在SOPC中定制了一个Nios系统,算法模块如图3所示。

图3 Nios系统算法模块框图

图3中定制的Avalon读写接口目的是方便DMA传送数据,系统启动ADC后,等待ADC中断,当ADC采集到64点数据后产生中断,CPU以乒乓的方式缓存数据(帧长256,帧移64),并做overlap、加窗,然后启动DMA将各通道数据搬移至FIFO准备做FFT,同时等待双口RAM返回FFT结果,接着加权求和,同理启动DMA做一次IFFT,最后将结果送至USB传回PC[10]。

2.2 实验结果

实验选用7个麦克风的均匀线阵,间距为0.02 m,根据式(8)算出近场的最大有效距离为R=0.68 m,式(17)中总代价函数中的权值都设为1,式(16)中所有情况下的权值β设为0.05,语音的频率范围为300~4 000 Hz,主瓣角度范围设为θm∈[70°,110°],旁瓣为θs∈[0°,60°]∪[120°,180°],用前面所描述的方法,仿真得到最优权向量,即空间滤波器的最佳权系数,最后用最优权向量还原出理想的近场波束和理想的远场波束,如图4所示。在频率f=2 kHz处,将图4(a)和图4(b)分别做一截面加以比较,如图5所示。从图4和图5中可以看出,近场和远场的理想波束主瓣几乎完全重合,只有旁瓣有细微的变化,两种情况下,旁瓣级均保持在-15 dB以下,从而实现了远场和近场的折中。

图4 用折中方法设计的波束图

图5 f=2 kHz时的理想波束图比较图

为了进一步分析不同主瓣的空间滤波器对声源的不同响应,选择3个麦克风,间距为0.02 m,按上述方法重新设计主瓣分别为0°~60°和60°~120°的两种波束形成器,声源在阵列的0°~60°范围内随意移动,实验环境为普通办公环境,有严重的混响和干扰。通过SOPC实验,数据传回至PC机,分析此时信号的语谱图如图6所示。

图6 语谱图

从图6可以看出,固定波束形成器可以通过设定主瓣角度范围来选择特定声源,同时抑制来自旁瓣角度范围的干扰或混响。

3 结 语

本文分析了宽带波束形成的远场模型和近场模型,并在此基础上用Least Squares方法设计了远场-近场折中的固定波束形成器,通过仿真从理论上证明了该方法的可实现性,同时给出了SOPC实验平台,再次通过实验来验证了该算法有效性且利于片上实现。

参考文献

[1]BENESTY Jacob, CHEN Jing-dong, HUANG Yiteng. Noise reduction in speech processing[M]. Berlin: Springer-verlag, 2009.

[2]林静然.基于麦克风阵列的语音增强算法研究[D].成都:电子科技大学,2004.

[3]BENESTY J, MAKINO S, CHEN J. Speech enhancement[M]. Berlin: Springer-verlag, 2005.

[4]DOCLO Simon, MOONEN Marc. Design of far-field and near-field broadband beamformers using eigenfilters[J]. Signal Process, 2003, 83: 2641-2673.

[5]BENESTY Jacob, CHEN Jing-dong, HUANG Yi-teng. Microphone array signal processing[M]. Berlin: Springer-verlag, 2008.

[6]WARD D B, KENNEDY R A, WILLAMSON R C. FIR filter design for frequency invariant beamformers[J]. IEEE on Signal Process., 1996, 3(3): 69-71.

[7]SONG Hui, LIU Jia. First-order differential microphone array for robust speech enhancement[J]. IEEE International Conference on ICALIP, 2008, 1(1): 1461-1466.

[8]PEI Soo-Chang, TSENG Chien-Cheng. A new eigenfilter based on total least squares error criterion[J]. IEEE Trans. Circuits And Systems, 2001, 48(6): 699-709.

[9]ZHAO Yong, LIU Wei, LANGLEY Richard. A least squares approach to the design of frequency invariant beamformers[J]. IEEE Workshop on EUSIPCO, 2009, 1(1): 844-848.

[10]YIU K F C, CHUN Hok Ho, GRBRIC N, et al. Reconfigurable acceleration of microphone array algorithms for speech enhancement[J]. IEEE International Conference on ASAP, 2008, 1(1): 203-208.

推荐访问:波束 折中 设计 SoPC