简介
所有MEMS麦克风都具有全向拾音响应,也就是能够均等地响应来自四面八方的声音。多个麦克风可以配置成阵列,形成定向响应或波束场型。经过设计,波束成形麦克风阵列可以对来自一个或多个特定方向的声音更敏感。
麦克风波束成形是一个丰富而复杂的课题。本应用笔记仅讨论基本概念和阵列配置,包括宽边求和阵列和差分端射阵列,内容涵盖设计考虑、空间和频率响应以及差分阵列配置的优缺点。
图1:空气中声波的频率与波长的关系
方向性和极坐标图
方向性描述麦克风或阵列的输出电平随消声空间中声源位置的改变而变化的模式。ADI公司的所有MEMS麦克风都是全向麦克风,即它们对来自所有方向的声音都同样敏感,与麦克风所处的方位无关。图2所示为全向麦克风响应的2轴极坐标图。无论麦克风的收音孔位于x-y平面、x-z平面还是y-z平面,此图看起来都相同。
图2:全向麦克风响应图
本应用笔记中,阵列的“前方”称为轴上方向,指拾取目标音频的方向,在极坐标图上标为0°;“后方”为180°方向;“侧边”指前后方之间的空间,中心方向分别位于90°和270°。本应用笔记中的所有极坐标图均归一化到0°响应水平。
涉及声音频率和波长的所有公式都使用以下关系式:c = f × λ,其中c为343 m/s,即声音在20℃的空气中的传播速度。图1显示了这些条件下声波的频率与波长的关系。本应用笔记末尾的“设计参数计算公式”列出了本文所用阵列设计参数的计算公式。
宽边阵列
宽边麦克风阵列是指一系列麦克风的排列方向与要拾取的声波方向垂直(见图3)。图中,d是阵列中两个麦克风元件的间距。来自阵列宽边的声音通常就是要拾取的声音。
图3:双麦克风宽边阵列
宽边阵列可以通过基本处理实现,阵列中的麦克风简单地相加。此类阵列的缺点是它只能衰减来自阵列侧边的声音。后方响应始终与前方响应一致,因为阵列具有轴对称性,无法区分从前方与从后方到达麦克风的声压波。宽边阵列适用于阵列背面或上下方没有很多声音的应用,例如壁挂式电视。
在双麦克风宽边阵列中,响应的最小值出现在90°和270°。这些点的信号衰减在很大程度上取决于频率。当入射频率的半波长接近麦克风的间距时,响应接近完全抵消。对于两个间距75 mm的麦克风组成的阵列,理论上,当频率约为2.3 kHz (343 m/s ÷ (0.075 m × 2)≈2.3 kHz)时,响应完全抵消。
高于理想衰减的频率时,频率将混叠,极坐标响应开始在其它角度显示零点。此时,侧边衰减再次开始降低。例如,图4中的3 kHz信号(淡蓝色线)发生混叠。
图4:间距75 mm的双麦克风宽边阵列的响应
频率响应
宽边波束成形器具有平坦的轴上频率响应,因为它只是将接收同一信号的两个麦克风的信号相加。图5显示了间距75 mm的双麦克风宽边波束成形器的归一化响应。在轴外,该图清楚地显示了响应的零点。
图5:不同入射角时宽边波束成形器的归一化频率响应
具有更多元件的宽边阵列
也可以构建具有两个以上元件的宽边阵列,只需将额外的麦克风与原来的两个麦克风对齐,如图6所示。宽边阵列中的麦克风数量越多,对来自阵列侧边的声音的衰减就越强。图7显示了间距75 mm的三麦克风宽边阵列的响应。该阵列中,来自侧边的声音衰减6 dB,而在双麦克风宽边阵列中,声音只衰减3 dB。然而,发生混叠(立体交叉型)的频率现在更低,因为所有麦克风之间的总距离已从75 mm增加到150 mm。
图6:三麦克风宽边阵列
图7:间距75 mm的三麦克风宽边阵列的响应
缩小宽边阵列中的麦克风间距可以提高混叠频率,但会降低低频时的衰减。设计宽边阵列时,必须权衡考虑这两个因素。对多麦克风宽边阵列中的各麦克风应用不同的加权系数,可以进一步减少混叠。此外,通过延迟各麦克风的输出,可以将宽边阵列的主响应角调整到前方以外的角度。系数和延迟的计算以及相应的极坐标图形超出了本应用笔记的范围。
端射阵列
在端射阵列中,多个麦克风的排列方向与声音传播的目标方向一致。如果阵列中前方麦克风(声音在轴上传播最先达到的麦克风)的信号与后方麦克风的反转延迟信号相加,则这种配置称为“差分阵列”。图8显示了一个双麦克风端射差分阵列,麦克风间距为d,后方麦克风的信号在到达减法(或反转求和)模块之前延迟n个采样周期。这可以用来创建心型、高心型或超心型拾音模式,其中来自阵列后方的声音被大大衰减。
图8:双麦克风端射阵列
当麦克风间距和时间延迟均选择得当时,针对混叠频率以下的频率,延迟求和波束成形器的响应是心型图案(见图9)。心型图案不会衰减阵列前方的信号;理论上,它会完全消除以180°入射到阵列的声音。一阶(双麦克风)延迟求和波束成形器的侧边信号衰减6 dB。
图9:双麦克风端射心型波束成形器的响应
假设声音是可近似为平面波的远场传播,那么在端射阵列中,不同麦克风拾取的声音仅有到达时间上的差别。为了创建心型拾取模式,应当延迟来自后方麦克风的信号,延迟时间等于声波在两个麦克风元件之间传输所需的时间。这为设计端射波束成形器的系统设计工程师提供了两个自由度:麦克风的间距和应用于处理器的延迟时间。在许多音频应用中,延迟时间的选择取决于采样速率(fS)。如果DSP的延迟时间由单一样本的周期决定,则当fS= 48 kHz时,最短延迟为21μs。20°C时,声音在空气中的传播速度为343 m/s;因此声波在21μs内大约行进7 mm。利用不同滤波器,如延迟同步滤波器、全通滤波器和FFT滤波器组等,可以实现小数采样延迟,但此类处理超出了本文的范围。
与宽边阵列一样,麦克风的间距决定目标方向响应的第一个零点。麦克风之间距离越近,零点频率越高(因而带宽更宽)。距离越远,则阵列的物理长度越长,可能会与工业设计限制相抵触。再次假设fS= 48 kHz,取3样本延迟时间,则声音时间延迟约为63μs。这是声音行进约21 mm所需的时间,该距离即为实现心型图案所需的麦克风元件间距。8.2 kHz声波的半波长为21 mm,因此这就是零点频率。图10显示了图9所示相同端射配置的响应,此外还显示了10kHz时的响应。除了后方的零点以外,大约±52°处还有两个零点。
图10:双麦克风端射波束成形器的频率混叠
为实现良好性能的波束成形阵列,具有电气延迟的麦克风之间的距离匹配至关重要。图11显示了在保持延迟时间不变的同时改变麦克风之间物理距离的影响。本例同样使用3样本延迟时间,对应于大约21 mm的距离,以便实现心型响应图案(fS = 48 kHz)。当麦克风之间的距离小于21 mm时,后方零点并不突出,响应为准心型图案。当物理距离大于21 mm时,响应为高心型图案,两个后方零点相对于180°点等距分开。在需要抑制的不是正后方,而是稍微散开方向的应用中,这可能正合适,而且侧边抑制也强于心型响应的侧边抑制。
图11:改变端射波束成形器麦克风距离的影响
频率响应
差分阵列波束成形器的频率响应不是平坦的,在零点频率范围内,它具有高通滤波器响应特征。一阶波束成形器(两个麦克风元件)的响应以6 dB/倍频程的速率随频率而提高,在混叠频率以上归于平坦。在零点频率,阵列理论上没有输出,因为延迟信号恰好与前方麦克风的信号抵消。
图12显示了不同入射角时双麦克风差分阵列波束成形器的频率幅度响应。图中,0 dB点是单个全向麦克风输出电平。该波束成形器使用21 mm间距和3样本延迟时间,因此轴上零点出现在大约8.2 kHz时。在轴上,响应以6 dB/倍频程的速率提高,直到入射信号的四分之一波长与麦克风间距相同时。过了这一点后,响应降低到零点,然后再次在3/4波长点时提高到最大值。除了阵列元件间距与入射信号半波长相同时的轴上零点以外,在半波长的各倍数处也存在零点。
图12. 不同入射角时端射波束成形器的频率响应
注意,入射角为90°的信号响应比入射角为0°的信号响应低6 dB,在轴上零点频率时具有最大输出电平。
差分波束成形算法的输出通常会应用一个均衡(EQ)滤波器,以使响应平坦。
零点频率应适当选择,不应干扰目标频率,但又不能太高,以至于造成低频信号被过分衰减。在使用单样本延迟时间(fS= 48 kHz)和7 mm麦克风间距的端射差分阵列中,零点频率约为24.5 kHz。如果麦克风间距为84 mm,并且使用6样本延迟时间,则混叠频率为4.2 kHz。设计通常要求零点频率位于以上两者之间,这样既不至于太低,导致零点频
率干扰语音的带宽,又不至于太高,导致低频响应被高度衰减。基于这样要求,麦克风间距的选择一般要与两个到四个样本的延迟时间匹配。同样,以上均假设fS= 48 kHz。所有这些计算均与采样速率成线性比例关系。
高阶端射阵列
通过增加更多的麦克风并使它们与最初的两个对齐,可以构成高阶差分阵列波束成形器。这将能更好地抑制来自后方和侧边的声音,但是,构建波束成形器的物理距离当然也更长。图13显示了一个二阶(三麦克风)端射波束成形器的例子。在阵列后方的零点相同的情况下,二阶端射波束成形器可以实现12 dB的侧边衰减,如图14所示。图中,蓝色线是一阶(双麦克风)波束成形器的响应,红色线是二阶波束成形器的响应。
图13:二阶差分波束成形阵列
图14:一阶与二阶端射波束成形器的比较
对于更高阶端射波束成形器,可以运用同样的思路,不过阵列尺寸显然会增大。
麦克风匹配
为实现良好性能的麦克风波束成形器,阵列中不同元件的灵敏度和频率响应必须精密匹配。如果不同元件的这两个参数有差异,就无法实现阵列的期望响应,零点可能不那么突出,阵列的方向性可能不是很恰当。ADI公司MEMS麦克风的灵敏度和频率响应均精密匹配,非常适合用于波束成形阵列。
阵列处理对系统噪声的影响
对信噪比(SNR)的影响取决于阵列配置和处理,阵列拓扑结构不同,可能会导致系统SNR提高或降低。必须选择SNR规格最高的麦克风,从而使总体系统性能最高。
在轴上,宽边波束成形器的输出类似于将两个相同信号简单相加以改善SNR。在宽边求和阵列中,多个麦克风本身的噪声以指数形式相加。因此,麦克风数量每增加一倍,噪声就会提高3 dB。这种情况下,信号电平加倍,提高6 dB,而噪声则以非相干形式相加,总电平仅提高3 dB,因此SNR性能提高3 dB。在轴外,此波束成形器的信号输出不是平坦的,如图5所示。在轴外入射角,由于信号电平降低,SNR低于轴上峰值。
差分阵列对SNR的影响更复杂,在此不进行量化分析。对于波长为麦克风间距2倍的频率(在图12所示例子中,此频率约为4.1 kHz),双麦克风差分阵列波束成形器的轴上频率响应为6 dB。在此频率附近,阵列信号的输出与其噪声的差别高于各麦克风的输出与其噪声的差别,但整个频率范围内的信噪比关系更加难以计算。
多个麦克风的放置
阵列中麦克风收音端口之间的线性距离只是构建麦克风阵列时需要考虑的路径之一。虽然ADI公司的MEMS麦克风非常薄,但仍有一定的高度,进行阵列设计时应当予以考虑。ADI公司MEMS麦克风薄膜上的声学中心位于收音端口以上0.57 mm。除了麦克风所在PCB的厚度以外,选择麦克风间距时还应考虑此距离。如果所有麦克风都以同样的方式安装(同一PCB、相同收音端口长度),那么这不是一个问题。
高级波束成形
本应用笔记仅仅讨论了麦克风波束成形的基本原理,并未详细介绍这一处理领域。采用不同数量麦克风和不同配置的阵列显然是可行的,其信号处理算法的复杂度可能远远超过本文所述的简单算法。更高级的算法可以用于语音跟踪和波束导引,甚至只需少量麦克风。
本文所述的阵列均为线性分布,但在更高级的高阶波束成形器中,各对麦克风之间的间距可以不同。这种配置会改变零点和混叠频率以及不同麦克风的信噪比,有可能使阵列的噪声更低,可用频率响应更宽。
附:宽边与端射波束成形器的优缺点