语音芯片烧录的关键三大要素

2022-11-27  

由于人耳听觉系统的复杂性、生理结构特异性让人们无法从生理解剖学的角度得到完美诠释。人耳对不同强度和不同频率的听觉范围统称为声域,人耳听觉的主观感受大致来源于响度、音高以及音色三种特性,也称声音“三要素”。这也是一般语音芯片烧录时音频定位的主要构成因素。

3b56a1a8-673c-11ed-8abf-dac502259ad0.jpg

响度

响度,又称声强或音量,它表示的是声音能量的强弱程度,主要取决于声波振幅的大小。声音的响度一般用声压(达因/平方厘米)或声强(瓦特/平方厘米)来计量,声压的单位为帕(Pa),它与基准声压比值的对数值称为声压级,单位是分贝(dB)。对于响度的心理感受,一般用单位宋(Sone)来度量,并定义lkHz、40dB的纯音的响度为1宋。


响度的相对量称为响度级,它表示的是某响度与基准响度比值的对数值,单位为口方(phon),即当人耳感到某声音与1kHz单一频率的纯音同样响时,该声音声压级的分贝数即为其响度级。可见,无论在客观和主观上,这两个单位的概念是完全不同的,除1kHz纯音外,声压级的值一般不等于响度级的值,使用中要注意。响度是听觉的基础。


正常人听觉的强度范围为0dB—140dB(也有人认为是-5dB—130dB)。固然,超出人耳的可听频率范围(即频域)的声音,即使响度再大,人耳也听不出来(即响度为零)。但在人耳的可听频域内,若声音弱到或强到一定程度,人耳同样是听不到的。当声音减弱到人耳刚刚可以听见时,此时的声音强度称为“听阈&rdquo。


一般以1kHz纯音为准进行测量,人耳刚能听到的声压为0dB(通常大于0.3dB即有感受)、声强为10-16W/cm2 时的响度级定为0口方。而当声音增强到使人耳感到疼痛时,这个阈值称为“痛阈”。仍以1kHz纯音为准来进行测量,使人耳感到疼痛时的声压级约达到140dB左右。


音高

音高也称音调,表示人耳对声音调子高低的主观感受。客观上音高大小主要取决于声波基频的高低,频率高则音调高,反之则低,单位用赫兹(Hz)表示。主观感觉的音高单位是“美”,通常定义响度为40方的1kHz纯音的音高为1000美。赫兹与“美”同样是表示音高的两个不同概念而又有联系的单位。


人耳对响度的感觉有一个从闻阈到痛阈的范围。人耳对频率的感觉同样有一个从低可听频率20Hz到高可听频率别20kHz的范围。响度的测量是以1kHz纯音为基准,同样,音高的测量是以40dB声强的纯音为基准。


实验证明,音高与频率之间的变化并非线性关系,除了频率之外,音高还与声音的响度及波形有关。音高的变化与两个频率相对变化的对数成正比。不管原来频率多少,只要两个40dB的纯音频率都增加1个倍频程(即1倍),人耳感受到的音高变化则相同。在音乐声学中,音高的连续变化称为滑音,1个倍频程相当于乐音提高了一个八度音阶。根据人耳对音高的实际感受,人的语音频率范围可放宽到80Hz--12kHz,乐音较宽,效果音则更宽。


音色

音色又称音品,由声音波形的谐波频谱和包络决定。声音波形的基频所产生的听得清楚的音称为基音,各次谐波的微小振动所产生的声音称泛音。单一频率的音称为纯音,具有谐波的音称为复音。每个基音都有固有的频率和不同响度的泛音,借此可以区别其它具有相同响度和音调的声音。


声音波形各次谐波的比例和随时间的衰减大小决定了各种声源的音色特征,其包络是每个周期波峰间的连线,包络的陡缓影响声音强度的瞬态特性。声音的音色色彩纷呈,变化万千,高保真(Hi—Fi)音响的目标就是要尽可能准确地传输、还原重建原始声场的一切特征,使人们其实地感受到诸如声源定位感、空间包围感、层次厚度感等各种临场听感的立体环绕声效果。


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。