数字音频的基本概念介绍

本文旨在让您了解数字音频的基本概念以及与此相关的术语。

幅度和频率

模拟音频最重要的两个方面是幅度和频率。让我们讨论声波的基本特性，并探讨为什么不同的声音彼此不同。

振幅：在音频中，振幅是指声音通过的介质（主要是空气）所经历的收缩和膨胀的强度。它以分贝（dB）为单位，我们将其视为音高的响度。振幅越高，声音越大。

频率：频率是指介质在一秒钟内经历振动的次数。它以赫兹（Hz）为单位测量，也称为音高。低频声音比高频声音传播得更远。例如，鼓声的频率低于长笛的频率。

人类可以听到 20 Hz 至 20，000 Hz 之间的频率。超过 20，000 赫兹的频率称为超声波，低于 20 赫兹的频率称为次声，人类听不到。

什么是“数字音频”？

数字音频是通过互联网上的计算机系统记录、处理、存储和传输音频信号的现象。计算机只能理解已编码为二进制数的信号。但是任何音频内容本质上都是模拟的，我们的处理器无法解释。

为了以计算机理解和处理数据的方式表示音频信号，需要将数据转换为数字（二进制）形式。

该过程需要不同的步骤。通常，模拟音频信号以连续正弦波的形式出现，而数字音频表示显示波形幅度的离散点。连续信号必须转换为离散信号，因为它们在一定时间间隔后提供有限且可计数的值供计算机使用。

采样和量化或音频信号的数字化

转换过程从模数转换（ADC）开始。ADC的过程必须完成两个任务，即采样和量化。采样代表以固定时间间隔捕获的样本数（幅度值）。采样率是每秒采集的样本数，以赫兹（Hz）为单位。如果我们每秒记录 48000 个样本，则采样率为 48000 Hz 或 48 kHz。

采样率（Fs）= 48 kHz

采样周期（Ts）= 1/Fs

采样率与音频频率

较小的采样间隔允许更高的采样率，从而导致更高的音频频率和更大的文件大小并最终获得更好质量的声音。因此，显然，对于无损数字化，采样率应该足够高。

超过一半采样率的频率无法在数字样本中表示。根据奈奎斯特定理，当采样率是最高音频频率的两倍以上时，可以从其数字样本中完美地重建连续时间信号。

奈奎斯特频率：采样率至少应为 Fmax 的两倍以上。

Fs 〉2 Fmax

混叠：混叠是一种伪影或失真，当信号以低于信号中最高音频频率的两倍进行采样时发生。混叠通常会导致从样本重建的信号与原始连续信号之间的差异。它取决于信号的频率和采样率。例如，如果以 38 kHz 的采样率对信号进行采样，则任何高于 19 kHz 的频率分量都会产生混叠。

抗混叠滤波器：通过使用低通滤波器或抗混叠滤波器可以避免混叠过程。这些滤波器在采样之前应用于输入信号，以限制信号的带宽。抗混叠滤波器去除奈奎斯特频率以上的分量，并允许从数字样本中重建信号，而不会产生任何额外的失真。

位深度：简而言之，位深度是每个样本可用的位数。计算机只能理解并以二进制数字（即 1 或 0）存储信息。这些二进制数字称为位。较高的编号。位数确定已存储更多信息。因此，位深度越高，将捕获越多的数据以获得更精确的结果。

动态范围：位深度也决定了信号的动态范围。当采样信号被量化到给定范围内的最接近值时，该范围内的这些值由位深度确定。这些动态范围以分贝（dB）表示。在数字音频中，24 位音频的最大动态范围为 144dB，而 16 位音频的最大动态范围为 96dB。

采样率为 44.1 kHz 的 16 位数字音频的位深度被广泛用于消费类音频，而采样率为 48 kHz 的 24 位音频则用于内容录制、混合、存储和编辑的专业音频。

音频信号的量化

它是在模数转换（ADC）期间将具有无限值的模拟音频信号从大型数据集中映射到具有有限和可计数值的较小数据集中的数字音频信号的过程。位深度在确定量化值的准确性和质量方面起着重要作用。如果音频信号使用 16 位，则表示的幅度值的最大数量为 2^16= 65，536 个值。

它表明信号的幅度被划分为 65，536 个样本，所有样本的幅度将被分配一个来自一系列可能值的离散值。在此过程中，可能会出现可察觉的音频质量小幅损失，但人耳通常无法理解这一点。这种损失是由于输入值和量化值之间的差异造成的，被描述为量化误差。

图 6：不同频率下的关系 b/w 采样和量化误差

数字音频中的单声道、立体声和环绕声

单声道（单声道）声音是所有声音组合并通过单个通道的系统。它在将信号转换为声音时仅使用一个通道。即使有多个扬声器并且声音来自不同的扬声器，它也会产生来自一个扬声器或单个源的声音效果。

立体声（立体声）声音与单声道声音相反。它使用两个独立的通道（左和右），根据您发送信号的扬声器，产生来自不同方向的声音效果。它为听众提供了一种错觉的多维音频感觉，并为左右声道提供了统一的覆盖范围。

由于更好的音频质量和更多的声道，立体声已经开始取代单声道。

环绕声通过使用多个通道为听众丰富了音频再现的保真度。它让观众体验来自三个或更多方向的声音。除了左、右和中音之外，还可以从前后听到环绕声，为听众提供从各个方向传来的声音的感觉。它广泛用于由 Dolby & DTS 设计的 5.1 和 7.1 声道的家庭影院等音频系统。

结论

数字音频将模拟信号转换成离散的（二进制）形式，它们可以在计算机系统上存储和操作。如今，数字音频系统无处不在，无论是电话、音乐系统、计算机、家庭音频系统、会议设备还是任何其他智能设备。它带来了许多超越使用模拟音乐系统录制和播放歌曲的传统优势。除了各种个性化功能外，数字音频还为用户提供高品质音频、可靠性、更多存储空间、无线连接、便携性和真正身临其境的体验。