音频中的压缩:降低采样率、降低位深度、减少通道数

发布时间:2024-07-09  

在一切开始之前有个问题要问大家:为什么要对一个文件进行压缩呢?茫然的你决定暂时不管这个问题去下载点东西,打开了“网抑云”之后你在每日推荐里找到了几首喜欢的歌,心潮澎湃的你觉得遇到了真爱,于是立刻点击了下载想把这几首歌占为己有。在下载选项里你发现有最高音质、极高音质、一般音质几种选项。你觉得听歌肯定要照顾自己的耳朵,于是选了最高音质,结果“网抑云”喊你冲会员,于是你一气之下... 选了极高音质。


回想刚刚的问题,你突然觉得极高音质是不是就是最高音质进行了一些压缩呢?因为极高音质的文件大小比最高音质要小一些。答案当然是肯定的。虽然极高音质的音质不如最高音质来的 nice,但是更小的文件占用的磁盘空间更小,也更方便数据的传输,因此压缩技术对音频十分重要。当然,压缩技术也可以诱使人氪金...

扯远了,那现在我们来了解一下音频中的压缩思路吧。首先,我们看一看文件大小的公式:

文件大小(file size) = 时长(duration) * 采样率(sampling rate) * 位深度(bit depth) * 通道数(number of channels)

由于一个音频的时长是无法改变的,所以我们只能从降低采样率 / 降低位深度 / 减少通道数入手。

先来看看采样率(sampling rate)。采样率越高,一段音频的品质就越好。常用的采样率如图所示:

可以看到最低的采样率是 11025Hz,用于语音和调幅(AM)广播。可以看到,调频(FM)广播的采样率是调幅(AM)的两倍,这也是为什么我们平常在私家车上收听广播一般选择 FM xxx 而不是 AM xxx 的原因,因为 FM 的音质更好。感兴趣的话可以下次坐车时听听两种广播,进行一下对比。

音频压缩的另一种思路是降低位深度(bit-depth)。常用的位深度有 8 位和 16 位,将一个大小为 10MB 左右的 16 位音频文件压缩到 8 位,其文件大小能减小 5MB 左右。一般来说,普通的语音(对音质没有太高要求)的位深度为 8 位,而对于对音质要求较高的音乐来说,位深度通常为 16 位,毕竟没人愿意听全是噪音的歌曲。

那什么是通道数呢?一般来说,立体声(stereophonic audio)是一种声音复制(sound reproduction)的方法,一般来说至少有两个音频通道,这样就能造成“我听到了从两个方向传来的声音耶!”的感觉,使音频立体化,更贴近自然音频。对于一个有两个音频通道的立体声而言,只要减少一个通道,音频文件的大小就会减半。然而,这种操作会对声音造成损害,因此只适合适用于短促的音效或语音中,并不适合使用于音乐中。


此外,音频文件不适于无损压缩,因为具有相同值的连续音频样本并不常见。常用的音频压缩方式是有损压缩,譬如 mp3。但 mp3 提供了一个良好的压缩率,同时保持音频的质量。


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>