音频压缩技术标准

发布时间:2024-09-04  

  音频压缩技术定义

  音频信号能进行压缩的依据是音频压缩技术。

  音频压缩技术指的是对原始数字音频信号流(PCM编码)运用适当的数字信号处理技术,在不损失有用信息量,或所引入损失可忽略的条件下,降低(压缩)其码率,也称为压缩编码。它必须具有相应的逆变换,称为解压缩或解码。音频信号在通过一个编解码系统后可能引入大量的噪声和一定的失真。


  在音频压缩领域,有两种压缩方式,分别是有损压缩和无损压缩。常见到的MP3、WMA、OGG被称为有损压缩,有损压缩顾名思义就是降低音频采样频率与比特率,输出的音频文件会比原文件小。另一种音频压缩被称为无损压缩,也就是所要说的主题内容。无损压缩能够在100%保存原文件的所有数据的前提下,将音频文件的体积压缩的更小,而将压缩后的音频文件还原后,能够实现与源文件相同的大小、相同的码率。无损压缩格式有APE、FLAC、WavPack、LPAC、WMALossless、AppleLossless、La、OptimFROG、Shorten,而常见的、主流的无损压缩格式只有APE、FLAC。

  音频压缩技术标准

音频压缩技术标准

  音频信号是多媒体信息的重要组成部分。音频信号可分为电话质量的语言、调幅广播质量的音频信号和高保真立体声信号(如调频广播信号、激光唱片音盘信号等)数字音频压缩技术标准分为电话语音压缩、调幅广播语音压缩和调频广播及cd音质的宽带音频压缩3种。

  在语音编码技术领域,各个厂家都在大力开发与推广自己的编码技术,使得在语音编码领域编码技术产品种类繁多,兼容性差,各厂家的技术也难于尽快得到推广。所以,需要综合现有的编码技术,制定出全球统一的语言编码标准。自20世纪70年代起,ccett下第十五究组和国际标准化组织(iso)已先后推出了一系列的语音编码技术标准。其中,ccitt推出了g系列标准,而iso则推出了h系列标准。

  1、电话(200hz-3.4khz)语音压缩标准主要有itu的g.722(64kb/s)、g721(32kb/s)、g.728(16kb/s)和g.729(8kb/s)等建议,用于数字电话通信。

  2、调幅广播(50hz-7khz)语音压缩标准主要采用itu的g.722(64kb/s)建议,用于优质语音、音乐、音频会议和视频会议等。

  3、调频广播(20hz-15khz)及cd音质(20hz-20khz)的宽带音频压缩标准主要采用mpeg-1或mpeg-2双杜比ac-3等建议,用于cd、md、mpc、vcd、dvd、hdtv和电影配音等。

  下面主要介绍一下g.722(64kb/s)和mpeg-4

  G722音频压缩编码标准

  G.722是支持比特率为64, 56和48kbps多频率语音编码算法。在G.722中,语音信号的取样率为每秒16000个样本。与3.6kHz的频率语音编码相比较,G.722可以处理频率达7kHz音频信号宽带。G.722 编码器是基于子带自适应差分脉冲编码(SB-ADPCM)原理的。信号被分为两个子带,并且采用 ADPCM 技术对两个子带的样本进行编码。

  G.722是G系列的语音编码中一种宽带的编码方式。相对于G.711 采样频率由8KHZ扩展为16KHZ语音质量得以提高将信号划分为2个子带(高频,低频)每个子带中的信号都采用ADPCM(adaptive differential pulse code modulation)进行编码ADPCM原理即只采样声音样本中增量变化的那一段在最后比特率的计算中,低频部分被分配到比较多的资源8Kbps X 6bit,高频部分被分配到比较少的资源(多为摩擦声,噪音等辅助音)8Kbps X 2bit,两者相加既为64Kbps,故G.722相对于G.711比特率都为64kbps,但提高了语音质量,在cisco CM7.0以上版本中已支持G.722编码算法,cisco 79以上系列交换机已将G.722编码作为默认首选编码。

  MPEG-4音频压缩编码标准

  具有高度的灵活性和可扩展性。主要服务于低比特率下的多媒体通信。引入了音频对象(A○)

  码率范围:2~64kb/s,提供三种类型编码器①低比特率:参数化编码器

  参数编码器:使用参数编码技术。

  两种编码工具:谐波矢量激励编码、谐波和特征线加噪声编码。

  ②中间比特率:码激励线性预测编码器

  码激励线性预测编码器:主要由激励源和合成滤波器组成

  ③高比特率:时/频编码器

  时/频编码器:时域模块提取音频信号的增益信息

  滤波器组通过DCT变换信号从时域变换到频域

  心理声学模型对不同频段的频域信号采取相应的处理策略

  频域处理模块根据心理声学模块的参数处理各个频段的信号。

  量化和编码部分对频域信号进行编码。


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    数字音频有哪三类 数字音频的主要技术指标;  数字音频有哪三类   数字音频可以分为以下三类:   1. 线性PCM音频:PCM表示脉冲编码调制,它是一种数字音频编码格式。线性PCM音频是非压缩的数字音频......
    文件上不同声音的用户将需要这种声音,而不是普通的文件类型。 M4A文件类型是Apple iTunes使用的压缩音频文件。诸如Apple iTunes之类的音乐下载软件使用M4A代替MP3,因为它体积更小,质量......
    ,即减小峰值和增加低音部分的音量,以控制信号在整个范围内的幅度。这可能会降低音频的动态感和逼真度。   2. 失真:当压限限幅器过度压缩音频信号时,可能会引起失真。失真......
    如何把视频转换成音频 视频转换成音频的原理是什么;  如何把视频转换成音频   您可以使用专门的视频转音频工具或软件,以下是一种常见的方法:   找到可靠的视频转音频工具或软件,例如FFmpeg......
    、4:2:2、4:2:0 8/10位bpc 192KHz x8通道的最大音频采样率 LPCM和压缩音频编码格式 用于芯片控制的辅助通道、I2C主机接口 USB Type-C显示端口(DP)Alt模式......
    RGB 4:4:4 8/10位bpc和YCbCr 4:4:4、4:2:2、4:2:0 8/10位bpc 192KHz x8通道的最大音频采样率 LPCM和压缩音频编码格式 用于芯片控制的辅助通道、I2C......
    . 主机必须增加文件管理系统。 6. 需要额外的软件去编码或者解码这些压缩文件。 MTP 大批量数据传输: 保障数据的完整性,但是不保障数据的实时性。 没有办法同步。 2. 它是基于PTP(Picture......
    处理算法。于压缩音频音频通常被压缩成较小文件以供用户下载,文件压缩是通过编码算法实现的(如MP3),文件的减小可能会造成信息的缺失,最终影响音频效果,所以,音频处理算法同样也可以派上用场。 噪声......
    :4:4 8/10位bpc和YCbCr 4:4:4、4:2:2、4:2:0 8/10位bpc 192KHz x8通道的音频采样率 LPCM和压缩音频编码格式 用于芯片控制的辅助通道、I2C主机......
    kHz的立体声或7.1声道环绕声音频。S/PDIF可以传送立体声LPCM音频或压缩音频,包括DTS®、THX®和Dolby® Digital。 AD9389B还整合了一些其它特性,例如:用于HDCP......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>