一招教你快速解析WAV文件格式

发布时间:2024-05-06  

STM32从SD卡中读取语音文件进行播放,因此需要对语音进行解码,刚开始就一直使用Speex的音频压缩格式,最近发现,在进行语音格式转换时,我们不能很好地分析spx格式音频文件的文件头,这样就会导致语音的播放出现问题。由于WAV采用PCM编码,音质也十分不错,于是考虑用STM32对WAV格式音频文件进行解码,上周末开始找资料和编程,其中也遇到了不少问题,不过功夫不负有心人,最终还是顺利的跑起来了。先将资料和编程过程整理成本文,供大家一起学习和进步。

WAV文件格式是一种重要的用于存放声音文件的文件格式,尽管现在有MP3,RAM等压缩效率更高的声音文件格式,并且广泛被音乐文件所采用,但是又很多的应用程序仍然采用WAV文件格式。由于WAV文件没有采用压缩技术,所以它的文件很庞大,一般都在几MB以上。但也正是因为没有采用压缩技术,声音的采样数据很容易被读出来,便于用作其他的处理。


废话不多说了,我们直接去解析WAV文件格式吧。

WAV格式符合RIFF(Resource interchange File Format)规范。所有的WAV都有一个头文件,这个头文件音频流的编码参数。


表1、WAV文件的文件头

WAV-2.jpg

表2、WAV声音文件的数据块
接下来我们用已经编好的程序来读取一个WAV文件的文件头和数据块,看看各个内容都表示什么含义。


图2、用WinHex软件解析WAV

WAV-5.jpg

图3、STM32读取WAV的信息

头文件样例说明:

? “52 49 46 46”这个是Ascii字符“RIFF”,这部分是固定格式,表明这是一个WAVE文件头。

? “24 33 AE 00”这个是我的WAV文件的数据大小,这个大小包括除了前面4个字节的所有字节,也就是等于文件总字节数减去8。得到图3中的11416356。11416356+8=11416364Byte=10.88Mb。

? “57 41 56 45 66 6D 74 20”,也是Ascii字符“WAVEfmt”,这部分是固定格式。以后是PCMWAVEFORMAT部分。

? “10 00 00 00”,这是一个DWORD,对应数字16,这个对应定义中的PCMWAVEFORMAT部分的大小,可以看到后面的这个段内容正好是16个字节。当为16时,最后是没有附加信息的,当为数字18时,最后多了两个字节的附加信息。

? “01 00”,这是一个WORD,对应定义为编码格式(WAVE_FORMAT_PCM格式用的就是这个)。

? “01 00”,这是一个WORD,对应数字1,表示声道数为1,是个单声道WAV,当值为2时为立体声WAV。

? “22 56 00 00”对应数字22050,代表的是采样频率220505,采样率(每秒样本数)表示每个通道的播放速度。

? “44 AC 00 00”对应数字44100,代表的是每秒的数据量,波形音频数据传送数率,其值为通道数×每秒样本数×每个样本的数据位数/8。播放软件利用此值可以估计缓冲区的大小。

? “02 00:”对应数字是2,表示块对齐的内容。数据块的调整数(按字节算),其值为通道数×每个样本的数据位置/8.播放软件需要一次处理多个改值大小的字节数据,以便将其值用于缓冲区的调整。

? “10 00”,此数值为16,采样大小为16bits,每样本数据位数,表示每个声道中各个样本的数据位数。如果有多个声道,对每个声道而言,样本大小都一样。

? “64 61 74 61”,这个是Ascii字符“data”,表示头结束,开始数据区域。

? “00 33 AE 00”,十六进制数是“0xAE3300”,对应十进制11416320,是数据区的开头以后的数据总数。

再往后就是真正的WAV文件数据体了,头文件分析到此。

常见的声音文件主要有两种,分别对应单声道(11.025KHz采样率、8Bit的采样值)和双声道(44.1KHz采样率、16Bit的采样值)。采样率是指:声音信号在“模->数”转换过程中单位时间内采样的次数。采样值是指每一次采样周期内声音模拟信号的积分值。

对于单声道声音文件,采样数据位8位的短整数;而对于双声道立体声声音文件,每次采样数据位一个16位的整数,高8为和低8位分别代表左右两个声道。
WAVE文件数据块包含以脉冲编码调制(PCM)格式表示样本。WAVE文件是由样本组织而成的。在单声道WAVE文件中,声道0代表左声道,声道1代表右声道。在多声道WAVE文件中,样本是交替出现的。

PCM数据的存放方式:

样本1 样本2

8位单声道 0声道 0声道

8位立体声 0声道(左)1声道(右) 0声道(左) 1声道(右)

16位单声道 0声道低 0声道高 0声道低 0声道高

16位立体声 0声道(左)低 0声道(左)高 1声道(右)低 1声道(右)高

系统硬件组成比较简单,可以分为液晶显示,LED指示,USB输入,SD卡,电源供电,音频功放和按键等,如图3-1所示:


图3-1 系统组成框图

SD卡电路:
SD卡采用SPI驱动。


USB电路:


采用SGM7222做转换开关,识别ID的电压值来选择是作为IAP下载还是用于USB接口


音频功放电路:


充电和系统电源:


程序编写主要有三个部分:定时器初始化,DAC初始化,定时器中断服务程序,WAV播放程序。

定时器初始化:

void Timerx_Init(u16 arr,u16 psc)

{

NVIC_InitTypeDef NVIC_InitStructure;

RCC->APB1ENR"=1<<1;//TIM3时钟使能

TIM3->ARR=arr; //设定计数器自动重装值

TIM3->


SC=psc; //预分频器7200,得到10KHz的计数时钟

TIM3->DIER"=1<<0; //允许更新中断

TIM3->DIER|=1<<6; //允许触发中断

TIM3->CR1|=0x01; //使能定时器3

//优先级设置

NVIC_PriorityGroupConfig(NVIC_PriorityGroup_2);

NVIC_InitStructure.NVIC_IRQChannel = TIM3_IRQn;

NVIC_InitStructure.NVIC_IRQChannelPreemptionPriority = 1;

NVIC_InitStructure.NVIC_IRQChannelSubPriority = 3;

NVIC_InitStructure.NVIC_IRQChannelCmd = ENABLE;

NVIC_Init(&NVIC_InitStructure);

}

DAC初始化:

#include "dac.h"

extern u16 digital;

void MyDAC_Init(void)//DAC channel1 Configuration

{

unsigned int tmpreg1=0,tmpreg2=0;

RCC->APB2ENR|=1<<2;//使能PORTA时钟

RCC->APB1ENR|=RCC_APB1Periph_DAC;//使能DAC时钟

GPIOA->CRL&=0XFFF0FFFF;

GPIOA->CRL|=0X00040000;//PA4浮空输入

tmpreg1=DAC->CR;//Get the DAC CR value

tmpreg1&=~(CR_CLEAR_Mask<

tmpreg2=(DAC_Trigger_Software|DAC_WaveGeneration_None|DAC_LFSRUnmask_Bits8_0|DAC_OutputBuffer_Enable);

tmpreg1|=tmpreg2<

DAC->CR=tmpreg1;//Write to DAC CR

DAC->CR|=CR_EN_Set<

DAC1_SetData(0x000);

#if 0

tmpreg1=DAC->CR;//Get the DAC CR value

tmpreg1&=~(CR_CLEAR_Mask<

tmpreg1|=tmpreg2<

DAC->CR=tmpreg1;

DAC->CR|=CR_EN_Set<

DAC2_SetData(0x000);

#endif

}

void DAC1_SetData(u16 data)

{

DAC->DHR12R1=data;//通道1的12位右对齐数据

DAC->SWTRIGR|=0x01;//软件启动转换

}

void DAC2_SetData(u16 data)

{

DAC->DHR12R2=data;//

DAC->DHR12R2=data;//通道2的12位右对齐数据

DAC->SWTRIGR|=0x02;//软件启动转换

}

定时器中断服务程序:

void TIM3_IRQHandler(void)

{

u16 temp;

if(TIM3->SR&0X0001)//溢出中断

{

if(CHanalnum==1)//单声道

{

if(Bitnum==8)//8位精度

{

DAC->DHR12R1=wav_buf[DApc]*10/volume;

DAC->DHR12R2=wav_buf[DApc]*10/volume;

DAC->SWTRIGR |=0x01;

DApc++;

}

else if(Bitnum==16)

{

temp=(((u8)(wav_buf[DApc+1]-0x80)<<4)|(wav_buf[DApc]>>4))*10/volume;

DAC->DHR12L1=temp;

DAC->DHR12L2=temp;

DAC->SWTRIGR|=0x01;

DApc+=2;

}

}

else if(CHanalnum==2)

{

if(Bitnum==8)

{

DAC->DHR12R1=wav_buf[DApc]*10/volume;

DApc++;

DAC->DHR12R2=wav_buf[DApc]*10/volume;

DApc++;

DAC->SWTRIGR|=0x01;

}

else if(Bitnum==16)

{ DAC->DHR12L1=(((u8)(wav_buf[DApc+1]-0x80)<<4)|(wav_buf[DApc]>>4))*10/volume; DApc+=2; DAC->DHR12L2=(((u8)(wav_buf[DApc+1]-0x80)<<4)|(wav_buf[DApc]>>4))*10/volume;

DApc+=2;

DAC->SWTRIGR|=0x01;

}

}

if(DApc==16384)

{

DApc=0;

DACdone=1;

}

}

TIM3->SR&=~(1<<0);

}

WAV初始化:

u8 WAV_Init(u8* wav_buf)

{

if(Check_Ifo(wav_buf,"RIFF"))

return 1;

wav1.wavlen=Get_num(wav_buf+4,4);

printf("nrwav1.wavlen = %ldnr",wav1.wavlen);

//if(Check_Ifo(wav_buf+8,"WAVE"))return 2;//WAVE错误标志

//if(Check_Ifo(wav_buf+12,"fmt "))return 3;//fmt错误标志

wav1.formart=Get_num(wav_buf+20,2);//格式类别

printf("nrwav1.formart = %dnr",wav1.formart);

wav1.CHnum=Get_num(wav_buf+22,2);//通道数

printf("nrwav1.CHnum = %dnr",wav1.CHnum);

CHanalnum=wav1.CHnum;

wav1.SampleRate=Get_num(wav_buf+24,4);//采样率

printf("nrwav1.SampleRate = %ldnr",wav1.SampleRate);

wav1.speed=Get_num(wav_buf+28,4);//音频转换数率

printf("nrwav1.speed = %ldnr",wav1.speed);

wav1.ajust=Get_num(wav_buf+32,2);//数据块调速数

printf("nrwav1.ajust = %dnr",wav1.ajust);

wav1.SampleBits=Get_num(wav_buf+34,2);//样本数据位数

printf("nrwav1.SampleBits = %dnr",wav1.SampleBits);

Bitnum=wav1.SampleBits;

//if(Check_Ifo(wav_buf+36,"data"))return 4;//数据标志错误

wav1.DATAlen=Get_num(wav_buf+40,4);//数据长度

printf("nrwav1.DATAlen = %dnr",wav1.DATAlen);

if(wav1.wavlen<0x100000)

{

printf("nrwav1.wavlen = %dkbnr",(wav1.wavlen)>>10);

}

else

{

printf("nrwav1.wavlen = %dMbnr",(wav1.wavlen)>>20);

}

if(wav1.formart==1)

printf("nrWAV PCMnr");

if(wav1.CHnum==1)

printf("nrsinglenr");

else

printf("nrstereonr");

printf("nrwav1.SampleRate = %dkHznr",(wav1.SampleRate)/1000);

printf("nrwav1.speed = %dbpsnr",(wav1.speed)/1000);

printf("nrwav1.SampleBits = %dbitnr",wav1.SampleBits);

return 0;

}

u8 Check_Ifo(u8* pbuf1,u8* pbuf2)

{

u8 i;

for(i=0;i<4;i++)

if(pbuf1!=pbuf2)

return 1;

return 0;

}

u32 Get_num(u8* pbuf,u8 len)

{

u32 num;

if(len==2)num=(pbuf[1]<<8)|pbuf[0];

else if(len==4)num=(pbuf[3]<<24)|(pbuf[2]<<16)|(pbuf[1]<<8)|pbuf[0];

return num;

}

WAV播放:

u8 Playwav(char *file)

{

FIL fwav;

FRESULT Res;

UINT BR;

unsigned char i;

unsigned int times;

Res = f_open(&fwav, file, FA_OPEN_EXISTING | FA_READ);

if(Res != FR_OK)

{

printf("nropen file error : %dnr",Res);

}

else

{

Res = f_read(&fwav, wav_buf, sizeof(wav_buf), &BR); /* Read a chunk of src file */

if(Res==FR_OK)

{

WAV_Init(wav_buf);

DACdone=0;

DApc=44; //跳过头信息

Timerx_Init(1000000/wav1.SampleRate,72); //定时器初始化

times=(wav1.DATAlen>>10)-1; //计算数据大小

for(i=0;i

{

while(!DACdone);//等待前面16384字节转换完成 DACdone=0;

Res = f_read(&fwav, wav_buf, 16384, &BR);

while(!DACdone);// 等待前面16384字节转换完成

DACdone=0;

Res = f_read(&fwav, wav_buf, 16384, &BR);//读取数据

}

}

else

{

printf("nrread file error : %dnr",Res);

}

f_close(&fwav);

}

return 0;

}


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>