在 C++ 中使用 libsndfile 从 WAV 文件中提取原始音频数据
Posted
技术标签:
【中文标题】在 C++ 中使用 libsndfile 从 WAV 文件中提取原始音频数据【英文标题】:Extract raw audio data from WAV files using libsndfile in C++ 【发布时间】:2013-10-11 10:29:48 【问题描述】:我正在开发一个为某些设备提供音频输入的应用程序。设备期望以原始音频数据流(16 位,48kHz)的形式提供音频输入。因此,无论波形文件中音频数据的格式(8 位、16 位、24 位、32 位等)如何,我都想从 WAV 文件中提取原始音频数据。为此,我计划使用 libsndFile 库。我修改了libsndfile的C++示例代码如下:
#include "stdafx.h"
#include <sndfile.hh>
static void create_file (const char * fname, int format, const short* buffer,const unsigned int& len)
// file ;
int channels = 1 ; //A Mono wave file.
int srate = 48000 ;
printf ("Creating file named '%s'\n", fname) ;
SndfileHandle file = SndfileHandle (fname, SFM_WRITE, format, channels, srate) ;
int x = file.write (buffer, len) ;
static void read_file (const char * fname)
SndfileHandle file ;
file = SndfileHandle (fname) ;
const unsigned int uiBuffLen = file.channels() * file.frames();
short* data = new short [uiBuffLen] ;
memset(data,0x00,uiBuffLen);
int x = file.command(SFC_SET_SCALE_FLOAT_INT_READ, (void*)data, uiBuffLen);
file.read (data, uiBuffLen) ; //Read the audio data in the form of 16 bit short integer
//Now create a new wave file with audio data in the form of 16 bit short integers
create_file ("ConvertedFile.wav", SF_FORMAT_WAV | SF_FORMAT_PCM_16,data, (const unsigned int&)uiBuffLen) ;
//Now fill a buffer containing audio data and dump it into a file so that the same can be fed to a device expecting the raw audio data
unsigned char* bytBuffer = new unsigned char[uiBuffLen*2];
memset(bytBuffer, 0x00, uiBuffLen*2);
file.readRaw(bytBuffer, uiBuffLen*2);
FILE * pFile;
pFile = fopen ("RawAudio.dat","w");
if (pFile!=NULL)
fwrite(bytBuffer, 1, uiBuffLen*2, pFile);
fclose (pFile);
delete [] data;
delete [] bytBuffer;
int _tmain(int argc, _TCHAR* argv[])
//The sample file is a Mono file containing audio data in float format.
const char * fname = "MonoWavFile.wav" ;
read_file (fname) ;
return 0;
好吧,上面的代码可能看起来很糟糕,但我现在只是在寻找这个想法。我使用一个文件“MonoWaveFile.wav”,它是一个单声道文件,具有 32 位浮点值形式的音频数据。 我使用 libsndfile 库创建了一个新文件“ConvertedFile.wav”。该文件包含 16 位 PCM 格式的音频数据。我在媒体播放器中播放此文件,发现转换已正确完成。
然后我创建另一个文件“RawAudio.dat”来只保存音频数据,我可以使用它来将音频输入提供给设备。该文件已创建,当我将其发送到设备时,音频根本不正确。这表明我做错了什么。谁能让我知道我做错了什么?我以前从未做过这样的事情,所以如果我能得到任何帮助,我将不胜感激。
【问题讨论】:
我在这个链接上分享了 Python 和 C++ 代码:***.com/questions/43425176/… 查看简单的 4 行示例 here。 【参考方案1】:我使用了sf_open_virtual
。
我使用sf_open_virtual
填充了另一个缓冲区。然后我使用这个“另一个缓冲区”来提供 RTP 数据包。
所以我想这就是你需要的。
从 RTP 数据包到文件的其他方向我有问题。
//============================================================================
// Name : libsndfile_demo.cpp
// Author :
// Version :
// Copyright : Your copyright notice
// Description : Hello World in C++, Ansi-style
//============================================================================
#include <iostream>
#include <string.h>
#include "sndfile.h"
#include <assert.h>
#include <unistd.h>
using namespace std;
typedef struct
sf_count_t offset, length ;
unsigned char data [160] ;
VIO_DATA ;
FILE *checker;
const void* old_ptr = NULL;
static sf_count_t vfget_filelen (void *user_data)
VIO_DATA *vf = (VIO_DATA *) user_data ;
return vf->length ;
/* vfget_filelen */
static sf_count_t vfseek (sf_count_t offset, int whence, void *user_data)
VIO_DATA *vf = (VIO_DATA *) user_data ;
switch (whence)
case SEEK_SET :
vf->offset = offset ;
break ;
case SEEK_CUR :
vf->offset = vf->offset + offset ;
break ;
case SEEK_END :
vf->offset = vf->length + offset ;
break ;
default :
break ;
;
return vf->offset ;
/* vfseek */
static sf_count_t vfread (void *ptr, sf_count_t count, void *user_data)
VIO_DATA *vf = (VIO_DATA *) user_data ;
/*
** This will brack badly for files over 2Gig in length, but
** is sufficient for testing.
*/
if (vf->offset + count > vf->length)
count = vf->length - vf->offset ;
memcpy (ptr, vf->data + vf->offset, count) ;
vf->offset += count ;
return count ;
/* vfread */
static sf_count_t vfwrite (const void *ptr, sf_count_t count, void *user_data)
static int skip = 0;
//TODO: Why this is working ?!?!?!
if (skip < 1)
skip++;
return count;
//SendTo RTP packetizer instead of writing to file
fwrite(ptr, count, 1, checker);
return count ;
/* vfwrite */
static sf_count_t vftell (void *user_data)
VIO_DATA *vf = (VIO_DATA *) user_data ;
return vf->offset ;
/* vftell */
int main()
SF_INFO writing_sfinfo;
writing_sfinfo.channels = 1;
writing_sfinfo.format = SF_FORMAT_WAV | SF_FORMAT_GSM610;
writing_sfinfo.samplerate = 8000;
assert(true == sf_format_check(&writing_sfinfo));
SF_INFO reading_sfinfo;
memset(&reading_sfinfo, 0, sizeof(reading_sfinfo));
SNDFILE *input = sf_open("/home/georgi/Downloads/thank_you_60.PCMA", SFM_READ, &reading_sfinfo);
checker = fopen("/home/georgi/Downloads/checker.wav", "w+");
short file_data[reading_sfinfo.channels * 160];
int read_frames = 0;
SF_VIRTUAL_IO vio ;
// Set up pointers to the locally defined functions.
vio.get_filelen = vfget_filelen ;
vio.seek = vfseek ;
vio.read = vfread ;
vio.write = vfwrite ;
vio.tell = vftell ;
VIO_DATA vio_data ;
// Set virtual file offset and length to zero.
vio_data.offset = 0 ;
vio_data.length = 0 ;
SNDFILE *virt_file = sf_open_virtual (&vio, SFM_WRITE, &writing_sfinfo, &vio_data);
int old_length = 0;
while ((read_frames = sf_readf_short(input, file_data, 160)))
sf_writef_short(virt_file, file_data, read_frames);
sf_close(virt_file);
sf_close(input);
fclose(checker);
return 0;
【讨论】:
以上是关于在 C++ 中使用 libsndfile 从 WAV 文件中提取原始音频数据的主要内容,如果未能解决你的问题,请参考以下文章
如何从 MATLAB 的 audioread 等 libsndfile 库中读取数组格式的音频文件