在 C++ 中使用 libsndfile 从 WAV 文件中提取原始音频数据

Posted

技术标签:

【中文标题】在 C++ 中使用 libsndfile 从 WAV 文件中提取原始音频数据【英文标题】:Extract raw audio data from WAV files using libsndfile in C++ 【发布时间】:2013-10-11 10:29:48 【问题描述】:

我正在开发一个为某些设备提供音频输入的应用程序。设备期望以原始音频数据流(16 位,48kHz)的形式提供音频输入。因此,无论波形文件中音频数据的格式(8 位、16 位、24 位、32 位等)如何,我都想从 WAV 文件中提取原始音频数据。为此,我计划使用 libsndFile 库。我修改了libsndfile的C++示例代码如下:

#include "stdafx.h"
#include <sndfile.hh>

static void create_file (const char * fname, int format, const short* buffer,const   unsigned int& len)
   
    // file ;
    int channels = 1 ;  //A Mono wave file.
    int srate = 48000 ;

    printf ("Creating file named '%s'\n", fname) ;

    SndfileHandle file = SndfileHandle (fname, SFM_WRITE, format, channels, srate) ;

    int x = file.write (buffer, len) ;


static void read_file (const char * fname)
   
    SndfileHandle       file ;

    file = SndfileHandle (fname) ; 

    const unsigned int uiBuffLen = file.channels() * file.frames();
    short* data = new short [uiBuffLen] ;
    memset(data,0x00,uiBuffLen);

    int x = file.command(SFC_SET_SCALE_FLOAT_INT_READ, (void*)data, uiBuffLen);
    file.read (data, uiBuffLen) ;   //Read the audio data in the form of 16 bit short integer

    //Now create a new wave file with audio data in the form of 16 bit short integers
    create_file ("ConvertedFile.wav", SF_FORMAT_WAV | SF_FORMAT_PCM_16,data, (const unsigned int&)uiBuffLen) ;

    //Now fill a buffer containing audio data and dump it into a file so that the same can be fed to a device expecting the raw audio data

    unsigned char* bytBuffer = new unsigned char[uiBuffLen*2];
    memset(bytBuffer, 0x00, uiBuffLen*2);
    file.readRaw(bytBuffer, uiBuffLen*2);

    FILE * pFile;
    pFile = fopen ("RawAudio.dat","w");
    if (pFile!=NULL)
    
        fwrite(bytBuffer, 1, uiBuffLen*2, pFile);
        fclose (pFile);
           

    delete [] data;
    delete [] bytBuffer;
    

int _tmain(int argc, _TCHAR* argv[])

    //The sample file is a Mono file containing audio data in float format.
    const char * fname = "MonoWavFile.wav" ;

    read_file (fname) ;

    return 0;

好吧,上面的代码可能看起来很糟糕,但我现在只是在寻找这个想法。我使用一个文件“MonoWaveFile.wav”,它是一个单声道文件,具有 32 位浮点值形式的音频数据。 我使用 libsndfile 库创建了一个新文件“ConvertedFile.wav”。该文件包含 16 位 PCM 格式的音频数据。我在媒体播放器中播放此文件,发现转换已正确完成。

然后我创建另一个文件“RawAudio.dat”来只保存音频数据,我可以使用它来将音频输入提供给设备。该文件已创建,当我将其发送到设备时,音频根本不正确。这表明我做错了什么。谁能让我知道我做错了什么?我以前从未做过这样的事情,所以如果我能得到任何帮助,我将不胜感激。

【问题讨论】:

我在这个链接上分享了 Python 和 C++ 代码:***.com/questions/43425176/… 查看简单的 4 行示例 here。 【参考方案1】:

我使用了sf_open_virtual。 我使用sf_open_virtual 填充了另一个缓冲区。然后我使用这个“另一个缓冲区”来提供 RTP 数据包。 所以我想这就是你需要的。

从 RTP 数据包到文件的其他方向我有问题。

//============================================================================
// Name        : libsndfile_demo.cpp
// Author      : 
// Version     :
// Copyright   : Your copyright notice
// Description : Hello World in C++, Ansi-style
//============================================================================

#include <iostream>
#include <string.h>
#include "sndfile.h"
#include <assert.h>
#include <unistd.h>


using namespace std;

typedef struct
   sf_count_t offset, length ;
    unsigned char data [160] ;
 VIO_DATA ;


FILE *checker;
const void* old_ptr = NULL;

static sf_count_t vfget_filelen (void *user_data)

    VIO_DATA *vf = (VIO_DATA *) user_data ;

    return vf->length ;
 /* vfget_filelen */

static sf_count_t vfseek (sf_count_t offset, int whence, void *user_data)

    VIO_DATA *vf = (VIO_DATA *) user_data ;

    switch (whence)
       case SEEK_SET :
            vf->offset = offset ;
            break ;

        case SEEK_CUR :
            vf->offset = vf->offset + offset ;
            break ;

        case SEEK_END :
            vf->offset = vf->length + offset ;
            break ;
        default :
            break ;
         ;

    return vf->offset ;
 /* vfseek */

static sf_count_t vfread (void *ptr, sf_count_t count, void *user_data)

    VIO_DATA *vf = (VIO_DATA *) user_data ;

    /*
    **  This will brack badly for files over 2Gig in length, but
    **  is sufficient for testing.
    */
    if (vf->offset + count > vf->length)
        count = vf->length - vf->offset ;

    memcpy (ptr, vf->data + vf->offset, count) ;
    vf->offset += count ;

    return count ;
 /* vfread */

static sf_count_t vfwrite (const void *ptr, sf_count_t count, void *user_data)

    static int skip = 0;

    //TODO: Why this is working ?!?!?!
    if (skip < 1)
    
        skip++;
        return count;
    

    //SendTo RTP packetizer instead of writing to file
    fwrite(ptr, count, 1, checker);

    return count ;
 /* vfwrite */

static sf_count_t vftell (void *user_data)

    VIO_DATA *vf = (VIO_DATA *) user_data ;

    return vf->offset ;
 /* vftell */


int main()

    SF_INFO writing_sfinfo;
    writing_sfinfo.channels = 1;
    writing_sfinfo.format = SF_FORMAT_WAV | SF_FORMAT_GSM610;
    writing_sfinfo.samplerate = 8000;
    assert(true == sf_format_check(&writing_sfinfo));

    SF_INFO reading_sfinfo;
    memset(&reading_sfinfo, 0, sizeof(reading_sfinfo));

    SNDFILE *input = sf_open("/home/georgi/Downloads/thank_you_60.PCMA", SFM_READ, &reading_sfinfo);
    checker = fopen("/home/georgi/Downloads/checker.wav", "w+");

    short file_data[reading_sfinfo.channels * 160];
    int read_frames = 0;

    SF_VIRTUAL_IO vio ;

    // Set up pointers to the locally defined functions.
    vio.get_filelen = vfget_filelen ;
    vio.seek = vfseek ;
    vio.read = vfread ;
    vio.write = vfwrite ;
    vio.tell = vftell ;

    VIO_DATA vio_data ;
    // Set virtual file offset and length to zero.
    vio_data.offset = 0 ;
    vio_data.length = 0 ;


    SNDFILE *virt_file = sf_open_virtual (&vio, SFM_WRITE, &writing_sfinfo, &vio_data);

    int old_length = 0;
    while ((read_frames = sf_readf_short(input, file_data, 160)))
    
        sf_writef_short(virt_file, file_data, read_frames);
    

    sf_close(virt_file);
    sf_close(input);
    fclose(checker);

    return 0;

【讨论】:

以上是关于在 C++ 中使用 libsndfile 从 WAV 文件中提取原始音频数据的主要内容,如果未能解决你的问题,请参考以下文章

C++ libsndfile 和 mac osx

如何从 MATLAB 的 audioread 等 libsndfile 库中读取数组格式的音频文件

如何使用 libsndfile 在音频文件中打印静音?

如何从 MSVC 中的 libsndfile-1.dll 访问函数?

将原始 PCM 流通过管道传输到 libsndfile

使用 VS2010 的 libsndfile 奇怪行为