在 LInux 上播放 PCM 音频(wav)[关闭]
Posted
技术标签:
【中文标题】在 LInux 上播放 PCM 音频(wav)[关闭]【英文标题】:Playing PCM audio (wav) on LInux [closed] 【发布时间】:2021-09-25 13:38:54 【问题描述】:我正在尝试编写一个可以直接通过 linux 声音缓冲区播放 PCM wav 文件的 C 程序。这样做的用途是将此音频与视频帧同步。例如,对于 48kHz 音频,对于 24FPS 视频,我必须每帧播放 2000 个样本,所以我需要对播放进行这种控制。
我研究了不同的库,但我想问问社区,对于这个应用程序来说,哪个是理想的、有点简单的库?如果你能指出我的示例代码的方向,那也会很有帮助。谢谢。
编辑:到目前为止,我所拥有的是基于我在网上找到的示例代码,我对其进行了一些修改,以将 .wav 文件作为参数而不是从标准输入读取。无论哪种方式,音频都在不断嗡嗡作响,显然没有播放对。
* Simple sound playback using ALSA API and libasound.
*
* Compile:
* $ cc -o play sound_playback.c -lasound
*
* Usage:
* $ ./play <sample_rate> <channels> <seconds> < <file>
*
* Examples:
* $ ./play 44100 2 5 < /dev/urandom
* $ ./play 22050 1 8 < /path/to/file.wav
*
* Copyright (C) 2009 Alessandro Ghedini <al3xbio@gmail.com>
* --------------------------------------------------------------
* "THE BEER-WARE LICENSE" (Revision 42):
* Alessandro Ghedini wrote this file. As long as you retain this
* notice you can do whatever you want with this stuff. If we
* meet some day, and you think this stuff is worth it, you can
* buy me a beer in return.
* --------------------------------------------------------------
*/
#include <alsa/asoundlib.h>
#include <stdio.h>
#define PCM_DEVICE "default"
int main(int argc, char **argv)
unsigned int pcm, tmp, dir;
int rate, channels, seconds;
snd_pcm_t *pcm_handle;
snd_pcm_hw_params_t *params;
snd_pcm_uframes_t frames;
char *buff;
int buff_size, loops;
FILE *fp;
if (argc < 5)
printf("Usage: %s <sample_rate> <channels> <seconds> <filename>\n",
argv[0]);
return -1;
rate = atoi(argv[1]);
channels = atoi(argv[2]);
seconds = atoi(argv[3]);
/* Open the PCM device in playback mode */
if (pcm = snd_pcm_open(&pcm_handle, PCM_DEVICE,
SND_PCM_STREAM_PLAYBACK, 0) < 0)
printf("ERROR: Can't open \"%s\" PCM device. %s\n",
PCM_DEVICE, snd_strerror(pcm));
/* Allocate parameters object and fill it with default values*/
snd_pcm_hw_params_alloca(¶ms);
snd_pcm_hw_params_any(pcm_handle, params);
/* Set parameters */
if (pcm = snd_pcm_hw_params_set_access(pcm_handle, params,
SND_PCM_ACCESS_RW_INTERLEAVED) < 0)
printf("ERROR: Can't set interleaved mode. %s\n", snd_strerror(pcm));
if (pcm = snd_pcm_hw_params_set_format(pcm_handle, params,
SND_PCM_FORMAT_S16_LE) < 0)
printf("ERROR: Can't set format. %s\n", snd_strerror(pcm));
if (pcm = snd_pcm_hw_params_set_channels(pcm_handle, params, channels) < 0)
printf("ERROR: Can't set channels number. %s\n", snd_strerror(pcm));
if (pcm = snd_pcm_hw_params_set_rate_near(pcm_handle, params, &rate, 0) < 0)
printf("ERROR: Can't set rate. %s\n", snd_strerror(pcm));
/* Write parameters */
if (pcm = snd_pcm_hw_params(pcm_handle, params) < 0)
printf("ERROR: Can't set harware parameters. %s\n", snd_strerror(pcm));
/* Resume information */
printf("PCM name: '%s'\n", snd_pcm_name(pcm_handle));
printf("PCM state: %s\n", snd_pcm_state_name(snd_pcm_state(pcm_handle)));
snd_pcm_hw_params_get_channels(params, &tmp);
printf("channels: %i ", tmp);
if (tmp == 1)
printf("(mono)\n");
else if (tmp == 2)
printf("(stereo)\n");
snd_pcm_hw_params_get_rate(params, &tmp, 0);
printf("rate: %d bps\n", tmp);
printf("seconds: %d\n", seconds);
/* Allocate buffer to hold single period */
snd_pcm_hw_params_get_period_size(params, &frames, 0);
buff_size = frames * channels * 2 /* 2 -> sample size */;
buff = (char *) malloc(buff_size);
snd_pcm_hw_params_get_period_time(params, &tmp, NULL);
fp = fopen(argv[4], "rb");
fseek(fp, 44, SEEK_SET);
for (loops = (seconds * 1000000) / tmp; loops > 0; loops--)
if (pcm = fgets(buff, buff_size, fp) == 0)
printf("Early end of file.\n");
return 0;
if (pcm = snd_pcm_writei(pcm_handle, buff, frames) == -EPIPE)
printf("XRUN.\n");
snd_pcm_prepare(pcm_handle);
else if (pcm < 0)
printf("ERROR. Can't write to PCM device. %s\n", snd_strerror(pcm));
snd_pcm_drain(pcm_handle);
snd_pcm_close(pcm_handle);
free(buff);
return 0;
我传入的音频文件预计在 16 个通道上以 48kHz 的速率播放。
【问题讨论】:
您是在播放视频还是来自其他程序的视频?看来您需要从某个地方获取帧同步信号,然后播放样本。 我打算在同一个程序中播放视频。理想情况下,循环将显示帧,播放 N 个(在示例 2000 中)音频样本,然后休眠一段时间 (1/FPS) 并重复。我不确定这是否可能,但这就是我一直在考虑的方式。 这个问题太宽泛了,需要建议,所以离题了。如果您开始并有一个特定的编程问题,您可以回来问它。你的计划听起来可行。 我明白,我是新手。感谢您的帮助。 我已经用一些我一直在玩的示例代码编辑了这个问题。如果它在你的球场,你介意看看吗? 【参考方案1】:这是一个杂耍答案,旨在让您意识到最终会遇到的问题,基于您(完全合理!)假设音频采样与视频的整数比率帧。
例如,对于 48kHz 音频,对于 24FPS 视频,我必须每帧播放 2000 个样本,所以我需要对播放进行这种控制。
您不可避免地会遇到的问题是,在 PC 中,如果有单独的音频和视频设备,那么声卡和显卡都有自己的时钟振荡器,并且这些振荡器并没有相互锁定其他。这意味着实际上在 PC 上,对于 24FPS 视频和 48kHz 采样率,声卡不会在一帧中播放(或记录)恰好 2000 个样本。
这只是PC架构的一个根本缺陷,不同的设备覆盖不同的媒体。
当然,如果您要通过与视频相同的设备发送音频,例如使用 HDMI、DisplayPort 或 SDI 传输视频和音频,则不会出现该基本问题。 但是对于通用硬件,你必须准备好处理它!
【讨论】:
非常感谢!我会继续研究尽可能多地同步的方法。 @newmsrd 我建议研究一下像 VLC 和 mplayer 这样的媒体播放器是如何做到的;他们显然面临着这个问题。【参考方案2】:要从 wav 文件中读取 PCM 音频,最好使用库来解码文件中的音频数据。由于您的代码没有解码音频数据,因此 wav 文件的数据听起来很嘈杂!
gtkiostream 使用 libsox 解码许多不同类型的音频文件。如果您要使用 C++,那么打开文件进行阅读并找到它的生命体征,如通道、采样率等就是这样:
int res=sox.openRead(name);
if (res<0 && res!=SOX_READ_MAXSCALE_ERROR)
return SoxDebug().evaluateError(res);
unsigned int fs;
if (sox.getFSIn()!=Playback::getSampleRate())
cout<<"sample rate mismatch, file = "<<sox.getFSIn()<<" Hz and ALSA = "<<Playback::getSampleRate()<<endl;
cout<<"fixing sample rate mismatch"<<endl;
if ((res=setSampleRate(sox.getFSIn()))<0) // set ALSA's playback saple rate
return ALSADebug().evaluateError(res);
fs=Playback::getSampleRate(); // read back ALSA's sample rate
cout<<"rates are now, file = "<<sox.getFSIn()<<" Hz and ALSA = "<<fs<<endl;
int ch=sox.getChCntIn();
cout<<"setting ALSA channels to " <<ch<<endl;
// use the ALSA function to set the channels here.
在 C 中,它会更像以下内容:
sox_format_t *in = sox_open_read(fileName.c_str(), NULL, NULL, NULL);
if (!in)
return -1; // some error like this would be better SOX_READ_FILE_OPEN_ERROR;
文件的采样率和其他各种声音文件参数可以这样找到:
in->signal.rate
in->signal.channels
现在 sox 使用 32 位字,因此您应该将 ALSA 设置为使用以下格式的 32 位字:
SND_PCM_FORMAT_S32_LE
现在使用 sox 读取“计数”数据量,如下所示:
sox_sample_t buf[count*ch];
size_t readCount=sox_read(in, buf, count);
然后您可以使用 snd_pcm_writei 将该缓冲区写入 ALSA。 不要忘记为播放设置 ALSA 的通道和采样率。
gtkIOStream ALSAPlaybackTest.C file 中提供了从许多不同类型的音频文件播放 C++ 的完整示例。
如果您想要一个好的 C 设置源,请参考 ALSA's aplay.c code。
【讨论】:
以上是关于在 LInux 上播放 PCM 音频(wav)[关闭]的主要内容,如果未能解决你的问题,请参考以下文章