2.基于FFMPEG将PCM转为AAC

Posted Stoneshen1211

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2.基于FFMPEG将PCM转为AAC相关的知识,希望对你有一定的参考价值。

继续ffmpeg的学习之路。。。

看了雷博的PCM转AAC代码,理解了一下大致的流程以及逻辑,然后迫不及待的手敲了一遍,然后编译运行,中间遇到了一些问题,便记录一下。

一、综述

PCM转AAC,上网查询了一些资料,了解了PCM和AAC相关的概念以及一些与转码相关的参数。

1).几个参数

下面几个参数是在转码过程中比较重要的:

1.sample_fmt:
音频的格式,有AV_SAMPLE_FMT_S16、AV_SAMPLE_FMT_FLT等不同的类型,这个要根据你的音频文件的具体格式来决定。
同时,在使用最新版的ffmpeg库的时候,发现只支持AV_SAMPLE_FMT_FLT这一种格式,这一点就是遇到一个坑,会在下面描述。。。

2.sample_rate
音频的采样率,有44K, 16K, 8K等不同的参数。

3.channel_layout
音频通道布局,可以通过这个参数来确定声道的个数。

4.channels
通道的个数。有单通道,双通道,。。。等,若是双通道,那么在通过avcodec_encode_audio2接口编码出来的AVPacket中的data[0]是左声道,data[1]是右声道。

2).几个函数

下面几个函数是于音频相关的函数,记录一下。

av_get_channel_layout_nb_channels():用于确定声道的个数
av_samples_get_buffer_size():根据提供的参数来获取buf的大小
avcodec_fill_audio_frame():将缓冲区赋值到AVFream中

3 )遇到的问题

由于我是在linux下编译运行的程序,使用的是最新的ffmpeg库,所以在使用雷博的代码的时候,有些小的地方做了些改动。
1.宏改动
CODEC_CAP_DELAY这个宏在最新的代码中已经不存在了,用AV_CODEC_CAP_DELAY来替代

2.格式问题
将雷博的代码运行后,会出现这个问题:

./test
[aac @ 0x17f5e40] Specified sample format s16 is invalid or not supported
can not open encoder!

提示不支持AV_SAMPLE_FMT_S16这个格式,这就尴尬了,然后便打印一下解码器支持的什么格式:

    pCodec = avcodec_find_encoder(pCodecCtx->codec_id);
    printf("---------------->%d\\n",pCodec->sample_fmts[0]);

打印出来的值是8,即枚举AV_SAMPLE_FMT_FLTP。

上网百度了下,说是最新的ffmpeg,16年以后,就只支持这一种AAC音频格式,所以想对PCM进行编码需要确定PCM是AV_SAMPLE_FMT_FLTP类型的。

但是,我的测试音频不是AV_SAMPLE_FMT_FLTP格式的,于是便查找有没有别的替代方法,上网查了查,遇到同样问题的人很多,但是解决办法只找到一种,如下:

    pCodec = avcodec_find_encoder_by_name("libfdk_aac");
    //pCodec = avcodec_find_encoder(pCodecCtx->codec_id);

4)其他

根据前一篇YUV420转jpg的思路,主要采用两种方法,第一种就是标准的编码,然后写到AVFormatContext输出文件中去,第二种则是将编码过来的AVPacket里面的数据直接写到文件中去。

二、代码

1)方法1


int flush_encoder(AVFormatContext * fmt_ctx, unsigned int stream_index)

    int ret = 0;
    int got_frame = 0;
    AVPacket enc_pkt;

    if (!(fmt_ctx->streams[0]->codec->codec->capabilities & AV_CODEC_CAP_DELAY))
        return 0;

    while(1)
    
        enc_pkt.data = NULL;
        enc_pkt.size = 0;
        av_init_packet(&enc_pkt);
        ret = avcodec_encode_audio2(fmt_ctx->streams[stream_index]->codec, &enc_pkt, NULL, &got_frame);
        if (ret < 0)
            break;
        if (!got_frame)
        
            ret = 0;
            break;
        

        printf("Flush Encoder: Succeed to encode 1 frame!\\tsize:%5d\\n",enc_pkt.size);

        ret = av_write_frame(fmt_ctx, &enc_pkt);
        if (ret < 0)
            break;
    

    return ret;


int PCM_2_AAC_1(char* pFile)

    if (NULL == pFile) return -1;

    AVFormatContext* pFormatCtx;
    AVStream* audio_st;
    AVCodecContext* pCodecCtx;
    AVCodec* pCodec;
    AVOutputFormat* fmt;
    AVPacket pkt;
    AVFrame * pFrame;

    int ret = 0;
    int size =0;
    unsigned char* frame_buff = NULL;

    FILE* in_file = fopen(pFile, "rb");
    char* out_file = "test_1.aac";

    av_register_all();

    pFormatCtx = avformat_alloc_context();
    fmt = av_guess_format(NULL, out_file, NULL);
    pFormatCtx->oformat = fmt;

    audio_st = avformat_new_stream(pFormatCtx, NULL);
    if (NULL == audio_st)
    
        printf("init avstream error!\\n");
        return -1;
    

    if (avio_open(&pFormatCtx->pb,  out_file, AVIO_FLAG_READ_WRITE) < 0)
    
        printf("open output file error!\\n");
        return -1;
    

    pCodecCtx = audio_st->codec;
    pCodecCtx->codec_id = fmt->audio_codec;
    pCodecCtx->codec_type = AVMEDIA_TYPE_AUDIO;
    pCodecCtx->sample_fmt = AV_SAMPLE_FMT_S16;
    pCodecCtx->sample_rate = 44100;
    pCodecCtx->channel_layout = AV_CH_LAYOUT_STEREO;
    pCodecCtx->channels = av_get_channel_layout_nb_channels(pCodecCtx->channel_layout);
    pCodecCtx->bit_rate = 64000;

    pCodec = avcodec_find_encoder(pCodecCtx->codec_id);
    //pCodec = avcodec_find_encoder_by_name("libfdk_aac");
    if (NULL == pCodec)
    
        printf("can not find encoder!\\n");
        return -1;
    

    if (avcodec_open2(pCodecCtx,  pCodec, NULL) < 0)
    
        printf("can not open encoder!\\n");
        return -1;
    

    pFrame = av_frame_alloc();
    pFrame->nb_samples = pCodecCtx->frame_size;
    pFrame->format = pCodecCtx->sample_fmt;

    size = av_samples_get_buffer_size(NULL, pCodecCtx->channels, pFrame->nb_samples, pFrame->format, 1);
    frame_buff = (char *)av_malloc(size);
    avcodec_fill_audio_frame(pFrame, pCodecCtx->channels, pCodecCtx->sample_fmt, frame_buff, size, 1);

    avformat_write_header(pFormatCtx, NULL);

    av_new_packet(&pkt,  size);

    int i = 0;
    int framenum = 1000;
    int got_frame = 0;

    for (i = 0; i < framenum; i++)
    
        if (fread(frame_buff, 1, size, in_file) <= 0)
        
            printf("failed to read raw data!\\n");
            return -1;
        
        else if (feof(in_file))
        
            break;
        

        pFrame->data[0] = frame_buff;

        pFrame->pts = i * 100;

        got_frame = 0;

        ret = avcodec_encode_audio2(pCodecCtx, &pkt, pFrame, &got_frame);
        if (ret < 0)
        
            printf("failure to encode!\\n");
            return -1;
        
        if (got_frame == 1)
        
            printf("success to encode 1 frame!\\tsize:%5d\\n", pkt.size);
            pkt.stream_index = audio_st->index;
            ret = av_write_frame(pFormatCtx, &pkt);
            av_free_packet(&pkt);
        
    

    ret = flush_encoder(pFormatCtx,0);
    if (ret < 0)
    
        printf("flush encoder error!\\n");
        return -1;
    

    av_write_trailer(pFormatCtx);

    avcodec_close(audio_st->codec);
    av_free(pFrame);
    av_free(frame_buff);
    avio_close(pFormatCtx->pb);
    avformat_free_context(pFormatCtx);
    fclose(in_file);

    return 0;

2)方法2

int PCM_2_AAC_2(char* pFile)

    if (NULL == pFile)
        return -1;

    AVCodecContext* pCodecCtx = NULL;
    AVCodec * pCodec = NULL;
    AVPacket pkt;
    AVFrame* pFrame = NULL;

    int size = 0;
    char* frame_buff = NULL;
    //int cnt = 0;
    int got_frame = 0;
    int ret = -1;
    FILE* out_file = NULL;
    FILE* in_file = NULL;

    in_file = fopen(pFile, "rb");
    if (NULL == in_file)
    
        printf("open in file error!\\n");
        ret = -1;
        return ret;
    

    out_file =  fopen("test.aac", "wb");
    if (NULL == out_file)
    
        printf("open out file error!\\n");
        goto ERR_3;
    

    avcodec_register_all();

    pCodecCtx = avcodec_alloc_context3(NULL);
    if (NULL == pCodecCtx)
    
        printf("alloc AVCodecContext failure!\\n");
        ret = -1;
        goto ERR_2;
    

    pCodecCtx->codec_id = AV_CODEC_ID_AAC;
    pCodecCtx->codec_type = AVMEDIA_TYPE_AUDIO;
    pCodecCtx->sample_fmt = AV_SAMPLE_FMT_FLT;//AV_SAMPLE_FMT_S16;
    pCodecCtx->sample_rate = 44100;
    pCodecCtx->channel_layout = AV_CH_LAYOUT_STEREO;
    pCodecCtx->channels = av_get_channel_layout_nb_channels(pCodecCtx->channel_layout);
    pCodecCtx->bit_rate = 64000;

    //pCodec = avcodec_find_encoder(pCodecCtx->codec_id);
    pCodec = avcodec_find_encoder_by_name("libfdk_aac");
    if (NULL == pCodec)
    
        printf("can not find encoder!\\n");
        ret = -1;
        goto ERR_1;
    

    if (avcodec_open2(pCodecCtx, pCodec, NULL) < 0)
    
        printf("open encoder error!\\n");
        ret = -1;
        goto ERR_1;
    

    pFrame = av_frame_alloc();
    pFrame->nb_samples = pCodecCtx->frame_size;
    pFrame->format = pCodecCtx->sample_fmt;

    size = av_samples_get_buffer_size(NULL, pCodecCtx->channels, pFrame->nb_samples, pFrame->format, 1);
    frame_buff = (char *)av_malloc(size);

    avcodec_fill_audio_frame(pFrame, pCodecCtx->channels, pCodecCtx->sample_fmt,(const uint8_t*)frame_buff, size, 1);

    av_init_packet(&pkt);
    pkt.data = NULL;
    pkt.size = 0;
    memset(frame_buff, 0, size);
    int i =0;

    while((fread(frame_buff, 1, size, in_file)) > 0)
    
        pFrame->pts = i++;
        if (avcodec_encode_audio2(pCodecCtx, &pkt, pFrame, &got_frame) >= 0)
        
            if (got_frame)
            
                fwrite(pkt.data, 1, pkt.size, out_file);
                av_free_packet(&pkt);
            
            else
            
                continue;
            
        
        else
        
            printf("encode audio error!\\n");
            ret = -1;
            goto ERR_1;
        

        memset(frame_buff,0, size);
    

    //fresh
    pkt.data = NULL;
    pkt.size = 0;
    while(1)
    
            if (avcodec_encode_audio2(pCodecCtx, &pkt, NULL, &got_frame) >= 0)
            
            if (got_frame)
            
                fwrite(pkt.data, 1, pkt.size, out_file);
                av_free_packet(&pkt);
            
            else
            
                break;
                       
        
        else
        
            printf("fresh encode audio error!\\n");
            ret = -1;
            goto ERR_1;
        
    

    ERR_1:
    av_freep(&pFrame->data[0]);
    //av_freep(frame_buff);
    av_frame_free(pFrame);
    avcodec_close(pCodecCtx);
    avcodec_free_context(&pCodecCtx);
    ERR_2:
    fclose(out_file);
    ERR_3:
    fclose(in_file);

    return ret;

以上是关于2.基于FFMPEG将PCM转为AAC的主要内容,如果未能解决你的问题,请参考以下文章

音视频开发8. 使用ffmpeg 将pcm转码aac实践(C++)

音视频开发8. 使用ffmpeg 将pcm转码aac实践(C++)

如何使用 FFmpeg (C/C++) 将原始 pcm_f32le 音频编码为 AAC 编码音频?

iOS语音对讲(三)FFmpeg实时解码AAC并播放PCM

Android FFMPEG 开发Android 中使用 FFMPEG 将 PCM 音频采样转为 MP3 格式

ffmpeg 将mp3文件转成aac文件