C++使用ffmpeg硬解码

Posted yaningli

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C++使用ffmpeg硬解码相关的知识,希望对你有一定的参考价值。

转载:https://www.pudn.com/news/62bc096d405aad31f717648e.html

  • 使用ffmpeg解码video模块,支持3种解码:cpu解码、amd64平台的cuda解码和NX平台的Nvmpi解码
  • 封装库只依赖ffmpeg,测试程序中用到了OpenCV,可用于将帧送往opencv检测程序

ref:

  • https://github.com/FFmpeg/FFmpeg/blob/master/doc/examples/hw_decode.c
  • ref: https://github.com/chinahbcq/ffmpeg_hw_decode

概要

该库希望支持能在一份代码中支持CUDA GPU和CPU模式的切换,也可以选择是否只解码关键帧。主要设计思想如下:

判断是否支持CUDA GPU解码

bool support_hwdevice()

    AVHWDeviceType type;
    type = av_hwdevice_find_type_by_name(s_hwdevice_name);
    if (type == AV_HWDEVICE_TYPE_NONE)
    
        fprintf(stderr, "Device type %s is not supported.\\n", s_hwdevice_name);
        fprintf(stderr, "Available device types:");
        while ((type = av_hwdevice_iterate_types(type)) != AV_HWDEVICE_TYPE_NONE)
            fprintf(stderr, " %s", av_hwdevice_get_type_name(type));
        fprintf(stderr, "\\n");
        return false;
    
    return true;

该方法对有显卡,但不支持硬解加速的机器不适用,比如部分笔记本。

此时该函数也会返回true,但是解码时候会报 Hardware is lacking required capabilities这样的错误。

初始化

init_ctx初始化函数主要是对输入的input_ctx和用于解码的decoder_ctx初始化。

GPU解码初始化

说明:

  • 深色框为硬件解码与软解解码不一样的地方。

  • av_hwdevice_find_type_by_name()的功能是根据名称查找对应的AVHWDeviceType。

  • AVHWDeviceType表示硬件加速API的类型,比如AV_HWDEVICE_TYPE_CUDA是nvidia提供的加速API.

  • av_hwdevice_find_type_by_name支持的名称如下所示。

static const char *const hw_type_names[] = 
    [AV_HWDEVICE_TYPE_CUDA]   = "cuda",
    [AV_HWDEVICE_TYPE_DRM]    = "drm",
    [AV_HWDEVICE_TYPE_DXVA2]  = "dxva2",
    [AV_HWDEVICE_TYPE_D3D11VA] = "d3d11va",
    [AV_HWDEVICE_TYPE_OPENCL] = "opencl",
    [AV_HWDEVICE_TYPE_QSV]    = "qsv",
    [AV_HWDEVICE_TYPE_VAAPI]  = "vaapi",
    [AV_HWDEVICE_TYPE_VDPAU]  = "vdpau",
    [AV_HWDEVICE_TYPE_VIDEOTOOLBOX] = "videotoolbox",
    [AV_HWDEVICE_TYPE_MEDIACODEC] = "mediacodec",
;
  • avcodec_get_hw_config:用于获取编解码器支持的硬件配置AVCodecHWConfig。这里用于获取硬件支持的像素格式。
  • av_hwdevice_ctx_create:av_hwdevice_ctx_create创建硬件设备相关的上下文信息AVHWDeviceContext和对硬件设备进行初始化。
  • decoder_ctx->get_format = get_hw_format ,get_hw_format是向AVCodecContext注册的一个函数,用于协商支持的像素格式。

CPU解码初始化

  • cpu解码初始化与GPU不一样的是,调用avcodec_find_decoder寻找合适的decoder,并给decoder context设置类型、高和宽。

解码

  • GPU解码与CPU解码的一个区别是,GPU需要调用av_hwframe_transfer_data,该函数拷贝GPU到CPU。
  • av_hwframe_transfer_data:拷贝数据到一个硬件的surface,或者从一个硬件surface拷贝数据,也就是GPU和CPU之间数据拷贝。这里用于GPU拷贝到CPU。

格式

  • GPU解码后数据格式默认类型是从硬件读取,CUDA可能是AV_PIX_FMT_NV12;而CPU解码后的数据一般是YUV数据,比如AV_PIX_FMT_YUV420P。

参考

// ref:https://github.com/FFmpeg/FFmpeg/blob/master/doc/examples/hw_decode.c
// ref: https://github.com/chinahbcq/ffmpeg_hw_decode
// ref: https://www.jianshu.com/p/3ea9ef713211

FFmpeg 调用 Android MediaCodec 进行硬解码(附源码)

好文推荐
作者:glumes

FFmpeg 在 3.1 版本之后支持调用平台硬件进行解码,也就是说可以通过 FFmpeg 的 C 代码去调用 Android 上的 MediaCodec 了。

在官网上有对应说明,地址如下:

trac.ffmpeg.org/wiki/HWAcce…

从图中可以看到,不仅仅是 Android 上支持 MediaCodec,iOS 上也支持 VideoToolbox,连 Windows 上的 Direct3D 11 都有支持了。

注意:Android MediaCodec 目前仅支持解码,还不支持编码呢。

不过,为了验证是否可行,做个简单的演示,最后会有完整的的代码给出。

首先是 FFmpeg 的编译。它的编译有很多开关选项,要确保打开了 mediacodec 相关的选项,具体如下:

--enable-mediacodec

--enable-decoder=h264_mediacodec

--enable-decoder=hevc_mediacodec

--enable-decoder=mpeg4_mediacodec

--enable-hwaccel=h264_mediacodec

可以看出 mediacodec 支持的编码格式有 h264、hevc、mpeg4 三种可选,不在范围内的就还是考虑软解吧。

关于如何编译,就不详细阐述了,后面再专门写一篇来介绍

编译出对应的 so 之后,可以打印一下 AVCodec 支持的格式列表,看看有没有 mediacodec 。

具体代码如下:

char info[40000] = 0;

  AVCodec *c_temp = av_codec_next(NULL);

    while (c_temp != NULL) 

      if (c_temp->decode != NULL) 

    sprintf(info, "%s[Dec]", info);

   else 

    sprintf(info, "%s[Enc]", info);

        

      switch (c_temp->type) 

    case AVMEDIA_TYPE_VIDEO:

        sprintf(info, "%s[Video]", info);

              break;

                  case AVMEDIA_TYPE_AUDIO:

                          sprintf(info, "%s[Audio]", info);

                            break;

                                      default:

                                    sprintf(info, "%s[Other]", info);

                            break;

          

          sprintf(info, "%s %10s\\n", info, c_temp->name);

              c_temp = c_temp->next;


通过 AVCodec 的 next 指针进行遍历,然后打印出结果,看到下面的内容说明编译成功了。

支持的格式里面已经有了 h264_mediacodec 和 mpeg4_mediacodec 了。


接下来就进行解码了。关于 FFmpeg 解码的 API 调用,在公众号以前发布的文章中说过多次,就不详细讲解流程了,简单概况一下:

  1. 首先通过 avformat_open_input 方法打开文件,得到 AVFormatContext 。

  2. 然后通过 avformat_find_stream_info 查找文件的视频流信息。

  3. 得到文件相关信息和视频流信息,主要还是为了得到编码格式信息,然后好找到对应的解码器。也可以通过 avcodec_find_decoder_by_name 方法直接找具体的解码器。

  4. 有了解码器就可以创建解码上下文 AVCodecContext,并通过 avcodec_open2 方法打开解码器

  5. 然后通过 av_read_frame 读取文件的内容好进行下一步的解码。

  6. 接下来就是熟悉的 avcodec_send_packet 发送给解码器,avcodec_receive_frame 从解码器取回解码后的数据。

重点讲解一下调用硬件解码和普通解码的一些区别:

第一步是要在 so 加载的 JNI_OnLoad 方法中将 JavaVM 设置给 FFmpeg 。


  jint JNI_OnLoad(JavaVM *vm, void *res) 

      av_jni_set_java_vm(vm, 0);

        return JNI_VERSION_1_4;

  

缺少这一步就不能反射调用 Java 方法了。


接下来还是判断硬件解码类型支不支持,上面是通过 AVCodec 来判断的,实际上 FFmpeg 都给出了硬件类型的定义,在 AVHWDeviceType 枚举变量中。

enum AVHWDeviceType 

                    AV_HWDEVICE_TYPE_NONE,

                    AV_HWDEVICE_TYPE_VDPAU,

                    AV_HWDEVICE_TYPE_CUDA,

                    AV_HWDEVICE_TYPE_VAAPI,

                    AV_HWDEVICE_TYPE_DXVA2,

                    AV_HWDEVICE_TYPE_QSV,

                    AV_HWDEVICE_TYPE_VIDEOTOOLBOX,

                    AV_HWDEVICE_TYPE_D3D11VA,

                    AV_HWDEVICE_TYPE_DRM,

                    AV_HWDEVICE_TYPE_OPENCL,

                    AV_HWDEVICE_TYPE_MEDIACODEC,

                    AV_HWDEVICE_TYPE_VULKAN,

    ;

通过 av_hwdevice_get_type_name 方法可以将这些枚举值转换成对应的字符串,比如 AV_HWDEVICE_TYPE_MEDIACODEC 对应的字符串就是 mediacodec ,其实在源码里面也是有的:

static const char *const hw_type_names[] = 

                    [AV_HWDEVICE_TYPE_CUDA] = "cuda",

                    [AV_HWDEVICE_TYPE_DRM] = "drm",

                    [AV_HWDEVICE_TYPE_DXVA2] = "dxva2",

                    [AV_HWDEVICE_TYPE_D3D11VA] = "d3d11va",

                    [AV_HWDEVICE_TYPE_OPENCL] = "opencl",

                    [AV_HWDEVICE_TYPE_QSV] = "qsv",

                    [AV_HWDEVICE_TYPE_VAAPI] = "vaapi",

                    [AV_HWDEVICE_TYPE_VDPAU] = "vdpau",

                    [AV_HWDEVICE_TYPE_VIDEOTOOLBOX] = "videotoolbox",

                    [AV_HWDEVICE_TYPE_MEDIACODEC] = "mediacodec",

                    [AV_HWDEVICE_TYPE_VULKAN] = "vulkan",

  ;

和遍历 AVCodec 一样,也要遍历 FFmpeg 是否支持 mediacodec 。

type = av_hwdevice_find_type_by_name(mediacodec);

    if (type == AV_HWDEVICE_TYPE_NONE) 

        LOGE("Device type %s is not supported.\\n", mediacodec);

          LOGE("Available device types:");

          while((type = av_hwdevice_iterate_types(type)) != AV_HWDEVICE_TYPE_NONE)

          LOGE(" %s", av_hwdevice_get_type_name(type));

      LOGE("\\n");

        return -1;


确定支持 mediacodec ,那么解码就可以用了。前面提到,获取文件信息主要是为了打开解码器的,但比如文件编码格式的 H.264 ,而支持 H.264 的解码器除了软解,还有 mediacodec 要怎么选择呢?

为了方便,直接 avcodec_find_decoder_by_name 找到 mediacodec 的解码器就行。

if (!(decoder = avcodec_find_decoder_by_name("h264_mediacodec"))) 

      LOGE("avcodec_find_decoder_by_name failed.\\n");

        return -1;


找到解码器之后,还要得到该解码器的一些配置信息,比如解码出的格式是什么样子的?mediacodec 解码就是 NV21 这种。

for (i = 0;; i++) 

    // 解码器的配置

      const AVCodecHWConfig *config = avcodec_get_hw_config(decoder, i);

        if (!config) 

          LOGE("Decoder %s does not support device type %s.\\n",

            decoder->name, av_hwdevice_get_type_name(type));

      return -1;

    

          if (config->methods & AV_CODEC_HW_CONFIG_METHOD_HW_DEVICE_CTX &&

            config->device_type == type) 

          // 硬解的格式

          hw_pix_fmt = config->pix_fmt;

          break;

      

  

目前 mediacodec 解码还只有 buffer 模式,没有直接解纹理的那种。

接下来就是给解码上下文 AVCodecContext 添加一些硬件解码的上下文。

static int hw_decoder_init(AVCodecContext *ctx, const enum AVHWDeviceType type)

  

    int err = 0;

      if ((err = av_hwdevice_ctx_create(&hw_device_ctx, type,

        NULL, NULL, 0)) < 0) 

            LOGE("Failed to create specified HW device.\\n");

          return err;

      

      // 硬解解码的上下文

    ctx->hw_device_ctx = av_buffer_ref(hw_device_ctx);

      return err;

   

完成了这一系列操作之后,就是正常的解码了,拿到解码后的 AVFrame 内容。

如果 AVFrame 格式和硬件解码的配置格式一样,那么要用 av_hwframe_transfer_data 方法将它做一下转换,转成正常的 YUV 格式。


if (frame->format == hw_pix_fmt) 

    /* retrieve data from GPU to CPU */

      if ((ret = av_hwframe_transfer_data(sw_frame, frame, 0)) < 0) 

        LOGE("Error transferring the data to system memory\\n");

        goto fail;

    

        tmp_frame = sw_frame;

     else

      tmp_frame = frame;

等完成这一些操作之后,就已经解码成功了,实际运行也是 OK 的。

以上是关于C++使用ffmpeg硬解码的主要内容,如果未能解决你的问题,请参考以下文章

OpenCV4.7.0FFmpeg5.1 2080TI视频硬解码

ffmpeg 硬解码

ffmpeg解码后的视频帧怎样显示出来

使用ffmpeg实现对h264视频解码 -- (实现了一个易于使用的c++封装库)

[音视频处理] FFmpeg使用指北1-视频解码

ffmpeg + cuda(cuvid) 硬解码+像素格式转换(cpu主导)实战