视频编码原理及Gstreamer 硬编码代码实现

Posted 基层搬砖的Panda

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了视频编码原理及Gstreamer 硬编码代码实现相关的知识,希望对你有一定的参考价值。

背景

业务需要对原始YUV数据进行硬编码然后通过第三方库推送到Web端。网上找了很多资料,没有找到对Gstreamer硬编码的详细介绍。这里记录下自己的实现,附完整代码。

一、视频编码基础知识

像素点的英文叫Pixel(缩写为PX)。Pixel是由 Picture(图像) 和 Element(元素)这两个单词简化而来。像素是图像显示的基本单位。

我们通常说一幅图片的大小,例如是1920×1080,就是长度为1920个像素点,宽度为1080个像素点。乘积是2,073,600,也就是说,这个图片是两百万像素的。1920×1080,这个也被称为这幅图片的分辨率。

那么视频是怎么来的? 相信大家从小都看过动画片, 没错,大量的图片连续起来快速播放,就是我们看到的视频了。衡量视频用的是什么指标参数呢? 最主要的一个,就是帧率(Frame Rate)。在视频中,一个帧(Frame)就是指一幅静止的画面。帧率,就是指视频每秒钟包括的画面数量(FPS,Frame per second)。

二、什么是视频编码?

视频编码:就是将一种视频格式,转换成另一种视频格式。

有了视频之后,就涉及到两个问题:一个是如何存储视频数据; 另一个是如何传输视频数据。视频编码主要为了压缩,减少体积,利于传输

为什么要对视频进行编码呢?不编码可以吗?为了解释这个问题,我们通过计算来了解下未经编码的原始音视频,数据量到底有多大,以一个分辨率 1920×1280,帧率为 30 的视频为例:

每帧图片:1920×1280=2,073,600(Pixels 像素),每个像素点是 24bit(RGB三原色,每种颜色占1个字节,总共24 bits);总共:2073600 × 24 = 49766400 bit,1 byte(字节)= 8 bit(位);

也就是说一个分辨率 1920×1280大小的图片就是:49766400 bit = 6220800 byte ≈ 6.22 MB,再乘以帧率 30,每秒视频的大小是 186.6MB,每分钟大约是 11GB,一部 90 分钟的电影,约是 1000GB。

恐怖吧?就算你现在电脑硬盘是4TB的(实际也就3600GB),也放不下几部学习资料,手动狗头。不仅要存储,还要传输,不然视频从哪来呢? 如果按照百兆带宽网速(顶格下载速率=12.5MB/s),下刚才那部电影,整整需要22个小时!!!

二、完整代码示例

#include <iostream>
#include <string>
#include <gst/gst.h>

typedef struct _custom_data
   
    GstElement *pipeline,
        *source, *h264_encoder, *filter, *video_tee, *save_queue, *push_queue, *file_sink, *app_sink;
    string ChannelId;
    int frameCnt;
 CustomData;

GstFlowReturn InitGstElements(CustomData *data)

    GstFlowReturn retVal;

    GstPad *tee_save_pad, *tee_push_pad;
    GstPad *queue_save_pad, *queue_push_pad;

    /* Create the elements */
    data->source = gst_element_factory_make("appsrc", "source");
    data->video_tee = gst_element_factory_make("tee", "video_tee");

    // nvh264enc: Encode H.264 video streams using NVIDIA's hardware-accelerated NVENC encoder API
    data->h264_encoder = gst_element_factory_make("nvh264enc", "h264_encoder"); // 硬编码

    GstCaps *Cap = gst_caps_from_string("video/x-raw, width=640, height=480, framerate=25/1, format=YV12, interlace-mode=progressive");
    data->filter = gst_element_factory_make("capsfilter", "filter");
    g_object_set(data->filter, "caps", Cap, NULL);

    data->save_queue = gst_element_factory_make("queue", "save_queue");
    data->file_sink = gst_element_factory_make("filesink", "file_sink");

    // autovideosink, fakesink, appsink, filesink
    data->push_queue = gst_element_factory_make("queue", "push_queue");
    data->app_sink = gst_element_factory_make("appsink", "app_sink");

    /* Create the empty pipeline */
    data->pipeline = gst_pipeline_new("rtsp-encode-pipeline");

    if (!data->pipeline || !data->source || !data->h264_encoder || !data->filter || !data->file_sink || !data->video_tee || \\
        !data->save_queue || !data->push_queue || !data->app_sink)
    
        g_printerr("@@@ OpenRtsp: Not all elements could be created.\\n");
        return GST_FLOW_ERROR;
    
    g_print("================ All elements created success. ===================== \\n");

    /* Modify element properties */
    // g_object_set(G_OBJECT(source), "location", "./test.yuv", "blocksize", 3110400, NULL);
    g_object_set(G_OBJECT(data->file_sink), "location", "./output.264", NULL);
    // g_object_set(G_OBJECT(pic_sink), "location", "./pic.264", NULL);
    g_object_set(G_OBJECT(data->app_sink),
                 "sync", FALSE,
                 "emit-signals", TRUE,
                 //  "caps", gst_caps_new_simple("video/x-raw",
                 // //                              "width", G_TYPE_INT, 640,
                 // //                              "height", G_TYPE_INT, 480,
                 // //                              "framerate", GST_TYPE_FRACTION, 25, 1,
                 //                              "format", G_TYPE_STRING, VIDEO_FORMAT, NULL),
                 NULL);

    // audio_queue, *video_queue, *tee;
    /* 创建pipeline,注意此时各个组件还没有连接,只是add到管道,也就是说,add要在link之前 */
    // gst_bin_add_many(GST_BIN(data->pipeline), data->source, data->h264_encoder, data->encode_queue, data->video_tee,
    //                 data->save_queue ,data->file_sink,data->push_queue, data->app_sink, NULL);
    gst_bin_add_many(GST_BIN(data->pipeline), data->source, data->filter, data->h264_encoder, data->video_tee, \\
                data->save_queue, data->file_sink, data->push_queue, data->app_sink, NULL);

    if (gst_element_link_many(data->source, data->filter, data->h264_encoder, data->video_tee, NULL) != TRUE ||
        gst_element_link_many(data->save_queue, data->file_sink, NULL) != TRUE ||
        gst_element_link_many(data->push_queue, data->app_sink, NULL) != TRUE)
    
        g_printerr("Elements source --> file_sink could not be linked.\\n");
        gst_object_unref(data->pipeline);
        return GST_FLOW_ERROR;
    

    /* Manually link the Tee, which has "Request" pads */
    tee_save_pad = gst_element_request_pad_simple(data->video_tee, "src_%u");
    g_print("Obtained request pad %s for save branch success...\\n", gst_pad_get_name(tee_save_pad));
    queue_save_pad = gst_element_get_static_pad(data->save_queue, "sink");

    tee_push_pad = gst_element_request_pad_simple(data->video_tee, "src_%u");
    g_print("Obtained request pad %s for push branch success...\\n", gst_pad_get_name(tee_push_pad));
    queue_push_pad = gst_element_get_static_pad(data->push_queue, "sink");

    if (gst_pad_link(tee_save_pad, queue_save_pad) != GST_PAD_LINK_OK ||
        gst_pad_link(tee_push_pad, queue_push_pad) != GST_PAD_LINK_OK)
    
        g_printerr("Tee tee--> queue linked failed.\\n");
        gst_object_unref(data->pipeline);
        return GST_FLOW_ERROR;
    

    gst_object_unref(queue_save_pad);
    gst_object_unref(queue_push_pad);

    g_print("=================== All elements linked success ==================\\n");

    /* 设置 pipeline 状态为 Playing */
    GstStateChangeReturn ret = gst_element_set_state(data->pipeline, GST_STATE_PLAYING);
    if (ret == GST_STATE_CHANGE_FAILURE)
    
        g_printerr("@@@ InitGst: Unable to set the pipeline to the playing state.\\n");
        return GST_FLOW_ERROR;
    
    g_print("$$$ Start playing... \\n");


    /* 从编码器获取编码后的数据 */
    g_signal_connect(data->app_sink, "new-sample", G_CALLBACK(ReadEncodeFrame_callback), data);

    return GST_FLOW_OK;



/* Read 1 frame */
void GstStreamEncoder::ReadEncodeFrame_callback(GstElement *sink, gpointer user_data)

    if (!encoder)
        return;

    CustomData *data = (CustomData *)user_data;
    GstSample *sample = nullptr;
    gsize data_size = 0;
    gsize stream_size = 0;

    // 待填数据
    CameraStream *stream = nullptr;

    char timeStamp[16] = 0;
    int heigth = 0;
    int width = 0;
    char video_format[32] = 0;
    int framerate[2] = 0;

    // 使用pull-sample拉取视频帧,并映射到map变量,通过map拷贝出frame数据
    g_signal_emit_by_name(sink, "pull-sample", &sample);

    if (sample)
    
        // g_print("sample = 0x%0x\\n", sample);
        GstBuffer *buffer = gst_sample_get_buffer(sample);
        if (buffer)
        
            // copy buffer data into CameraStream
            GstMapInfo map;
            if (gst_buffer_map(buffer, &map, GST_MAP_READ))
            
                g_print("map data size = %lu\\n", map.size);
                // 获取 frame 信息
                
                    GstCaps *caps = gst_sample_get_caps(sample);
                    GstStructure *info = gst_caps_get_structure(caps, 0);
                    gst_structure_get_int(info, "width", &width);
                    gst_structure_get_int(info, "height", &heigth);
                    // const char *format = gst_structure_get_string(info, "format");
                    gst_structure_get_fraction(info, "framerate", &framerate[0], &framerate[1]);

                    data_size = map.size;
                    // 注意这里buffer大小,需要设置为data_size,或者malloc(data_size)
	 				char buf[4096] = 0; 
	                memcpy(buf, map.data, data_size);  // 获取解码后的数据到buf
	                // release buffer mapping
	                gst_buffer_unmap(buffer, &map)

                
                gst_buffer_unmap(buffer, &map);
            
            else
            
                g_printerr("@@@ ReadOneDecodedFrame: fgst_buffer_map error\\n");
            
        
        else
        
            g_printerr("@@@ ReadOneDecodedFrame: gst_sample_get_buffer fail\\n");
        
        // release sample reference
        gst_sample_unref(sample);
    
    else
    
        g_printerr("@@@ sample is null \\n");
    


EasyRTMP+EasyDSS实现一套完整的紧急视频回传直播与存储回放方案之EasyRTMP-iOS的AACEncoder.m文件实现音频的硬编码功能

音视频流媒体硬解码是指不使用CPU进行编码,使用显卡GPU,专用的DSP、FPGA、ASIC芯片等硬件进行编码。编码框架Video ToolBox和AudioToolbox。

EasyRTMP是结合了多种音视频缓存及网络技术的一个rtmp直播推流端,包括:圆形缓冲区(circular buffer)、智能丢帧、自动重连、rtmp协议等等多种技术,能够非常有效地适应各种平台(Windows、Linux、ARM、Android、iOS),各种网络环境(有线、wifi、4G),以及各种情况下的直播恢复(服务器重启、网络重启、硬件设备重启)。

技术图片技术图片?

调用方法

EasyRTMP_File:EasyRTMP做为RTMP推送端,将本地文件推送到RTMP流媒体服务器;

EasyRTMP_RTSP:将RTSP/RTP数据获取到本地,再通过EasyRTMP推送到RTMP服务器;

EasyRTMP-Android:Android安卓RTMP直播推流,采集安卓手机前/后摄像头、麦克风音视频推送直播;项目地址:https://github.com/EasyDSS/EasyRTMP-Android

EasyRTMP-iOS:iOS苹果RTMP直播推流,采集苹果手机前/后摄像头、麦克风音视频推送直播;项目地址

提出问题:

EasyRTMP-iOS介绍下音频硬编码的简单流程。

分析问题:

AACEncoder.m文件实现了音频的硬编码功能。

解决问题:

iOS处理音频的库是AudioToolbox,音频硬编码的流程如下:

1、创建并配置AVCaptureSession
创建AVCaptureSession,然后找到音频的AVCaptureDevice,根据音频device创建输入并添加到session,最后添加output到session。

2、创建转换器
AudioStreamBasicDescription是输出流的结构体描述,配置好outAudioStreamBasicDescription后,根据AudioClassDescription(编码器),调用AudioConverterNewSpecific创建转换器。详情见方法:

- (void) setupEncoderFromSampleBuffer:(CMSampleBufferRef)sampleBuffer
技术图片

3、获取到PCM数据并传入编码器
用CMSampleBufferGetDataBuffer获取到CMSampleBufferRef里面的CMBlockBufferRef,再通过CMBlockBufferGetDataPointer获取到_pcmBufferSize和_pcmBuffer;调用AudioConverterFillComplexBuffer传入数据,并在callBack函数调用填充buffer的方法。详情见方法:

- (void) encode:(CMSampleBufferRef)sampleBuffer
技术图片

4、得到rawAAC码流,添加ADTS头。
AudioConverterFillComplexBuffer返回的是AAC原始码流,需要在AAC每帧添加ADTS头,调用adtsDataForPacketLength方法生成,最后把数据返回推流器。

技术图片技术图片?

以上是关于视频编码原理及Gstreamer 硬编码代码实现的主要内容,如果未能解决你的问题,请参考以下文章

Android硬编码——音频编码视频编码及音视频混合

EasyRTMP+EasyDSS实现一套完整的紧急视频回传直播与存储回放方案之EasyRTMP-iOS的AACEncoder.m文件实现音频的硬编码功能

iOS8视频硬编码-压缩率关键参数设置

GStreamer 1.0 在 C 中将原始编码为 H.264

技术开发:H.265编码视频在web网页实现无插件播放应该通过软解码还是硬解码?

简单高效易用Windows/Linux/ARM/Android/iOS平台实现RTMP推送组件EasyRTMP-Android MediaCodec硬编码流程介绍