视频编解码·学习笔记6. H.264码流分析工程创建

Posted 2020-10-24 Simon_Ace

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了视频编解码·学习笔记6. H.264码流分析工程创建相关的知识，希望对你有一定的参考价值。

一、准备工作：

新建一个VS工程SimpleH264Analyzer，修改工程属性参数-> 输出目录：$(SolutionDir)bin\\$(Configuration)\\，工作目录：$(SolutionDir)bin\\$(Configuration)\\

编译一下工程，工程目录下会生成bin文件夹，其中的debug文件夹中有刚才编译生成的exe文件。将一个.264视频文件拷贝到这个文件夹中（本次使用的仍是学习笔记3中生成的.264文件）。

将这个文件作为输入参数传到工程中：属性 -> 调试 -> 命令参数：test.264 （最后那个文件名根据自己的改）

更改目录结构，并新建两个文件Stream.h Stream.cpp，更改后目录结构如下：

在Stream.h头文件中，新建一个类CStreamFile，用来表示.264文件，其中包括构造函数、私有成员变量，及自定义函数。代码如下：

#ifndef _STREAM_H_
#define _STREAM_H_
#include <vector>

class CStreamFile
{
public:
	CStreamFile(TCHAR *fileName);
	~CStreamFile();
	// Open API
	int Parse_h264_bitstream();

private:
	FILE *m_InputFile;
	TCHAR *m_fileName;
	std::vector<uint8> m_nalVec;
	
	// 用来打印日志
	void file_info();
	void file_error(int dex);
	// 提取NAL有效数据
	int find_nal_prefix();
};

#endif

在Stream.cpp文件中，实现其构造方法及成员函数：

#include "stdafx.h"
#include "Stream.h"
#include <iostream>
using namespace std;

// 构造函数完成打开文件操作
CStreamFile::CStreamFile(TCHAR * fileName)
{
	m_fileName = fileName;
	file_info();
	// 打开视频文件（只读二进制）
	_tfopen_s(&m_InputFile, m_fileName, _T("rb"));
	if (NULL == m_InputFile)
	{
		file_error(0);
	}
}

// 析构函数完成关闭文件操作
CStreamFile::~CStreamFile()
{
	if (NULL != m_InputFile)
	{
		fclose(m_InputFile);
		m_InputFile = NULL;
	}
}

int CStreamFile::Parse_h264_bitstream()
{
	return 0;
}

int CStreamFile::find_nal_prefix()
{
	return 0;
}

// 打印文件信息
void CStreamFile::file_info()
{
	if (m_fileName)
	{
		wcout << L"File name: " << m_fileName << endl;
	}
}

// 打印错误信息
void CStreamFile::file_error(int idx)
{
	switch (idx)
	{
	case 0:
		wcout << L"Error: opening input file failed." << endl;
		break;
	default:
		break;
	}
}

之后在主函数中，编写打开文件代码，测试以上代码能否正常执行：

#include "stdafx.h"
#include "Stream.h"

int _tmain(int argc, _TCHAR* argv[])
{
	CStreamFile h264stream(argv[1]);

	// 此函数作为最上层函数，执行所有功能（暂时还未写任何功能实现）
	h264stream.Parse_h264_bitstream();
    return 0;
}

编译执行后，在cmd窗口中，能够打印出文件名称，即为正确执行。

接下来，设置一个全局的头文件，用来定义所有文件中都会用到的数据类型。
在Application目录下，新建Global.h头文件，输入以下代码：

#ifndef _GLOBAL_H_
#define _GLOBAL_H_

typedef unsigned char  uint8;
typedef unsigned int   uint32;

#endif // !_GLOBAL_H_

在stdafx.h文件中，引入刚才新建的头文件：

#include "Global.h"

二、提取NAL Unit：

1. 提取NAL有效数据：

实现find_nal_prefix()函数。实现方法与学习笔记4中代码基本相同，仅修改一些变量名称。（学习笔记4中有详细讲解，这里不再说明）。Stream.cpp文件中，函数实现如下：

int CStreamFile::find_nal_prefix()
{
	uint8 prefix[3] = { 0 };
	uint8 fileByte;


	m_nalVec.clear();

	// 标记当前文件指针位置
	int pos = 0;
	// 标记查找的状态
	int getPrefix = 0;
	// 读取三个字节
	for (int idx = 0; idx < 3; idx++)
	{
		prefix[idx] = getc(m_InputFile);
		// 每次读进来的字节 都放入vector中
		m_nalVec.push_back(prefix[idx]);
	}

	while (!feof(m_InputFile))
	{
		if ((prefix[pos % 3] == 0) && (prefix[(pos + 1) % 3] == 0) && (prefix[(pos + 2) % 3] == 1))
		{
			// 0x 00 00 01 found
			getPrefix = 1;
			m_nalVec.pop_back();
			m_nalVec.pop_back();
			m_nalVec.pop_back();
			break;
		}
		else if ((prefix[pos % 3] == 0) && (prefix[(pos + 1) % 3] == 0) && (prefix[(pos + 2) % 3] == 0))
		{
			if (1 == getc(m_InputFile))
			{
				// 0x 00 00 00 01 found
				getPrefix = 2;
				m_nalVec.pop_back();
				m_nalVec.pop_back();
				m_nalVec.pop_back();
				break;
			}
		}
		else
		{
			fileByte = getc(m_InputFile);
			prefix[(pos++) % 3] = fileByte;
			m_nalVec.push_back(fileByte);
		}
	}

	return getPrefix;
}

修改Stream.cpp中Parse_h264_bitstream()函数，循环调用find_nal_prefix()函数，不断获取起始码之间数据。

int CStreamFile::Parse_h264_bitstream()
{
	int ret = 0;
	do
	{
		ret = find_nal_prefix();
	} while (ret);

	return 0;
}

对此文件编译、调试，查看以上所写代码是否有问题：
第一次循环时，文件指针移动到第一个起始码后；第二次循环时，读取到两个起始码间的有效数据，通过调试可看到如下数据，与test.264中第一组有效数据相同：

2. 提取NAL Unit 类别：

① 首先提取每一个NAL Unit的类别，修改Parse_h264_bitstream()函数如下：

int CStreamFile::Parse_h264_bitstream()
{
	int ret = 0;
	do
	{
		ret = find_nal_prefix();
		// 解析NAL UNIT
		// 第一次执行循环的时候，m_nalVec为空，因此加个判断
		if (m_nalVec.size())
		{
			// 识别NAL Unit类别
			// NAL Unit第一个字节为NAL Header，后面5位表示NAL Type（使用按位与运算，截取后面五位数据）
			uint8 nalType = m_nalVec[0] & 0x1F;
			wcout << L"NAL Unit Type: " << nalType << endl;
		}
	} while (ret);
	return 0;
}

编译运行后，结果如下：

其所对应的类型为（可从H.264官方文档，表7-1中查到）：

三、NAL Unit 解封装：

1. EBSP -> RBSP：

去除竞争校验位（详细概念看学习笔记5）
简而言之，就是去除两个连零后面的03。00 00 03 xx xx xx （其中的03即为竞争校验位，在拆包的时候需要去除）

在 CStreamFile 类中添加私有函数 void ebsp_to_rbsp();
函数实现如下：

void CStreamFile::ebsp_to_rbsp()
{
	// 00 00 03 连续两个00后面的03是防止竞争校验字节，需要去掉
	// 在序列中找03，在查看前面两个是不是00，如果是，就去掉03
	if (m_nalVec.size() < 3)
	{
		return;
	}

	for (vector<uint8>::iterator itor = m_nalVec.begin() + 2; itor != m_nalVec.end(); )
	{
		// 迭代器增长幅度为空，写在循环内部，方便删除元素
		if ((3 == *itor) && (0 == *(itor - 1)) && (0 == *(itor - 2)))
		{
			// 此处使用erase()时需要注意：
			// 1、当调用erase()后Itor迭代器就失效了，变成了一野指针
			// 2、而erase()这个函数会返回一个指针，仍指向清除元素的位置，只不过后面所有的数据都向前移动
			itor = m_nalVec.erase(itor);
		}
		else
		{
			itor++;
		}
	}

}

2. RBSP -> SODB：

这里本应还有RBSP -> SODB的部分，也就是去除 rbsp_trailing_bits ，但对于分析 NAL Body 内部语法元素不会造成实际影响，这部分暂时空缺，有兴趣的可以自己实现一下。

【对于NAL Body 编码方式的解析，会涉及熵编码知识，将在后续笔记中进行介绍。】

以上是关于视频编解码·学习笔记6. H.264码流分析工程创建的主要内容，如果未能解决你的问题，请参考以下文章

视频编解码·学习笔记8. 熵编码算法：基本算法列举 & 指数哥伦布编码

视频编解码·学习笔记12. 图像参数集（PPS）介绍

视频编解码·学习笔记5. NAL Unit 结构分析

视频编解码·学习笔记3. H.264视频编解码工程JM的下载与编解码

视频编解码·学习笔记2. H.264简介

H.264/AVC视频编解码技术详解十二解析H.264码流的宏块结构（下）：H.264帧内编码宏块的预测结构