ICASSP2021:面向SCC的自适应双重树结构

Posted Dillon2015

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ICASSP2021:面向SCC的自适应双重树结构相关的知识,希望对你有一定的参考价值。

本文来自ICASSP2021论文《Adaptive Dual Tree Structure for Screen Content Coding》

在HEVC中,CTU采用四叉树方式递归划分,同一个CTU的亮度CTB和色度CTB采用相同的划分结构即单重树结构。而对于VVC,采用帧内预测模式的CTU的亮度CTB和色度CTB可以使用不同的划分方式即双重树结构。Fig.1是双重树结构的示例,蓝色和绿色分别代表亮度和色度CTB划分结果。

双重树结构对于摄像机拍摄的内容非常高效,但是对于屏幕内容色度和亮度分量都包含大量尖锐的边缘和丰富的纹理不适合使用双重树结构。

Fig.2中(a)和(b)分别是摄像机拍摄视频的Y分量和Cb分量。可以发现Cb分量的大部分区域都很平坦,而对应的Y分量中的区域包含了尖锐的边缘和丰富的纹理。所以对两个分量采用不同的划分方式会更高效。

Fig.3中(a)和(b)分别是屏幕内容的Y分量和Cb分量。可以发现两个分量中纹理都很丰富。所以对这类内容不适合使用双重树结构。但是有的屏幕内容中会嵌入摄像机内容,此时需要自适应决定是否使用双重树结构。

自适应双重树结构如Fig.4所示,在CTU级可以决定开启还是关闭双重树结构。为了决定CTU是否使用双重树结构,需要对两种方式都进行RDO计算选择率失真代价最小的方式,并为CTU传输一个标志位表示是否使用双重树结构。

为CTU进行RDO计算会增加大量复杂度,为了减少编码器压力可以在slice级进行控制,需要判断每个slice是否是屏幕内容。由于VTM当前的架构,编码器可以根据slice中hash值相同的块所占的百分比来确定该slice是否是屏幕内容。

实验结果

实验平台是VTM5,QP={22,27,32,37},测试序列如表1,

表2和表3分别是AI和RA配置下的实验结果,

感兴趣的请关注微信公众号Video Coding

以上是关于ICASSP2021:面向SCC的自适应双重树结构的主要内容,如果未能解决你的问题,请参考以下文章

ICASSP2021:端到端的图像编码方法

ICASSP2021:基于显著性进行目标检测的VVC编码

科技前沿丨面向知识图谱的自适应中文分词技术

MySQL中的自适应哈希索引

ICASSP2021:通过码率限制降低ME复杂度

ICASSP2021:AV1帧内模式编码改进