Adaptive fast intra prediction for highefficiency video coding
文件大小:
1319k
资源说明:在本文中,将介绍高效率视频编码(HEVC)中的一种快速帧内预测算法,该算法通过利用相邻编码单元(coding units)的模式相关性来实现。提出的方法通过两部分实现:如果相邻编码单元之间的结构相似性(SSIM)满足阈值条件,则当前编码单元的预测模式和分割结构将直接继承其最优预测编码单元。如果第一种情况不发生,采用包含绝对差之和(Sum of Absolute Difference,SAD)和绝对哈达玛变换差之和(Sum of Absolute Hadamard Transformed Difference,SATD)准则的自适应阈值方法来进行两步粗略模式决策,以基于HEVC测试模型(HEVC Test Model,HM)编码器加速帧内模式决策过程。此外,还考虑了最可能模式(Most Probable Mode,MPM),指的是当前预测单元(Prediction Units,PUs)周围的已编码左侧和上方预测单元的最优预测模式。实验结果显示,所提出的算法平均可以节省30.18%的编码时间,且损失可以忽略不计。
为了更深入地理解这项研究成果,我们首先需要了解HEVC标准。HEVC,即H.265标准,是由国际电信联盟视频编码专家组(ITU-T)和国际标准化组织/国际电工委员会运动图像专家组(ISO/IEC MPEG)联合制定的视频编码标准。其旨在比其前身H.264/AVC编码标准具有更高的压缩效率,同时保持相同的视频质量,或者在相同比特率下提供更高的视频质量。
视频编码是将视频内容转换成更易于存储和传输的形式的技术。在HEVC中,视频帧首先被分割成编码树单元(CTUs),然后进一步细分为编码单元(CUs)、预测单元(PUs)和变换单元(TUs)。编码单元是帧内预测、帧间预测和变换编码的基本单元。帧内预测是指使用当前帧中已编码区域的信息来预测当前编码区域的技术。
帧内预测算法通常基于像素间的空间相关性,而快速帧内预测算法旨在减少计算复杂度,以降低编码时间。文章提出的算法包括两个主要部分,首先是基于相邻编码单元的结构相似性判断继承最优预测编码单元的模式和分割结构。结构相似性(SSIM)是一种衡量两幅图像相似度的指标,SSIM值越接近1,表示两幅图像越相似。
当相邻编码单元的SSIM不满足阈值条件时,算法会采用两步粗略模式决策方法,利用绝对差之和(SAD)和绝对哈达玛变换差之和(SATD)作为评价准则。这两个准则均用于计算不同预测模式下编码单元的预测误差,其中SAD计算的是像素间差值的绝对值之和,而SATD则是对预测残差进行哈达玛变换后,再进行SAD计算。哈达玛变换是一种线性变换,常用于信号处理中去除数据冗余。通过采用自适应阈值方法,可以根据实际视频内容动态调整预测模式选择的阈值,进一步提高快速模式决策的效率。
此外,算法还考虑了最可能模式(MPM),这是根据已经编码的左侧和上方预测单元的最优预测模式来确定当前预测单元的预测模式。在编码过程中,相邻的已编码块的模式信息通常会被利用来预测当前块的模式,这种方法能够大大减少需要测试的模式数量。
通过这种方法,可以有效减少编码所需的计算量,从而显著减少编码时间,同时对于视频质量的影响微乎其微。实验结果表明,所提出的快速帧内预测算法在保持视频质量的前提下,平均可以节省超过30%的编码时间。这对于视频流媒体服务、实时视频通信以及任何对编码效率有较高要求的场景具有重要意义。
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。