欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 202410142922X
申请人: 重庆邮电大学
专利类型:发明专利
专利状态:已下证
专利领域: 电通信技术
更新日期:2025-12-26
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于内容划分的VVC SCC快速模式决策方法,其特征在于,包括:

S1:在VTM编码器每帧图像编码开始阶段,将视频帧亮度分量分割成64x64的CU;

S2:设计模式决策模型并对其进行训练;所述模式决策模型包括卷积层、内容预测子网络以及模式预测子网络;

所述模式决策模型,包括:6个非重叠的卷积层Conv1~Conv6、5个内容预测子网络C-Net1~C-Net5以及5个模式预测子网络M-Net1~M-Net5;

所述6个非重叠的卷积层Conv1~Conv6卷积核大小都为2x2,步长都为2x2,卷积核个数依次为16、32、64、128、256、512,每层卷积层输出的特征向量Feature Map的感受野依次为2x2,4x4、8x8、16x16、32x32、64x64;

所述内容预测子网络C-Net1~C-Net4均包括1层Flatten层、4层Content FC层;其中,C-Net1在Flatten层前还设置有3层非对称卷积层AsConv1~3,其卷积核大小和步长均为2x1、卷积核个数依次为64、128、256,C-Net2在Flatten层前还设置有2层非对称卷积层AsConv1~3,其卷积核大小和步长均为2x1、卷积核个数依次为128、256,C-Net3在Flatten层前还设置有1层非对称卷积层AsConv1~3,其卷积核大小和步长均为2x1、卷积核个数为256;所述非对称卷积层AsConv的卷积核大小和步长均为2x1;所述内容预测子网络C-Net5包括Flatten层、3层Content FC层;

所述Flatten层用于将卷积层的输出拉平;

所述Content FC层使用拉平后的特征作为输入,预测出内容的概率,所述内容预测子网络C-Net1~C-Net4的Content FC层节点个数依次为128、64、32、4个,所述内容预测子网络C-Net5的Content FC层节点个数依次为128、32、4个;

所述5个模式预测子网络M-Net1~M-Net5包括屏幕内容TGM的模式预测网络和动画内容A的模式预测网络;所述屏幕内容TGM的模式预测网络和动画内容A的模式预测网络由多层卷积层、1层Flatten层以及3层全连接层组成,用于预测编码模式Intra、PLT、IBC的概率;

所述动画内容A的模式预测网络在全连接层分为第一、第二子网络;所述第一子网络采用Mode FCI全连接件层,用于预测Intra模式的概率;所述第二子网络采用Mode FCS全连接件层,用于预测IBC或者PLT模式的概率;

S3:将64x64的CU输入卷积层生成特征图,并通过内容预测子网络预测该CU的类别概率,根据概率值将他们分类为屏幕内容TGM、自然内容CC、动画内容A、混合内容Mixed;

S4:若CU的类别为混合内容Mixed,将对应大小的特征图重新送入对应大小的内容预测子网络继续预测内容,直到不为Mixed预测终止;

S5:对于分类为自然内容CC的CU,直接选择Intra模式,跳过IBC和PLT模式;

S6:对于分类为动画内容A和屏幕内容TGM的CU,进一步将其特征图送入模式预测子网络预测每个模式的概率,由于动画内容A和自然内容CC最佳模式分布不一样,屏幕内容TGM预测器直接预测Intra、IBC以及PLT模式的概率,动画内容A则在全连接层分为两个子网络,分辨是否为Intra模式,如果不是Intra模式再进入第二个子网络预测是IBC或者PLT概率;

S7:根据动画内容A和屏幕内容TGM的CU的编码概率值进行最优模式决策。

2.根据权利要求1所述的一种基于内容划分的VVC SCC快速模式决策方法,其特征在于,所述屏幕内容TGM的模式预测网络和动画内容A的模式预测网络的多层卷积层对于不同的同尺寸的CU具有不同的结构。

3.根据权利要求1所述的一种基于内容划分的VVC SCC快速模式决策方法,其特征在于,对设计模式决策模型进行训练,包括:在训练过程中,通过使用8192的批处理大小来优化计算资源,在数据加载后,归一化像素值,选择Adam优化器,并设置了动量值为0.9和0.999,学习率被设置为0.001,训练进行300个epoch,损失函数采用了交叉熵。

4.根据权利要求1所述的一种基于内容划分的VVC SCC快速模式决策方法,其特征在于,根据动画内容A和屏幕内容TGM的CU的编码概率值进行最优模式决策,包括:屏幕内容TGM的CU直接对概率进行排序,从大到小选择前n个模式的概率并计算前n个模式的概率和s,直到选择模式的概率和大于阈值0.8停止选择,得到当前最优编码模式;动画内容A的CU编完Intra模式后,如果Intra的概率大于阈值0.9则跳过IBC和PLT,否则,对IBC和PLT的概率排序,从大到小选择模式,直到选择模式的概率和大于阈值0.6,得到当前最优编码模式。

5.根据权利要求4所述的一种基于内容划分的VVC SCC快速模式决策方法,其特征在于,计算前n个模式的概率和s,包括:其中,s表示前n个模式的概率和,pi表示第i个模式的概率。