欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2023106260143
申请人: 石家庄铁道大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-12-26
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种两阶段的学术视频关键帧提取方法,其特征在于,包括如下步骤:

S1:视频帧分解,按照帧率固定比例对其进行等间隔拆分,并读取场景文本图像数据集;

S2,构建两阶段的关键帧提取模型,将视频帧图像送入所述关键帧提取模型经Stage1模块和Stage2模块处理后得到关键帧集,所述关键帧提取模型包括:Stage1模块,所述Stage1模块以场景文本图像数据集为数据来源扩充数据集,该阶段首次搭建以胶囊网络CapsNet为基础的学术视频字幕检测模型,并引入软池化、空洞卷积以及压缩激励模块来完成特征增强和特征筛选,使网络能够学习到更丰富的图像特征,以完成学术视频字幕的检测和定位;

Stage2模块,所述Stage2模块以Stage1的处理结果为输入,构建时空字幕自适应采样线,利用学术视频字幕边界坐标获取更多样的学术视频时空字幕采样,以得到更具代表性的字幕累积统计值;

S3,构建视频字幕检测模型进行字幕检测,包括:

将所述场景文本图像数据集,通过堆叠的空洞卷积层来进行特征增强,以得到卷积特征图;

将所述卷积特征图,通过压缩激励模块进行全局平均池化和全连接操作来完成特征筛选,以得到改善的特征表示;

将改善的特征表示,通过胶囊层和自适应矩估计下的路由算法来完成字幕检测,最后输出字幕区的8值坐标点;

S4,构建关键帧集提取算法,利用字幕边界坐标迭代进行学术视频自适应时空采样线的选取,并以此构建自适应时空累积,最后利用Flag双值标定完成学术视频的关键帧集提取;

S5,利用S3和S4训练测试所得的关键帧提取模型对输入视频执行上述S1和S2,根据学术视频时空字幕像素累积值标定字幕帧阈值区间,进而获得关键帧集合。

2.根据权利要求1所述的两阶段的学术视频关键帧提取方法,其特征在于,完成所述视频帧分解,其中帧率固定比例是指在完成视频信息分析的基础上,选取帧率的三分之一为采样间隔,等间隔抽取视频帧以构成待处理的视频帧序列。