1.一种两阶段的学术视频关键帧提取方法,其特征在于,包括如下步骤:
S1:视频帧分解,按照帧率固定比例对其进行等间隔拆分,并读取场景文本图像数据集;
S2,构建两阶段的关键帧提取模型,将视频帧图像送入所述关键帧提取模型经Stage1模块和Stage2模块处理后得到关键帧集,所述关键帧提取模型包括:Stage1模块,所述Stage1模块以场景文本图像数据集为数据来源扩充数据集,该阶段首次搭建以胶囊网络CapsNet为基础的学术视频字幕检测模型,并引入软池化、空洞卷积以及压缩激励模块来完成特征增强和特征筛选,使网络能够学习到更丰富的图像特征,以完成学术视频字幕的检测和定位;
Stage2模块,所述Stage2模块以Stage1的处理结果为输入,构建时空字幕自适应采样线,利用学术视频字幕边界坐标获取更多样的学术视频时空字幕采样,以得到更具代表性的字幕累积统计值;
S3,构建视频字幕检测模型进行字幕检测,包括:
将所述场景文本图像数据集,通过堆叠的空洞卷积层来进行特征增强,以得到卷积特征图;
将所述卷积特征图,通过压缩激励模块进行全局平均池化和全连接操作来完成特征筛选,以得到改善的特征表示;
将改善的特征表示,通过胶囊层和自适应矩估计下的路由算法来完成字幕检测,最后输出字幕区的8值坐标点;
S4,构建关键帧集提取算法,利用字幕边界坐标迭代进行学术视频自适应时空采样线的选取,并以此构建自适应时空累积,最后利用Flag双值标定完成学术视频的关键帧集提取;
S5,利用S3和S4训练测试所得的关键帧提取模型对输入视频执行上述S1和S2,根据学术视频时空字幕像素累积值标定字幕帧阈值区间,进而获得关键帧集合。
2.根据权利要求1所述的两阶段的学术视频关键帧提取方法,其特征在于,完成所述视频帧分解,其中帧率固定比例是指在完成视频信息分析的基础上,选取帧率的三分之一为采样间隔,等间隔抽取视频帧以构成待处理的视频帧序列。