1.一种基于关键词推荐的视频社会关注度提高方法,其特征在于,该方法采用以下步骤实现:步骤1.获取视频初始关键词:依据给定的视频,结合用户上传视频时提供的视频初始标题关键词,提取与视频相关的K个初始关键词,构成初始关键词集合X;
步骤2.初始关键词WordNet语义扩展:将上述得到的K个初始关键词分别在WordNet上找寻语义相似的关键词,结合初始关键词集合,扩展成WordNet初步语义关键词集合;
步骤3.主流视频分享网站再扩展:利用WordNet初步语义关键词集合,在主流视频分享网站中进行搜索,提取可以吸引更多社会关注度的关键词,结合WordNet初步语义关键词集合,扩展成WordNet最终语义关键词集合;
步骤4.提取视频实体关键词集合:通过深度学习技术,挖掘视频内容信息,形成视频实体关键词集合;
步骤5.排序关键词集合:考虑关键词的相关度和社会关注度,根据关键词出现次数以及关键词与初始关键词集合的平均相关度两方面排序视频语义和实体两个关键词集合,确认最终提供给用户的关键词集。
2.根据权利要求 1所述的一种基于关键词推荐的视频社会关注度提高方法,其特征在于:在步骤3中,依据可以在多个网站上搜索到同类或者相似主题的视频信息思想,利用步骤2获得的WordNet初步语义关键词,在主流视频网站上进行搜索,依靠视频分享网站自身携带的搜索引擎和推荐系统两个能力,提取出能吸引更多社会关注度的关键词,扩展成最终的语义关键词集合。
3.根据权利要求 1所述的一种基于关键词推荐的视频社会关注度提高方法,其特征在于:在步骤4中,定长的提取视频的关键帧,以ImageNet图片集为后台,根据深度学习技术,挖掘出视频内容信息,形成视频实体关键词集合。
4.根据权利要求 1所述的一种基于关键词推荐的视频社会关注度提高方法,其特征在于步骤5具体操作过程如下:
5.1 关键词频数计算:对成WordNet最终语义关键词集合和视频实体关键词集合中的关键词分别按出现次数重新排序,整合得到各自无重复的新关键词集合,并记录每个关键词的出现次数;
5.2 NGD距离值计算:步骤5.1得到的无重复关键词集合利用公式(1)计算得到与步骤1获得的初始关键词集合的NGD距离值:其中h(t)和h(Xi)表示步骤5.1得到的无重复关键词集合中关键词t和初始关键词集合X中的关键词Xi分别在搜索引擎G中返回的搜索条数,h(t,Xi)表示同时搜索这两个关键字返回的搜索条数,N表示该搜索引擎G可以索引到的网页数;
5.3 TF-SIM排序计算:通过前两步计算得到的关键词出现次数和关键词与初始关键词集合X的NGD距离值代入公式(2)算法公式,根据计算得到的TF-SIM相似度值根据大小进行重新排序,构成新的关键词集合;
其中Tt表示关键词t出现的次数,X表示初始关键词集合,n表示初始关键词集合X中关键词的个数;
5.4 最终关键词提取:通过公式(3)计算得出构成推荐给用户的关键词集合中WordNet最终语义关键词集合和视频实体关键词集合各自给出的关键词数,最终获得所需的最相关关键词:Tn=Ts+δTs (3)
其中Tn表示需要推荐给用户的关键词数,Ts表示从语义关键词集合中提取的关键词数,δTs表示从实体关键词集合中提取的关键词数,δ为经验值。