1.一种基于视频流行度先验预测的边缘缓存优化方法,其特征在于,包括如下步骤:从源服务器获取用户终端上传的视频以及对应的文本信息,所述上传视频包括用户终端刚上传的待预测视频以及流行度已经平稳的视频;
从所述文本信息中提取出视频关键词,并利用词向量模型提取出视频关键词的词向量;
计算待预测视频与非该用户上传的已平稳视频的词向量相似度,选择该词向量相似度最高的若干个视频作为待预测视频的第一相关视频,并将用户最近发布的第二相关视频和非该用户上传的第一相关视频的流行度特征分别求和后求平均,将取平均的特征作为待预测视频的流行度;
从基站获取用户终端的信息,根据用户的浏览历史提取出用户的兴趣关键词,并利用词向量模型提取出兴趣关键词的词向量;
计算用户终端的兴趣关键词与视频关键词之间的词向量相似度,并根据该词向量相似度结果标记出有效用户,即标记用户对不同视频是否感兴趣;
将所述待预测视频的流行度与用户对该待预测视频的兴趣值乘积作为基站的缓存收益值,将用户对待预测视频的兴趣值作为核心网的缓存收益值;
利用缓存节点的资源限制以及缓存收益值构建出缓存决策模型,利用缓存决策模型执行视频缓存,所述缓存节点包括基站和核心网。
2.根据权利要求1所述的一种基于视频流行度先验预测的边缘缓存优化方法,其特征在于,从所述文本信息中提取出视频关键词包括提取出摘要、简介、标签、作者评语和作者粉丝数量,将标签作为第一视频关键词,将其余信息进行去扰处理,将去扰处理后的摘要、简介、作者评语和作者粉丝数量信息生成一个长文本;对该长文本进行关键词提取,提取出若干第二视频关键词。
3.根据权利要求1所述的一种基于视频流行度先验预测的边缘缓存优化方法,其特征在于,所述根据用户的浏览历史提取出用户的兴趣关键词包括抽取出用户浏览历史中的所有的文本信息,即浏览视频的标题、简介文字描述,将所有的文本信息整合一个文档中,利用TextRank算法提取出兴趣关键词,并将兴趣关键词的个数控制在5~10个。
4.根据权利要求1所述的一种基于视频流行度先验预测的边缘缓存优化方法,其特征在于,用户终端的兴趣关键词与视频关键词之间的词向量相似度的计算公式表示为:其中, 表示用户终端的兴趣关键词与视频关键词之间的词向量相似度,useri表示用户终端的编号,videoj表示视频的编号,KW(videoj)为视频videoj的视频关键词集, 表
示视频关键词 的词向量,KW(useri)为用户useri的兴趣关键词集,表示兴趣关键词 的词向量,Z为用户兴趣集中兴趣关键词总数,K为视频关键词总数。
5.根据权利要求1所述的一种基于视频流行度先验预测的边缘缓存优化方法,其特征在于,所述用户对该待预测视频的兴趣值表示为:其中, 表示视频videoj在基站BSi的用户兴趣值, 表示用户终端的兴趣关键词与视频关键词之间的词向量相似度,usert表示在基站BSi的用户终端的编号,videoj表示视频的编号, 表示用户usert的标记值,当 当
6.根据权利要求1所述的一种基于视频流行度先验预测的边缘缓存优化方法,其特征在于,所述缓存决策模型包括基站和核心网在同一时刻只能有一处缓存备份,从基站获取的时延记为c0,基站到核心网之间的时延记为c1,用户到服务器之间的时延记为c;用户请求资源时,首先从基站获取,若基站处无缓存,则从核心网处获取;若核心网处无缓存,则从源服务器获取,记缓存决策在基站的标记值为 记缓存决策在核心网处的标记值为当视频videoj缓存在基站时, 基站不缓存视频videoj时,当视频videoj缓存在核心网处时 核心网不缓存视频videoj缓存时,从源服务器获取记为 根据缓存节点的资源限制以及缓存收益值构建出缓存决策的链路代价函数,在最小化链路代价的前提下,确定出缓存决策。
7.根据权利要求6所述的一种基于视频流行度先验预测的边缘缓存优化方法,其特征在于,所述缓存决策的链路代价函数表示为:s.t.
C1:
C2:
C3:
C4:
其中,K表示视频文件的总数,其中n表示表示基站的总数,Qi表示基站BSi的容量大小,M表示EPC的容量大小,fj表示视频videoj的占用空间大小;并通过最小化求解得出缓存决策的值;
表示基站BSi缓存视频videoj的收益值; 表示视频videoj的流行度; 表示视频videoj在基站BSi的用户兴趣值; 表示基站EPC缓存视频videoj的收益值;
对于下一个缓存视频videonext,当基站和EPC处的缓存容量已满或无法在不清理空间情况下再缓存视频videonext时替换规则如下:先将最小缓存收益视频移除,若空间还不够则继续此操作。