1.一种直播间内容标签扩散算法,其特征在于,包括以下步骤:
选取设定数量的直播间样本,并基于业务经验对直播间样本进行内容标签l的标注;
对内容标签l进行扩散,扩散的计算公式为:
其中,k是迭代的轮次,Pk(i)是直播间i在第k轮迭代时对于内容标签l的分布概率,wji是直播间j和直播间i之间的相似度权重,直播间j是直播间i的邻居,所述邻居为满足wji≥ξ的直播间j,将所有满足wji≥ξ的直播间j的集合记为N(i),ξ为设定阈值,wji是直播间j和直播间i之间的相似度;
对其它未被标记的直播间通过扩散算法得到分布概率。
2.如权利要求1所述的一种直播间内容标签扩散算法,其特征在于:对于直播间j和直播间i之间的相似度计算,计算公式为:其中,wji为直播间j和直播间i之间的相似度得分,u(j)是在设定时间段内观看过直播间j的用户集合,u(i)是在设定时间段内观看过直播间i的用户集合,|u(j)∩u(i)|表示同时观看过直播间j和直播间i的人数,|u(j)∪u(i)|表示观看过直播间j或直播间i的人数。
3.如权利要求1所述的一种直播间内容标签扩散算法,其特征在于:对于基于业务经验标注的直播间,初始化分数P0(i)=1,且已被基于业务经验标注的直播间在内容标签l的扩散中,保持分布概率为1。
4.如权利要求1所述的一种直播间内容标签扩散算法,其特征在于:所述内容标签为多个,且每个内容标签至少对应一个直播间。
5.如权利要求4所述的一种直播间内容标签扩散算法,其特征在于:对直播间标注的内容标签包括户外、游戏和颜值。
6.一种存储介质,该存储介质上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1至5任一项所述的方法。
7.一种电子设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1至5任一项所述的方法。
8.一种直播间内容标签扩散系统,其特征在于,包括:
标注模块,其用于选取设定数量的直播间样本,并基于业务经验对直播间样本进行内容标签l的标注;
计算模块,其用于对内容标签l进行扩散,扩散的计算公式为:
其中,k是迭代的轮次,Pk(i)是直播间i在第k轮迭代时对于内容标签l的分布概率,wji是直播间j和直播间i之间的相似度权重,直播间j是直播间i的邻居,所述邻居为满足wji≥ξ的直播间j,将所有满足wji≥ξ的直播间j的集合记为N(i),ξ为设定阈值,wji是直播间j和直播间i之间的相似度;
扩散计算模块,其用于对其它未被标记的直播间通过扩散算法得到分布概率。
9.如权利要求8所述的一种直播间内容标签扩散系统,其特征在于:对于直播间j和直播间i之间的相似度计算,计算公式为:其中,wji为直播间j和直播间i之间的相似度得分,u(j)是在设定时间段内观看过直播间j的用户集合,u(i)是在设定时间段内观看过直播间i的用户集合,|u(j)∩u(i)|表示同时观看过直播间j和直播间i的人数,|u(j)∪u(i)|表示观看过直播间j或直播间i的人数。
10.如权利要求8所述的一种直播间内容标签扩散系统,其特征在于:所述内容标签为多个,且每个内容标签至少对应一个直播间。