1.一种直播间内容标签扩散方法,其特征在于,包括以下步骤:选取设定数量的直播间样本,并基于业务经验对直播间样本进行内容标签l的标注,所述业务经验为直播平台在运营的过程中,对不同内容的直播间进行的人为分类划分过程中,所掌握的直播间与内容标签间对应关系的经验;
对内容标签l进行扩散,扩散的计算公式为:其中,k是迭代的轮次,Pk(i)是直播间i在第k轮迭代时对于内容标签l的分布概率,Pk‑1(j)是直播间j在第k‑1轮迭代时对于内容标签l的分布概率,直播间j是直播间i的邻居,所述邻居为满足wji≥ξ的直播间j,将所有满足wji≥ξ的直播间j的集合记为N(i),ξ为设定阈值,wji是直播间j和直播间i之间的相似度得分;
对其它未被标记的直播间通过扩散算法得到分布概率;
其中,对于直播间j和直播间i之间的相似度计算,计算公式为:其中,wji为直播间j和直播间i之间的相似度得分,u(j)是在设定时间段内观看过直播间j的用户集合,u(i)是在设定时间段内观看过直播间i的用户集合,|u(j)∩u(i)|表示同时观看过直播间j和直播间i的人数,|u(j)∪u(i)|表示观看过直播间j或直播间i的人数。
2.如权利要求1所述的一种直播间内容标签扩散方法,其特征在于:对于基于业务经验标注的直播间,初始化分数P0(i)=1,且已被基于业务经验标注的直播间在内容标签l的扩散中,保持分布概率为1。
3.如权利要求1所述的一种直播间内容标签扩散方法,其特征在于:所述内容标签为多个,且每个内容标签至少对应一个直播间。
4.如权利要求3所述的一种直播间内容标签扩散方法,其特征在于:对直播间标注的内容标签包括户外、游戏和颜值。
5.一种存储介质,该存储介质上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1至4任一项所述的方法。
6.一种电子设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1至4任一项所述的方法。
7.一种直播间内容标签扩散系统,其特征在于,包括:标注模块,其用于选取设定数量的直播间样本,并基于业务经验对直播间样本进行内容标签l的标注,所述业务经验为直播平台在运营的过程中,对不同内容的直播间进行的人为分类划分过程中,所掌握的直播间与内容标签间对应关系的经验;
计算模块,其用于对内容标签l进行扩散,扩散的计算公式为:其中,k是迭代的轮次,Pk(i)是直播间i在第k轮迭代时对于内容标签l的分布概率,Pk‑1(j)是直播间j在第k‑1轮迭代时对于内容标签l的分布概率,直播间j是直播间i的邻居,所述邻居为满足wji≥ξ的直播间j,将所有满足wji≥ξ的直播间j的集合记为N(i),ξ为设定阈值,wji是直播间j和直播间i之间的相似度得分;
扩散计算模块,其用于对其它未被标记的直播间通过扩散算法得到分布概率;
其中,对于直播间j和直播间i之间的相似度计算,计算公式为:其中,wji为直播间j和直播间i之间的相似度得分,u(j)是在设定时间段内观看过直播间j的用户集合,u(i)是在设定时间段内观看过直播间i的用户集合,|u(j)∩u(i)|表示同时观看过直播间j和直播间i的人数,|u(j)∪u(i)|表示观看过直播间j或直播间i的人数。
8.如权利要求7所述的一种直播间内容标签扩散系统,其特征在于:所述内容标签为多个,且每个内容标签至少对应一个直播间。