1.一种在线的群组电影推荐方法,其特征在于包括如下步骤:步骤1、计算电影类型的社会影响力;
步骤2、统计群组成员对电影类型熟悉程度;
步骤3、计算群组成员对于某种电影类型的话语权;
步骤4、融合群组成员的偏好;
步骤5、电影推荐。
2.根据权利要求1的在线的群组电影推荐方法,其特征在于:所述步骤1由以下步骤组成:
步骤1‑1、动态样本库维护
采用采样池采样的方法,对观众群体进行抽样;
假设采样池的大小,也就是样本数为M;针对观众集合U中观众序列,对采样池进行以下操作:
若采样池中观众数量小于M:则将该名观众放入采样池,并且设置进入蓄水池时间;
若采样池已满,也即蓄水池中观众数量已经为M时:第一步、针对观众序列中的第i‑j名观众,顺序号i为当前观众序号,j为8周前一天0时数据库中的最大序号,若(i‑j)>=M,在[0,(i‑j)]范围内取一个随机整数d,若d小于M,则用接收到的这个观众替换采样池中的第d个观众;
第二步:在每天开始时候,清理进入采样池超过8周都没有观影记录的样本观众。
重复第一步,直至没有新增观众。
步骤1‑2电影类型影响力计算访问采样池中观众的观影记录,计算各种类型电影的社会影响力,即统计电影类型C={c1,c2,...,cl}中所有类型电影的观影人数,除以M得到该种类型电影的社会影响力e。
3.根据权利要求2的在线的群组电影推荐方法,其特征在于:所述步骤2具体包括:
根据观众‑电影交互矩阵和电影‑类型交互矩阵确定观众对电影类型的熟悉程度;
假设数据集中所有电影的类型属于19种类型中的一种或多种,对于每一个电影项目,可以得到一个维度为19的类型向量,用这个类型向量来表示每一部电影的类型信息;
T T T T
所有电影的类型向量构成的矩阵为T=(t1 ,t2 ,...,tn) ,其中n表示电影总数;根据观众的观影记录和电影的类型向量,确定观众和电影类型之间的关系;对于观众ui,其计数向量wui用已观看电影的类型向量的累加和来表示,具体可用如下公式计算:其中,Vu是观众ui已观看电影的集合;群组Gi中所有成员的计数向量构成的矩阵为:其中,m为群组Gi中成员的数量。
4.根据权利要求3的在线的群组电影推荐方法,其特征在于:所述步骤3包括如下步骤:
步骤3‑1、群组成员话语权计算计算在群组Gi中群组成员对于某种电影类型k的话语权,观众权重通过下列公式计算得到;
其中Wu,k表示某个群组成员在步骤2中所得矩阵WGi中u行,k列的值,也即某个观众观看某种类型电影的数量;
步骤3‑2、计算群组成员的权重方差,并调整成员权重;
群组Gi的成员权重方差可以被定义为:其中,m表示群组Gi中成员总数, 是群组成员对于电影类型k的平均权重;
对观众权重设置阈值L;首先,在群组Gi中得到平均转移权重 平均转移权重的计算过程是将群组内小于阈值的观众权重求和然后除以权重大于阈值的观众数;具体计算公式如下:
其中,Si是群组Gi的子集,而且Si中的成员权重都低于阈值L;调整观众权重如下:当权重方差低于阈值t时,认为群组成员对于该电影类型的熟悉程度比较均匀,此时群组成员的相互影响很小。
5.根据权利要求4的在线的群组电影推荐方法,其特征在于:所述步骤4包括如下步骤:
步骤4‑1仅考虑电影的一种类型时,融合群组成员的偏好;
群组对于电影j的评分能通过下列公式计算得到:其中,ru,j是观众u对电影j的评分,Cj是电影j包含的类型构成的集合,ek是电影类型的社会影响力,α和β分别控制群组内部和群组外部对观众偏好融合影响的程度;
4‑2考虑电影j包含的所有类型时,群组对电影j的评分,即群组偏好,计算公式如下:
6.根据权利要求5的在线的群组电影推荐方法,其特征在于:所述步骤5具体如下:根据当前影院上映电影的类型,选取历史数据库中某部相同类型的电影,根据步骤4计算得到等待推荐群组的偏好,选择当前播放电影中满足该偏好的影片进行推荐。