欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2022108549280
申请人: 大连民族大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2026-02-06
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于图卷积网络的两阶段协同过滤多行为推荐方法,其特征在于包括下列步骤:定义U和I分别代表用户和物品的集合,其中u代表集合U中第u个用户,i代表集合I中第i个物品;R={R1,…,Rk…,RK}表示所有K种行为下的用户-物品的交互矩阵的集合,其中RK为目标行为的交互矩阵;总的交互矩阵RG=R1∪…∪RK;具体来说,交互矩阵是二值矩阵,当用户u和物品i发生过交互时,否则其中是第k个行为的交互矩阵的第u行i列元素;

所研究问题的表述如下:

输入:用户集U,物品集合I,不同行为交互矩阵集合R,总交互矩阵RG;

输出:用户u在目标行为下和物品i发生交互的可能性;

本方法的模型:

通过充分利用所有交互数据来设计模型,以对用户偏好进行由整体到局部的捕获,从而挖掘不同行为间的联系,进而提升推荐系统的性能;模型分为两个学习阶段;第一阶段用于捕获局部细化后的不同行为下用户偏好,第二阶段用于探索不同行为间的联系;在第一阶段中,先对所有行为的交互数据取并集构成一个新的二分图,以捕获用户的全局偏好;然后再利用各自行为的交互数据组成的二分图来对全局偏好进行局部细化,以得到不同行为中反映出来的局部细化后的用户偏好;在第二阶段中,先提取所有可能导致目标行为发生的用户偏好,然后将其拼接融合,从而提升对目标行为的预测能力;

具体过程为:

嵌入向量初始化:

将每个用户和物品的ID与Embedding(嵌入向量)相关联;具体来说,令P∈RM×d和Q∈RN×d分别作为用户和物品的初始化Embedding,其中M表示用户的总数,N表示物品的总数,d为Embedding的长度;给定用户以及物品ID的独热编码矩阵IDU和IDI,用户u和物品i表示为:其中,eu为第u个用户的Embedding表示,ei为第i个物品的Embedding表示,为第u个用户的独热编码,为第i个物品的独热编码;

各行为用户偏好的捕获:

第一阶段包含两个步骤,第一步是从由所有行为交互数据构造的二分图中学得用户的全局偏好;第二步是在由不同行为交互数据分别组成的二分图中对全局偏好进一步细化,以得到细化后的用户偏好;

利用GCN领域聚合模块来聚合邻居节点的信息;用于更新用户节点的邻域聚合公式如下:eu=AGG({ei:i∈Nu})  (2)

其中AGG表示聚合函数,用于聚合与用户u相邻节点的信息;ei表示二分图中与用户u相邻物品的表示;eu是通过邻域聚合得到的用户表示;Nu表示图中与用户u有过交互的物品集合;聚合后的物品的表示ei,聚合函数采用的是标准邻域聚合:其中是对称归一化系数,遵循了标准GCN的设计;和分别表示聚合后的用户和物品的表示;|Nu|为第u个用户在二分图中所代表的节点的度,|Ni|为第i个物品在二分图中所代表的节点的度;

在第一步中,首先将总的交互矩阵RG构造成用户和物品总的二分图;然后根据公式(3)计算得到聚合不包含自连接后的用户和物品表示和最后,将其与聚合之前的eu和ei相融合,以保留原有的特征信息;为了降低由邻域聚合导致的某些特征数量级的变化而带来的影响,本技术方案对和进行了L2正则化处理;融合后的表示分别为:其中表示逐元素相加,||·||2是L2正则化,和分别表示第一步输出的用户和物品的表示;

在第二步中,首先将第一步得到的和作为各行为二分图的共享输入,这些二分图是根据各行为的交互矩阵{R1,…,Rk…,RK}所构成的;然后采用与第一步相同的方法,即根据公式(3)和公式(4)可以得到各个行为细化后的用户以及物品的表示和不同行为间联系的挖掘:

为了将除目标行为外局部细化的用户偏好用于目标行为的预测,首先需要对这些偏好进行过滤,寻找出可能导致目标行为发生的偏好;然后再将这些偏好融合起来实现不同偏好的组合,从而提升目标行为的预测能力;

第二阶段同样分两步来实现;第一步先从细化后的不同行为的表示中过滤出可能导致目标行为发生的偏好;此步骤采用线性变换来实现:其中W1U∈Rd×d和W1I∈Rd×d为行为1的参数矩阵,B1U∈Rd×1和B1I∈Rd×1是行为1的偏置,d表示Embedding的长度;根据公式(5),最终可以得到从不同行为中过滤出的用户和物品的表示和然后,第二步将各行为过滤后得到的表示与目标行为的表示进行拼接融合;首先,对第一步得到的过滤后的偏好进行拼接:其中||表示拼接操作;然后经过线性变换得到融合后的最终用户和物品的表示:其中和表示参数矩阵,和表示偏置,K为行为的数量;

通过第二阶段的设计,实现了对从不同行为中捕获到的用户和物品表示的融合,并得到了最终的用户和物品的表示和将其用于目标行为的预测;

目标函数与模型训练:

采用计算内积的方法来获得交互得分:

在本技术方案训练过程中,需要保证交互过的用户-物品的得分高于未交互过的用户-物品得分,即:其中σ(·)表示Sigmoid函数;O={(u,i,j)|(u,i)∈R+,(u,j)∈R-}表示正负样本对;R+代表在训练集中出现的用户-物品交互对的集合,R-代表在训练集中未出现的用户-物品交互对的集合,即根据(u,i)获取交互矩阵中对应位置为1的用户u和物品i的表示eu和ei,根据(u,j)获取交互矩阵对应位置为0的用户u和物品j的表示eu和ej;然后分别得到两个阶段的目标函数;

经过第一阶段的学习可以得到各行为用户和物品表示的集合和以第一个行为为例,利用其交互矩阵R1作为训练集,其目标函数为:得到第一阶段最终的总目标函数:

其中β为超参数;Θ1是可训练参数;

在第二阶段中,通过利用目标行为的交互矩阵RK来进行训练,得到最终用户与物品的表示和其目标函数为:其中Θ2代表第二阶段学习过程中的所有参数。

2.根据权利要求1所述的基于图卷积网络的两阶段协同过滤多行为推荐方法,其特征在于包括下列步骤:具体过程为:为了加快训练过程,进一步的,采取了批量训练的策略;在每个批次中,逐个用户对每个行为的交互进行采样组成训练数据,以确保每个用户都能得到训练;当给定一个批次的用户,对每个行为进行正-负样本对的抽样,结果以三元组(u,i,j)的形式进行返回,其中u表示用户,i表示交互过的物品,j表示未交互过的物品;当某个行为下,用户u没有交互数据时,将返回一个默认的三元组,即(0,0,0)用于占位,以确保训练正常进行;在训练过程中,对两个阶段的训练交替进行。

3.根据权利要求2所述的基于图卷积网络的两阶段协同过滤多行为推荐方法,其特征在于包括下列步骤:具体过程为:对第一阶段的训练采用L1来指导第一阶段的参数的更新,然后将第一阶段的参数固定,切换L2来指导对第二阶段的参数进行更新。