欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2021110046092
申请人: 河南大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于异构信息网络的服务开发者按需推荐方法,其特征在于,包括:步骤1,爬取Programmable Web网站原始数据集,所述原始数据集包括API服务描述、API服务所属类别、服务开发者相关信息,所述服务开发者相关信息包括服务开发者名称、服务开发者所开发API服务、服务开发者基于特定类别内API服务所开发Mashup应用服务、服务开发者粉丝数;基于BERT预训练模型对用户需求服务描述文本和API服务描述文本进行向量化操作,分别得到用户需求服务描述向量、API服务描述向量,通过计算用户需求服务描述向量与API服务描述向量间的欧几里得距离来确定用户需求服务描述文本与现有API服务描述文本的相似性;基于最相似API服务所属的类别判断用户需求服务所属类别;

步骤2,根据服务开发者相关信息构建服务开发者评价模型,对步骤1得到的用户需求服务所属类别内的API服务开发者进行评价,得到最强服务开发者;

步骤3,基于Programmable Web网站原始数据集构建异构信息网络,该网络的节点类型包括服务开发者、API服务、Mashup应用服务,将三类实体间的关联关系作为网络中的边,构建服务开发者异构信息网络,然后进行相似服务开发者元路径抽取,进而以步骤2得到的最强服务开发者为路径起点,基于抽取的相似服务开发者元路径进行遍历,并对不同元路径分配不同权重,计算不同服务开发者的相似得分,得到相似服务开发者列表;

步骤4,基于用户需求服务的属性集合对相似服务开发者进行属性匹配,并计算相似服务开发者属性匹配得分,然后对服务开发者相似得分和属性匹配得分分配不同权重,并计算相似服务开发者最终得分,排序得到最终服务开发者推荐列表。

2.根据权利要求1所述的一种基于异构信息网络的服务开发者按需推荐方法,其特征在于,所述步骤1包括:

步骤1.1,爬取Programmable Web网站原始数据集,包括API服务名称、API服务描述、API服务所属类别、API服务的架构风格和响应格式、Mashup应用服务名称、Mashup应用服务所调用API服务列表、服务开发者相关信息、API服务以及Mashup应用服务与服务开发者之间的关联关系、API服务与Mashup应用服务之间的调用关系;

步骤1.2,针对步骤1.1所爬取的数据,对每个API服务描述文本以及用户需求服务描述文本进行预处理操作,包括分词、去停词、词干化,利用BERT预训练模型将预处理的用户需求服务描述文本和API服务描述文本向量化,分别得到用户需求服务描述向量、API服务描述向量集;

步骤1.3,针对步骤1.2得到的用户需求服务描述向量与现有API服务描述向量集,基于欧几里得距离计算用户需求服务描述向量与每个API服务描述向量间的相似度,距离越小,相似度越大,基于最相似API服务所属类别确定用户需求服务所属类别。

3.根据权利要求1所述的一种基于异构信息网络的服务开发者按需推荐方法,其特征在于,所述步骤2包括:

步骤2.1,将得到的服务开发者相关信息进行解析,根据服务开发者所开发API服务列表以及相应API服务的属性信息,得到每个服务开发者技能经验;对服务开发者所开发API服务数量、服务开发者基于特定类别内API服务所开发Mashup应用服务数量、服务开发者粉丝数、服务开发者技能经验四个维度分配不同权重,构建服务开发者评价模型;

步骤2.2,针对步骤1.3得到的用户需求服务所属类别,通过步骤2.1构建的服务开发者评价模型对类别内API服务对应开发者进行评价,得到评分最高的开发者作为该类别内的最强服务开发者。

4.根据权利要求1所述的一种基于异构信息网络的服务开发者按需推荐方法,其特征在于,所述步骤2.1包括:

按照下式对服务开发者进行多维度能力评分计算:其中λ1、λ2、λ3、λ4∈[0,1]为权重因子,且满足条件λ1+λ2+λ3+λ4=1;NA表示服务开发者所开发的API服务数量,NA_Max表示用户需求服务所属类别内开发者所开发服务数量的最大值;NM表示开发者基于用户需求服务所属类别内API服务所开发的Mashup应用服务数量,表示该开发者开发特定类别服务的开发能力,NM_Max表示用户需求服务所属类别内开发者NM的最大值;Nbf表示服务开发者被关注数即粉丝数,Nbf_Max表示用户需求服务所属类别内粉丝最多的开发者的粉丝数,代表开发者的影响力;Ne表示服务开发者技能经验中的技能属性个数,Ne_Max表示用户需求服务所属类别内开发者技能经验中技能属性数量最大值。

5.根据权利要求2所述的一种基于异构信息网络的服务开发者按需推荐方法,其特征在于,所述步骤3包括:

步骤3.1,根据步骤1.1得到的API服务以及Mashup应用服务与服务开发者之间关联关系、API服务与Mashup应用服务之间的调用关系挖掘服务开发者、API服务、Mashup应用服务三类实体间的关联关系,将三类实体作为网络中的节点、所述三类实体间的关联关系作为网络中的边,进行服务开发者异构信息网络构建;

步骤3.2,根据步骤1.2得到的预处理后的用户需求服务描述,进行相似服务开发者元路径抽取,针对得到的最强服务开发者,根据所抽取元路径进行基于异构信息网络的相似服务开发者发现;

步骤3.3,对不同元路径分配不同权重,计算不同服务开发者的相似得分,根据所述相似得分对相似开发者进行排序,得到top‑K相似服务开发者列表。

6.根据权利要求5所述的一种基于异构信息网络的服务开发者按需推荐方法,其特征在于,所述步骤3.3中,对不同元路径分配不同权重,计算不同服务开发者的相似得分,具体描述如下:

统计所抽取的相似服务开发者元路径遍历下的所有结果中各个服务开发者出现的频次,对频次最高的前十个服务开发者进行当前路径下得分SD计算:PreD表示服务开发者D在当前元路径结果中出现的频次,PreMAX表示当前元路径下所有服务开发者中单个开发者出现的最高频次;

根据不同路径长度分配不同权重:

n表示元路径长度类别数,Lj表示第j类长度的元路径,Lenj表示第j类元路径长度;

对不同路径下筛选后的结果进行加权计算得到服务开发者相似得分,实现相似服务开发者筛选,计算公式如下所示:

j表示第j条元路径,m为元路径的条数, 为开发者k在元路径j下的得分, 表示元路径j的权重。

7.根据权利要求1所述的一种基于异构信息网络的服务开发者按需推荐方法,其特征在于,所述步骤4包括:

步骤4.1,基于原始数据集得到服务开发者历史开发列表及相关服务的属性集合,与获得的相似服务开发者所开发服务的属性集合进行合并,得到服务开发者技能经验中包含的技能属性集合;

步骤4.2,基于用户需求服务的属性集合,对获得的相似服务开发者进行基于改进的Jaccard相似系数的技能经验属性匹配得分计算,得到相似服务开发者属性匹配得分;

步骤4.3,根据得到的服务开发者相似得分和步骤4.2得到的相似服务开发者的属性匹配得分,通过分配不同权重对相似服务开发者计算最终得分并进行排序,得到最终的top‑N服务开发者推荐列表。

8.根据权利要求7所述的一种基于异构信息网络的服务开发者按需推荐方法,其特征在于,所述步骤4.2中,计算用户需求服务的属性集合与服务开发者技能经验属性集合的匹配得分方法为:

其中,Ri表示用户需求服务的属性集合,Aj表示相似服务开发者技能经验属性集合,Simtag(Ri,Aj)∈[0,1]表示用户需求服务属性集合与相似服务开发者技能经验属性集合间的相似匹配程度,Simtag(Ri,Aj)越大,表示属性匹配得分越高。

9.根据权利要求7所述的一种基于异构信息网络的服务开发者按需推荐方法,其特征在于,所述步骤4.3中,相似服务开发者的最终得分按照下式得出:Similarity(U,D)=α(Simtag(Utag,D))+β(ScoreD)其中,U表示用户需求服务的需求,D表示相似服务开发者,α和β是权重因子,其中α+β=

1,Utag表示用户需求服务的属性集合,Simtag(Utag,D)为用户需求服务的属性集合与相似服务开发者的技能经验属性集合的属性匹配得分,ScoreD是相似服务开发者的相似得分。

10.一种基于异构信息网络的服务开发者按需推荐系统,其特征在于,包括:用户需求服务所属类别判断模块,用于爬取Programmable Web网站原始数据集,所述原始数据集包括API服务描述、API服务所属类别、服务开发者相关信息,所述服务开发者相关信息包括服务开发者名称、服务开发者所开发API服务、服务开发者基于特定类别内API服务所开发Mashup应用服务、服务开发者粉丝数;基于BERT预训练模型对用户需求服务描述文本和API服务描述文本进行向量化操作,分别得到用户需求服务描述向量、API服务描述向量,通过计算用户需求服务描述向量与API服务描述向量间的欧几里得距离来确定用户需求服务描述文本与现有API服务描述文本的相似性;基于最相似API服务所属的类别判断用户需求服务所属类别;

服务开发者评价模块,用于根据服务开发者相关信息构建服务开发者评价模型,对用户需求服务所属类别判断模块得到的用户需求服务所属类别内的API服务开发者进行评价,得到最强服务开发者;

相似服务开发者列表得出模块,用于基于Programmable Web网站原始数据集构建异构信息网络,该网络的节点类型包括服务开发者、API服务、Mashup应用服务,将三类实体间的关联关系作为网络中的边,构建服务开发者异构信息网络,然后进行相似服务开发者元路径抽取,进而以服务开发者评价模块得到的最强服务开发者为路径起点,基于抽取的相似服务开发者元路径进行遍历,并对不同元路径分配不同权重,计算不同服务开发者的相似得分,得到相似服务开发者列表;

服务开发者推荐列表得出模块,用于基于用户需求服务的属性集合对相似服务开发者进行属性匹配,并计算相似服务开发者属性匹配得分,然后对服务开发者相似得分和属性匹配得分分配不同权重,并计算相似服务开发者最终得分,排序得到最终服务开发者推荐列表。