知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13336804447 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13336804447

知嘟嘟经纪人

基于词嵌入的模型训练方法、装置、电子设备及存储介质

面议

专利号： 2020115600954

申请人：平安科技(深圳)有限公司

专利类型：发明专利

专利状态：已下证

专利领域：计算；推算；计数

更新日期：2026-04-06

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种基于词嵌入的模型训练方法，其特征在于，包括：基于查询项及与所述查询项匹配的数据匹配项，分词得到模型训练词表；

将所述模型训练词表中的目标词输入至待训练模型，分别从所述待训练模型中已初始化的词向量矩阵、查询项向量矩阵及数据匹配项向量矩阵中获取与所述目标词关联的向量表示；

对所述向量表示进行拼接，并将拼接后的向量表示通过所述待训练模型进行特征交叉融合，得到目标词向量表示；

基于所述目标词向量表示，在确定损失函数达到收敛状态时获取所述待训练模型中所述查询项向量矩阵及所述数据匹配项向量矩阵中的向量表示参数，得到包含所述向量表示参数的训练后的模型。

2.根据权利要求1所述的模型训练方法，其特征在于，所述基于所述目标词向量表示，在确定损失函数达到收敛状态时获取所述待训练模型中所述查询项向量矩阵及所述数据匹配项向量矩阵中的向量表示参数之后，还包括：获取前端输入的目标查询项，及待与所述目标查询项匹配的目标数据匹配项；

基于所述查询项向量矩阵与所述数据匹配项向量矩阵中的向量表示参数，生成与所述目标查询项对应的目标查询项向量及与所述目标数据匹配项对应的目标数据匹配项向量；

基于所述目标查询项向量与所述目标数据匹配项向量的内积，对所述目标数据匹配项进行相似度排序，得到排序结果；

根据所述排序结果，从所述目标数据匹配项中确定目标数据，并将所述目标数据输出至所述前端。

3.根据权利要求1所述的模型训练方法，其特征在于，所述分别从所述待训练模型中已初始化的词向量矩阵、查询项向量矩阵及数据匹配项向量矩阵中获取与所述目标词关联的向量表示，包括：

从所述词向量矩阵中查找与所述目标词对应的词向量表示；

从所述查询项向量矩阵中查找与包含所述目标词的第一查询项对应的第一查询项向量表示；

从所述数据匹配项向量矩阵中查找与所述第一查询项匹配的第一数据匹配项对应的第一数据匹配项向量表示。

4.根据权利要求1所述的模型训练方法，其特征在于，所述分别从所述待训练模型中已初始化的词向量矩阵、查询项向量矩阵及数据匹配项向量矩阵中获取与所述目标词关联的向量表示，包括：

从所述词向量矩阵中查找与所述目标词对应的词向量表示；

从所述数据匹配项向量矩阵中查找与包含所述目标词的第二数据匹配项对应的第二数据匹配项向量表示；

从所述查询项向量矩阵中查找与所述第二数据匹配项匹配的第二查询项对应的第二查询项向量表示。

5.根据权利要求1所述的模型训练方法，其特征在于，所述基于查询项及与所述查询项匹配的数据匹配项，分词得到模型训练词表，包括：获取数据集，所述数据集中包含查询项及与每一所述查询项相匹配的数据匹配项；

对所述数据集中每一所述查询项及相匹配的数据匹配项进行分词处理，得到语句构建词；

对任一所述语句构建词，依照设定大小的选取窗口从所述语句构建词的上下文中选取第一目标词作为正样例，从所述语句构建词的非上下文中选取第二目标词作为负样例；

将所述语句构建词及与每一所述语句构建词对应的正样例及负样例作为所述目标词，生成包含所述目标词的模型训练词表。

6.根据权利要求5所述的模型训练方法，其特征在于，所述目标词向量表示中包括基于所述语句构建词生成的第一目标词向量表示、基于所述正样例生成的第二目标词向量表示及基于所述负样例生成的第三目标词向量表示。

7.根据权利要求6所述的模型训练方法，其特征在于，基于所述目标词向量表示，确定损失函数达到收敛状态，包括：

通过所述第一目标词向量表示、所述第二目标词向量表示及所述第三目标词向量表示，确定如下交叉熵损失函数达到收敛状态：*

其中，w为所述第一目标词向量表示，为所述第二目标词向量表示，为所述第三目标词向量表示，w为所述语句构建词，wp为所述正样例，wn为所述负样例，ε为所述选取窗口的设定大小，θ为所述待训练模型中的训练参数，所述训练参数包括所述向量表示参数。

8.一种基于词嵌入的模型训练装置，其特征在于，包括：分词模块，用于基于查询项及与所述查询项匹配的数据匹配项，分词得到模型训练词表；

第一模型训练模块，用于将所述模型训练词表中的目标词输入至待训练模型，分别从所述待训练模型中已初始化的词向量矩阵、查询项向量矩阵及数据匹配项向量矩阵中获取与所述目标词关联的向量表示；

第二模型训练模块，用于对所述向量表示进行拼接，并将拼接后的向量表示通过所述待训练模型进行特征交叉融合，得到目标词向量表示；

第三模型训练模块，用于基于所述目标词向量表示，在确定损失函数达到收敛状态时获取所述待训练模型中所述查询项向量矩阵及所述数据匹配项向量矩阵中的向量表示参数，得到包含所述向量表示参数的训练后的模型。

9.一种电子设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。

推荐专利

内容推荐方法和装置、训练方法、计算设备和存储介质

位置嵌入解释方法、装置、计算机设备及存储介质

我要求购

我不想找了，帮我找吧

您有专利需要变现?

我要出售

智能匹配需求，快速出售

摘要:

权利要求书:

知嘟嘟

友情链接

关于我们

联系我们