1.一种基于词嵌入的模型训练方法,其特征在于,包括:基于查询项及与所述查询项匹配的数据匹配项,分词得到模型训练词表;
将所述模型训练词表中的目标词输入至待训练模型,分别从所述待训练模型中已初始化的词向量矩阵、查询项向量矩阵及数据匹配项向量矩阵中获取与所述目标词关联的向量表示;
对所述向量表示进行拼接,并将拼接后的向量表示通过所述待训练模型进行特征交叉融合,得到目标词向量表示;
基于所述目标词向量表示,在确定损失函数达到收敛状态时获取所述待训练模型中所述查询项向量矩阵及所述数据匹配项向量矩阵中的向量表示参数,得到包含所述向量表示参数的训练后的模型。
2.根据权利要求1所述的模型训练方法,其特征在于,所述基于所述目标词向量表示,在确定损失函数达到收敛状态时获取所述待训练模型中所述查询项向量矩阵及所述数据匹配项向量矩阵中的向量表示参数之后,还包括:获取前端输入的目标查询项,及待与所述目标查询项匹配的目标数据匹配项;
基于所述查询项向量矩阵与所述数据匹配项向量矩阵中的向量表示参数,生成与所述目标查询项对应的目标查询项向量及与所述目标数据匹配项对应的目标数据匹配项向量;
基于所述目标查询项向量与所述目标数据匹配项向量的内积,对所述目标数据匹配项进行相似度排序,得到排序结果;
根据所述排序结果,从所述目标数据匹配项中确定目标数据,并将所述目标数据输出至所述前端。
3.根据权利要求1所述的模型训练方法,其特征在于,所述分别从所述待训练模型中已初始化的词向量矩阵、查询项向量矩阵及数据匹配项向量矩阵中获取与所述目标词关联的向量表示,包括:
从所述词向量矩阵中查找与所述目标词对应的词向量表示;
从所述查询项向量矩阵中查找与包含所述目标词的第一查询项对应的第一查询项向量表示;
从所述数据匹配项向量矩阵中查找与所述第一查询项匹配的第一数据匹配项对应的第一数据匹配项向量表示。
4.根据权利要求1所述的模型训练方法,其特征在于,所述分别从所述待训练模型中已初始化的词向量矩阵、查询项向量矩阵及数据匹配项向量矩阵中获取与所述目标词关联的向量表示,包括:
从所述词向量矩阵中查找与所述目标词对应的词向量表示;
从所述数据匹配项向量矩阵中查找与包含所述目标词的第二数据匹配项对应的第二数据匹配项向量表示;
从所述查询项向量矩阵中查找与所述第二数据匹配项匹配的第二查询项对应的第二查询项向量表示。
5.根据权利要求1所述的模型训练方法,其特征在于,所述基于查询项及与所述查询项匹配的数据匹配项,分词得到模型训练词表,包括:获取数据集,所述数据集中包含查询项及与每一所述查询项相匹配的数据匹配项;
对所述数据集中每一所述查询项及相匹配的数据匹配项进行分词处理,得到语句构建词;
对任一所述语句构建词,依照设定大小的选取窗口从所述语句构建词的上下文中选取第一目标词作为正样例,从所述语句构建词的非上下文中选取第二目标词作为负样例;
将所述语句构建词及与每一所述语句构建词对应的正样例及负样例作为所述目标词,生成包含所述目标词的模型训练词表。
6.根据权利要求5所述的模型训练方法,其特征在于,所述目标词向量表示中包括基于所述语句构建词生成的第一目标词向量表示、基于所述正样例生成的第二目标词向量表示及基于所述负样例生成的第三目标词向量表示。
7.根据权利要求6所述的模型训练方法,其特征在于,基于所述目标词向量表示,确定损失函数达到收敛状态,包括:
通过所述第一目标词向量表示、所述第二目标词向量表示及所述第三目标词向量表示,确定如下交叉熵损失函数达到收敛状态:*
其中,w为所述第一目标词向量表示, 为所述第二目标词向量表示, 为所述第三目标词向量表示,w为所述语句构建词,wp为所述正样例,wn为所述负样例,ε为所述选取窗口的设定大小,θ为所述待训练模型中的训练参数,所述训练参数包括所述向量表示参数。
8.一种基于词嵌入的模型训练装置,其特征在于,包括:分词模块,用于基于查询项及与所述查询项匹配的数据匹配项,分词得到模型训练词表;
第一模型训练模块,用于将所述模型训练词表中的目标词输入至待训练模型,分别从所述待训练模型中已初始化的词向量矩阵、查询项向量矩阵及数据匹配项向量矩阵中获取与所述目标词关联的向量表示;
第二模型训练模块,用于对所述向量表示进行拼接,并将拼接后的向量表示通过所述待训练模型进行特征交叉融合,得到目标词向量表示;
第三模型训练模块,用于基于所述目标词向量表示,在确定损失函数达到收敛状态时获取所述待训练模型中所述查询项向量矩阵及所述数据匹配项向量矩阵中的向量表示参数,得到包含所述向量表示参数的训练后的模型。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。