1.一种针对机器翻译的译文评估方法,其特征在于,所述方法包括:获取语料库中的若干条语料,并将每一条语料中包含的上下文词向量的拼接结果;并对所述若干条语料中包含的不同词性的词语的词向量进行初始化;
将所述拼接结果以及所述词向量作为CBOW模型的输入,获取训练后的CBOW模型;
获取每一条语料的目标词,并使用训练后的CBOW模型进行翻译;
获取待评估模型针对所述目标词的译文,并根据所述待评估模型对应的译文与训练后的CBOW模型对应的译文之间的相似度,评估待评估模型译文的准确度。
2.根据权利要求1所述的一种针对机器翻译的译文评估方法,其特征在于,所述对所述若干条语料中包含的不同词性的词语的词向量进行初始化,包括:分别使用互不重合的取值范围,对所述若干条语料中包含的不同词性的词语的词向量进行初始化。
3.根据权利要求1所述的一种针对机器翻译的译文评估方法,其特征在于,在所述将所述拼接结果以及所述词向量作为CBOW模型的输入,获取训练后的CBOW模型之前,所述方法还包括:将每一条语料中除设定的标点符号以外的标点符号去除,其中,设定的标点符号包括:用于表达语料的语气的标点符号、语料结束的标点符号中的一种或组合。
4.根据权利要求1所述的一种针对机器翻译的译文评估方法,其特征在于,所述获取每一条语料的目标词,包括:利用公式, 获取每一条语料的目标词,其中,
P(w|c)为目标词的概率;w为目标词;c为目标词的上下文;exp()为以自然底数为底的指数函数;;x为CBOW模型的输入层;∑为求和函数;v为语料库;()T为转置矩阵。
5.根据权利要求1所述的一种针对机器翻译的译文评估方法,其特征在于,所述语料为单独的句子。
6.一种针对机器翻译的译文评估装置,其特征在于,所述装置包括:获取模块,用于获取语料库中的若干条语料,并将每一条语料中包含的上下文词向量的拼接结果;并对所述若干条语料中包含的不同词性的词语的词向量进行初始化;
将所述拼接结果以及所述词向量作为CBOW模型的输入,获取训练后的CBOW模型;
获取每一条语料的目标词,并使用训练后的CBOW模型进行翻译;
获取待评估模型针对所述目标词的译文,并根据所述待评估模型对应的译文与训练后的CBOW模型对应的译文之间的相似度,评估待评估模型译文的准确度。
7.根据权利要求6所述的一种针对机器翻译的译文评估装置,其特征在于,所述获取模块,用于:分别使用互不重合的取值范围,对所述若干条语料中包含的不同词性的词语的词向量进行初始化。
8.根据权利要求6所述的一种针对机器翻译的译文评估装置,其特征在于,所述装置还包括:去除模块,用于将每一条语料中除设定的标点符号以外的标点符号去除,其中,设定的标点符号包括:用于表达语料的语气的标点符号、语料结束的标点符号中的一种或组合。
9.根据权利要求6所述的一种针对机器翻译的译文评估装置,其特征在于,所述获取模块,用于:利用公式, 获取每一条语料的目标词,其中,
P(w|c)为目标词的概率;w为目标词;c为目标词的上下文;exp()为以自然底数为底的指数函数;;x为CBOW模型的输入层;∑为求和函数;v为语料库;()T为转置矩阵。
10.根据权利要求6所述的一种针对机器翻译的译文评估装置,其特征在于,所述语料为单独的句子。