1.一种基于智能AI的英文文本自动校对系统,其特征在于,包括:英文文本采集模块,用于获取待分析英文文本;
英文文本分词模块,用于对所述待分析英文文本进行分词处理以得到英文单词的序列;
英文单词嵌入编码模块,用于将所述英文单词的序列通过基于词嵌入层的单词语义嵌入编码器以得到英文单词嵌入编码特征向量的序列;
英文单词词性标注和编码模块,用于分别对所述英文单词的序列中的各个英文单词进行词性标注和独热编码以得到英文单词词性独热编码特征向量的序列;
英文单词词义和词性双重编码模块,用于以英文单词为单位,对所述英文单词嵌入编码特征向量的序列和所述英文单词词性独热编码特征向量的序列进行整合以得到英文单词词义和词性双重编码特征向量的序列;
英文文本语义理解模块,用于对所述英文单词词义和词性双重编码特征向量的序列进行上下文语义关联编码以得到英文文本语义理解特征;
语法错误检查模块,用于基于所述英文文本语义理解特征,确定是否存在语法错误;
其中,所述英文单词词性标注和编码模块,包括:
词性标注单元,用于分别对所述英文单词的序列中的各个英文单词进行词性标注以得到英文单词词性描述的序列;
英文单词词性描述独热编码单元,用于使用基于独热编码层的词性编码器分别对所述英文单词词性描述的序列中的各个英文单词词性描述进行编码以得到所述英文单词词性独热编码特征向量的序列。
2.根据权利要求1所述的基于智能AI的英文文本自动校对系统,其特征在于,所述英文文本语义理解模块,用于:将所述英文单词词义和词性双重编码特征向量的序列通过基于转换器的上下文编码器以得到英文文本语义理解特征向量作为所述英文文本语义理解特征。
3.根据权利要求2所述的基于智能AI的英文文本自动校对系统,其特征在于,所述语法错误检查模块,用于:将所述英文文本语义理解特征向量通过分类器以得到分类结果,所述分类结果用于表示是否存在语法错误。
4.根据权利要求3所述的基于智能AI的英文文本自动校对系统,其特征在于,还包括用于对所述基于词嵌入层的单词语义嵌入编码器、所述基于独热编码层的词性编码器、所述基于转换器的上下文编码器和所述分类器进行训练的训练模块。
5.根据权利要求4所述的基于智能AI的英文文本自动校对系统,其特征在于,所述训练模块,包括:训练数据获取单元,用于获取训练数据,所述训练数据包括训练待分析英文文本;
训练分词单元,用于对所述训练待分析英文文本进行分词处理以得到训练英文单词的序列;
训练词嵌入编码单元,用于将所述训练英文单词的序列通过基于词嵌入层的单词语义嵌入编码器以得到训练英文单词嵌入编码特征向量的序列;
训练词性标注单元,用于分别对所述训练英文单词的序列中的各个训练英文单词进行词性标注以得到训练英文单词词性描述的序列;
训练独热编码单元,用于使用基于独热编码层的词性编码器分别对所述训练英文单词词性描述的序列中的各个训练英文单词词性描述进行编码以得到训练英文单词词性独热编码特征向量的序列;
训练双重编码单元,用于以英文单词为单位,对所述训练英文单词嵌入编码特征向量的序列和所述训练英文单词词性独热编码特征向量的序列进行整合以得到训练英文单词词义和词性双重编码特征向量的序列;
训练英文文本语义理解单元,用于将所述训练英文单词词义和词性双重编码特征向量的序列通过基于转换器的上下文编码器以得到训练英文文本语义理解特征向量;
优化单元,用于对所述训练英文文本语义理解特征向量进行优化以得到优化训练英文文本语义理解特征向量;
分类损失单元,用于将所述优化训练英文文本语义理解特征向量通过分类器以得到分类损失函数值;
训练单元,用于基于所述分类损失函数值对所述基于词嵌入层的单词语义嵌入编码器、所述基于独热编码层的词性编码器、所述基于转换器的上下文编码器和所述分类器进行训练。
6.根据权利要求5所述的基于智能AI的英文文本自动校对系统,其特征在于,所述分类损失单元,用于:使用所述分类器对所述优化训练英文文本语义理解特征向量进行处理以得到训练分类结果:计算所述训练分类结果与真实值之间的交叉熵损失函数值作为所述分类损失函数值。
7.一种基于智能AI的英文文本自动校对方法,其特征在于,包括:获取待分析英文文本;
对所述待分析英文文本进行分词处理以得到英文单词的序列;
将所述英文单词的序列通过基于词嵌入层的单词语义嵌入编码器以得到英文单词嵌入编码特征向量的序列;
分别对所述英文单词的序列中的各个英文单词进行词性标注和独热编码以得到英文单词词性独热编码特征向量的序列;
以英文单词为单位,对所述英文单词嵌入编码特征向量的序列和所述英文单词词性独热编码特征向量的序列进行整合以得到英文单词词义和词性双重编码特征向量的序列;
对所述英文单词词义和词性双重编码特征向量的序列进行上下文语义关联编码以得到英文文本语义理解特征;
基于所述英文文本语义理解特征,确定是否存在语法错误;
其中,分别对所述英文单词的序列中的各个英文单词进行词性标注和独热编码以得到英文单词词性独热编码特征向量的序列,包括:词性标注单元,用于分别对所述英文单词的序列中的各个英文单词进行词性标注以得到英文单词词性描述的序列;
英文单词词性描述独热编码单元,用于使用基于独热编码层的词性编码器分别对所述英文单词词性描述的序列中的各个英文单词词性描述进行编码以得到所述英文单词词性独热编码特征向量的序列。