1.一种基于标签语义推测的意图分类方法,其特征在于,包括以下步骤:S1:构建带标签的语料数据集,利用回译法对语料数据集进行数据扩充,得到扩充语料数据集;
S2:对扩充的语料数据进行分类预测,得到扩充的语料数据的标签,根据标签进行数据清洗,得到增强语料数据集;
S3:根据增强语料数据集中语料数据之间的相似度进行标签语义推测,得到各标签对应的标签语义;
S4:利用增强语料数据集和各标签对应的标签语义训练预构建的文本分类模型,得到训练好的文本分类模型;
S5:利用训练好的文本分类模型从待分类的文本中分别提取语料数据和标签语义的浅层特征和深层特征,并进行特征融合,得到意图分类结果。
2.根据权利要求1所述的一种基于标签语义推测的意图分类方法,其特征在于,利用回译法对语料数据集进行数据扩充具体为:分别采用日文、韩文和英语的回译法扩充语料数据集的数据量。
3.根据权利要求1所述的一种基于标签语义推测的意图分类方法,其特征在于,步骤S2具体为:使用BERT分类器对由语料数据Xi扩充得到的语料数据X′i进行分类预测,得到X′i的标签Y′i,将Y′i与Xi的标签Yi比对,保留标签相同的X′i,实现数据清洗,并将语料数据集和保留的X′i合并得到增强语料数据集。
4.根据权利要求1所述的一种基于标签语义推测的意图分类方法,其特征在于,在标签语义推测中,将求解标签推测语义问题转化为寻找语料数据与标签中心距离L最小的问题,即:其中,n表示增强语料数据集中标签总数,Dj表示增强语料数据集中标签Ci下所有的语料数据,Zi表示Ci的标签中心;
通过优化求解当前标签类别下的语料数据特征与当前类别总特征之间最小的距离,最后将距离最小的语料数据设置为当前类别的标签语义。
5.根据权利要求1所述的一种基于标签语义推测的意图分类方法,其特征在于,在标签语义推测中:通过以下步骤得到每条语料数据到每个类别中心的距离:
S3.1:对增强语料数据集中的语料数据进行分词并统计词频获得高频词;
S3.2:根据高频词为每一条语料数据建立特征矩阵,并经过PCA降维处理;
S3.3:使用K‑Means算法进行聚类处理,计算每条语料数据到每个类别中心的距离;
将各类别中距离类别中心最近的一条语料数据作为相应类别的标签语义。
6.根据权利要求1所述的一种基于标签语义推测的意图分类方法,其特征在于,所述文本分类模型通过BERT编码获取浅层特征和通过下游任务获取深层特征。
7.根据权利要求6所述的一种基于标签语义推测的意图分类方法,其特征在于,通过BERT编码获取浅层特征包括以下步骤:采用文本分类模型的第一BERT编码器对文本中的语料数据进行编码,第一BERT编码器包括12个依次连接的BertLayer层,分别提取第一BERT编码器中第1个BertLayer层和第6个BertLayer层的编码输出,对应得到语料数据的第一浅层特征a1和第二浅层特征a2;
通过标签语义推测获取文本的标签语义,将获取的标签语义直接拼接,采用文本分类模型的第二BERT编码器对拼接后的标签语义进行编码,第二BERT编码器包括12个依次连接的BertLayer层,分别提取第二BERT编码器中第1个BertLayer层和第6个BertLayer层的编码输出,对应得到标签的第一浅层特征b1和第二浅层特征b2。
8.根据权利要求7所述的一种基于标签语义推测的意图分类方法,其特征在于,通过下游任务获取深层特征包括:分别使用文本分类模型的第一卷积神经网络、第二卷积神经网络和第三卷积神经网络对第一BERT编码器输出的上下文语义特征h1进行处理,对应得到三个卷积结果,将三个卷积结果与h1拼接后得到语料数据的深层特征a3;
将第二BERT编码器输出的标签语义特征h2输入文本分类模型的BiLSTM,BiLSTM的输出作为文本分类模型的多头注意力机制的输入,将多头注意力机制的输出作为标签的深层特征b3。
9.根据权利要求8所述的一种基于标签语义推测的意图分类方法,其特征在于,第一卷积神经网络、第二卷积神经网络、第三卷积神经网络的卷积核大小分别为(2,768),(3,
768),(4,768);
BiLSTM输出的隐藏层维度设置为1024,多头注意力机制设置为4头、隐藏层维度为852。
10.根据权利要求8所述的一种基于标签语义推测的意图分类方法,其特征在于,通过点积将特征融合:e1=1*1
e2=2*2
e3=3*3
融合后将e1、e2和e3拼接,再将拼接的结果依次输入文本分类模型的线性层和Softmax层处理后得到最终输出,取最终输出的最大值作为意图分类结果;
其中,e1表示第一次浅层特征融合的结果,e2表示第二次浅层特征融合的结果,e3表示深层特征融合的结果。