1.一种决策树模型训练方法,其特征在于,所述方法包括:获取预设产品的标准话术和训练样本,所述训练样本包括多个样本;
根据所述标准话术的条款将每个所述条款下的多个语句进行拼接,得到多个第一拼接语句;
将所述训练样本中的每个样本对应的文本分割成多个语句,计算每个所述样本的每个语句与每个所述第一拼接语句的相似度,并根据所述相似度将每个所述样本的多个语句进行拼接,得到多个第二拼接语句,其中,所述第二拼接语句的数量与所述第一拼接语句的数量相同;
获取所述第二拼接语句与所述第一拼接语句的语句相似度,根据每个所述样本的词频表计算所述样本的所述第二拼接语句相对所述词频表的词频分值;
将每个所述样本的第二拼接语句的语句相似度和词频分值作为特征参数,利用决策树模型进行训练,得到训练好的决策树模型。
2.一种基于坐席质检系统的语音处理方法,其特征在于,所述坐席质检系统包括电话系统和检测装置,所述检测装置用于对所述电话系统的通话进行检测,所述方法包括:获取坐席当前通过电话系统给客户介绍预设产品时的语音信息,对当前的所述语音信息进行语音识别得到对应的通话文本;
获取所述预设产品对应的标准话术,根据所述标准话术中的条款将所述标准话术中的多个语句进行拼接,得到多个第一拼接语句;
将所述通话文本拆分分割成多个语句,计算多个所述语句与多个所述第一拼接语句的相似度,并根据所述相似度将多个所述语句进行拼接,得到多个第二拼接语句,其中,所述第二拼接语句的数量与所述第一拼接语句的数量相同;
计算所述第二拼接语句与所述第一拼接语句的语句相似度,以及根据所述通话文本的词频表计算每个所述第二拼接语句相对所述词频表的词频分值;
将所述第二拼接语句对应的语句相似度和词频分值输入至预先训练好的决策树模型,得到所述坐席质检结果。
3.根据权利要求2所述的方法,其特征在于,所述计算多个所述语句与多个所述第一拼接语句的相似度,包括:
对多个语句与多个第一拼接语句进行onehot编码,得到所述通话文本的第一编码向量和所述标准话术的第二编码向量;
根据所述第一编码向量和所述第二编码向量,利用相似度公式计算多个所述语句与多个所述第一拼接语句的相似度。
4.根据权利要求3所述的方法,其特征在于,所述相似度公式为余弦相似度公式,所述余弦相似度公式为:
在该余弦相似度公式中,cos(θ)表示余弦相似度,Ai表示所述第一编码向量中第i个量,Bi表示所述第二编码向量中第i个量。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:对所述通话文本进行分词,并计算分词后每个词的词频;
根据所述词频提取所述通话文本的关键词,将提取的关键词组成词频表。
6.根据权利要求2所述的方法,其特征在于,所述根据所述通话文本的词频表计算每个所述第二拼接语句相对所述词频表的词频分值,包括:对每个所述第二拼接语句进行分词,得到第二拼接语句的多个词;
根据所述第二拼接语句的词是否出现在词频表中,确定所述第二拼接语句相对所述词频表的词频分值。
7.一种决策树模型训练装置,其特征在于,包括:样本获取模块,用于获取预设产品的标准话术和训练样本,所述训练样本包括多个样本;
第一拼接模块,用于根据所述标准话术的条款将每个所述条款下的多个语句进行拼接,得到多个第一拼接语句;
第二拼接模块,用于将所述训练样本中的每个样本对应的文本分割成多个语句,计算每个所述样本的每个语句与每个所述第一拼接语句的相似度,并根据所述相似度将每个所述样本的多个语句进行拼接,得到多个第二拼接语句,其中,所述第二拼接语句的数量与所述第一拼接语句的数量相同;
分值计算模块,用于获取所述第二拼接语句与所述第一拼接语句的语句相似度,根据每个所述样本的词频表计算所述样本的所述第二拼接语句相对所述词频表的词频分值;
模型训练模块,用于将每个所述样本的第二拼接语句的语句相似度和词频分值作为特征参数,利用决策树模型进行训练,得到训练好的决策树模型。
8.一种语音处理装置,其特征在于,包括:获取识别模块,用于获取坐席当前通过电话系统给客户介绍预设产品时的语音信息,对当前的所述语音信息进行语音识别得到对应的通话文本;
获取拼接模块,用于获取所述预设产品对应的标准话术,根据所述标准话术中的条款将所述标准话术中的多个语句进行拼接,得到多个第一拼接语句;
计算拼接模块,用于将所述通话文本拆分分割成多个语句,计算多个所述语句与多个所述第一拼接语句的相似度,并根据所述相似度将多个所述语句进行拼接,得到多个第二拼接语句,其中,所述第二拼接语句的数量与所述第一拼接语句的数量相同;
参数计算模块,用于计算所述第二拼接语句与所述第一拼接语句的语句相似度,以及根据所述通话文本的词频表计算每个所述第二拼接语句相对所述词频表的词频分值;
输入质检模块,用于将所述第二拼接语句对应的语句相似度和词频分值输入至预先训练好的决策树模型,得到所述坐席质检结果。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1所述的决策树模型的训练方法,或者,权利要求2至6中任一项所述的语音处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1所述的决策树模型训练方法,或者,权利要求2至6中任一项所述的语音处理方法。