1.一种基于大数据的司法领域类案推送方法,其特征在于,包括:将司法领域文书上传到数据库进行匹配;将司法领域文书及其匹配数据输入到训练好的类案相似度计算模型,输出该司法领域文书与每一个匹配数据的相似度;将所有相似度按照大小降序排列,并选取前k个相似度所对应的匹配数据进行推送;
其中,类案相似度计算模型的训练过程包括:
S1.在获取的司法领域文书数据集D中采样,得到一个Batch_size大小为N的原始样本集;
S2.将原始样本集输入文本嵌入层和数据扰动层得到增强样本集;且增强样本集中的增强样本与原始样本集中的原始样本一一对应;
S3.将经过文本嵌入层的原始样本集进行embedding后输入Bert预训练模型得到N个原始样本的文本向量表示,将增强样本集输入Bert预训练模型得到N个增强样本的文本向量表示;
S4.基于步骤S3获取的数据,分别通过Simloss函数和Rewardloss函数计算对比学习损失和奖励损失并反向传播训练参数;
S5.重复步骤S1‑S4,迭代训练直至模型收敛。
2.根据权利要求1所述的一种基于大数据的司法领域类案推送方法,其特征在于,步骤S1中Batch_size的大小N的计算公式为:其中,floor()表示向下取整,K表示显存大小,M表示司法领域文书数据集D中每条数据的平均显存大小,S表示司法领域文书数据集D中的数据总数。
3.根据权利要求1所述的一种基于大数据的司法领域类案推送方法,其特征在于,在步骤S2中,原始样本集中任一个原始样本输入文本嵌入层和数据扰动层,得到其对应的一个增强样本,包括:S21.按照Bert模型词表将原始样本转化得到一个token序列;
S22.对token序列进行扰乱操作得到新token序列,所述扰乱操作包括乱序、dropout和随机替换;
S23.对新token序列进行embedding后实行逆梯度攻击,得到增强样本。
4.根据权利要求3所述的一种基于大数据的司法领域类案推送方法,其特征在于,步骤S23中对embedding后的新token序列实行逆梯度攻击,逆梯度攻击表示为:其中,x表示embedding后的新token序列,xr表示增强样本,g表示梯度,∈表示攻击程度。
5.根据权利要求1所述的一种基于大数据的司法领域类案推送方法,其特征在于,步骤S3将任一增强样本或任一经过文本嵌入层并进行embedding的原始样本输入Bert预训练模型,得到其对应的文本向量表示的过程包括:S31.将样本输入Bert预训练模型,并获取Bert预训练模型中最后7个encoder层各自输出的embedding表达;
S32.提取每一个embedding表达中的CLS向量,利用线性层将所有CLS向量转换为一维向量,并进行归一化得到7个权重;
S33.将每一个权重与其对应的CLS向量相乘得到CLS权重向量,将所有CLS权重向量相加得到样本的文本向量表示。
6.根据权利要求1所述的一种基于大数据的司法领域类案推送方法,其特征在于,Simloss函数表示为:其中,表示第i=1,2,…,N个原始样本的文本向量表示, 表示第i个原始样本对应增强样本的文本向量表示,Sim()表示相似度计算函数,Dict()表示距离计算函数。
7.根据权利要求1所述的一种基于大数据的司法领域类案推送方法,其特征在于,步骤S4计算奖励损失的过程包括:S41.将原始样本xi的文本向量表示 与其对应增强样本xri的文本向量表示拼接,通过奖励学习层将拼接结果线性映射到Bertencoder的输入维度,得到原始样本xi对应的第一奖励向量;
S42.排除原始样本xi自身及其对应增强样本xri,将原始样本xi的文本向量表示 与其余任一原始样本xj的文本向量表示拼接,或与其余任一增强样本xrj的文本向量表示拼接;通过奖励学习层将拼接结果线性映射到Bertencoder的输入维度,得到原始样本xi对应的第二奖励向量;
S43.将原始样本xi对应的第一奖励向量和第二奖励向量分别通过线性层映射为1维,得到原始样本xi对应的第一奖励分数和第二奖励分数;
S44.通过原始样本xi对应的第一奖励分数和第二奖励分数计算此时的奖励损失,并反向传播训练参数;
S45.重复步骤S41‑S44,直至当前轮次采集的原始样本集中所有原始样本计算完成或模型参数收敛。
8.根据权利要求7所述的一种基于大数据的司法领域类案推送方法,其特征在于,奖励损失的计算公式表示为:式中S1表示第一奖励分数,S2表示第二奖励分数。