1.一种汉语法律判决摘要生成方法,其特征在于,该生成方法包括:S1:从原始法律判决中提取重要的语句;
S2:根据上述各个语句的语篇结构分别对其进行分词;
S3:根据分词后所获取的关键语句生成抽象摘要,并将抽象摘要融合为法律判决摘要;
在步骤S1中,从输入的原始法律判决中选择具有高度重要性的语句,将原始法律判决中的各个语句设为序列标记任务,依次访问原始法律判决中的每个语句,并用标签1或0分别标记每个语句;
S101:将原始法律判决中的各个语句作为数据集输入,数据集表示为:D=(S1,S2,...,SN),其中,N表示原始法律判决中语句的数量;
S102:将数据集输入至分类层,分类层根据对各个语句的标签对其进行分类获取语句序列;
S103:使用文档级双向Bi‑LSTM对语句序列进行编码,得到语句序列的隐藏表示,分别为:d1,d2,....dN;
S104:通过具有S形函数的线性层计算每个语句的重要性分数,计算公式为:其中, 为Sigmoid激活函数, 为可学习参数,使输出概率之间的二元交叉熵函数最小化 ;
基于法律判决书及其摘要是高度结构化的,由以下六个修辞角色组成:法律纠纷类型、原告请求、被告请求、法院观点、法律依据和判决结果;在步骤S2中,根据关键语句的修辞作用来划分。
2.根据权利要求1所述的汉语法律判决摘要生成方法,其特征在于,在步骤S2中,其具体方法为:S201:以包含所有修辞角色的指示条款作为判断依据,并通过各指示条款分割文档;
S202:自动为文档中每个语句添加一个对应的修辞标签;
S203:通过含有修辞标签的数据来训练Bert‑BiLSTM‑CRF模型,直至模型训练收敛;
S204:通过训练后的Bert‑BiLSTM‑CRF模型对原始法律判决自动拆分为六个修辞角色;
S205:生成每个修辞角色对应的关键语句,然后用于训练抽象摘要模型。
3.根据权利要求1所述的汉语法律判决摘要生成方法,其特征在于,在步骤S3中,提取的每个修辞角色的关键语句作为抽象摘要模型的输入,并通过抽象摘要模型生成相应的单节摘要;
通过对各个单节摘要进行融合以生成最终的法律判决摘要。
4.一种汉语法律判决摘要生成系统,其特征在于,该系统包括:提取模块、分割模块以及生成模块,所述提取模块、分割模块和生成模块之间通信连接;
所述提取模块用于从原始法律判决中提取重要的语句;
所述分割模块根据提取模块输出的各个语句的语篇结构分别对其进行分词;
所述生成模块根据分词后所获取的关键语句生成抽象摘要,并将抽象摘要融合为法律判决摘要;
所述提取模块还用于从输入的原始法律判决中选择具有高度重要性的语句,将原始法律判决中的各个语句设为序列标记任务,依次访问原始法律判决中的每个语句,并用标签1或0分别标记每个语句;
所述提取模块还用于将原始法律判决中的各个语句作为数据集输入,数据集表示为:D=(S1,S2,...,SN),其中,N表示原始法律判决中语句的数量;
将数据集输入至分类层,分类层根据对各个语句的标签对其进行分类获取语句序列;
使用文档级双向Bi‑LSTM对语句序列进行编码,得到语句序列的隐藏表示,分别为:d1,d2,....dN;
通过具有S形函数的线性层计算每个语句的重要性分数,计算公式为:其中, 为Sigmoid激活函数, 为可学习参数,使输出概率之间的二元交叉熵函数最小化 ;
基于法律判决书及其摘要是高度结构化的,由以下六个修辞角色组成:法律纠纷类型、原告请求、被告请求、法院观点、法律依据和判决结果;在步骤S2中,根据关键语句的修辞作用来划分。
5.根据权利要求4所述的汉语法律判决摘要生成系统,其特征在于,所述生成模块包括Unilm模型,Unilm模型基于Transformers,通过三个语言模型目标进行训练。