论文部分内容阅读
基于案情描述的法律判决预测任务是指通过给定的刑事法律文书中的案情描述部分对裁判文书进行判决预测,这不仅可为司法人员提供参考从而有效提高司法效率,也有利于司法的公开和公正。其中罪名预测和法条推荐是法律判决预测的2个重要子任务,彼此密切相关、相互影响,但传统方法常常将其当做独立的任务分开处理,无法捕获到子任务间的关系,从而导致预测性能不佳。该任务的另一难点在于难以从案情文本中提取到能够区分案情描述相似度较高的易混淆罪名的相关特征。为了解决这些问题,本文利用深度学习技术提出了一个基于模型融合的多任务学习模型,主要研究内容如下:(1)为了捕捉罪名预测和法条推荐间的逻辑依赖关系,本文采用多任务学习的模型结构。在该结构中,特征提取模块提取案情描述中的关键语义信息、罪名关键词表示和全局案情描述表示,并送入多任务预测模块;多任务预测模块将获得的表示特征进行拼接,对罪名预测和法条推荐任务进行联合建模学习,采用多个二元分类同时预测罪名和法条。这种多任务学习的模型结构通过共享表示,不但在学习多个相关任务时具有相当的优势,而且提升了模型的泛化能力。(2)为了充分提取案情文本特征,本文采用分别构建模型的方式,对特征提取模块进行设计。为获取案情描述中的关键语义信息,本文提出了一种融合Transformer Encoder和深度金字塔卷积神经网络(DPCNN)的注意力神经网络。Transformer Encoder获得案情描述表示,同时采用统计方法从案情描述中抽取相关的K条法条,输入到DPCNN中获得相关法条表示,利用注意力机制结合相关法条表示和案情描述表示得到案情描述中的关键语义信息表示。针对罪名易混淆问题,本文基于大规模法律数据采用无监督方法构建罪名关键词表,再从案情描述中抽取有助于区分易混淆罪名的罪名关键词,将罪名关键词表示融入到模型中进而解决罪名易混淆问题。为获得全局案情描述表示,本文基于案情描述中的词共现和语料中的词共现构建文本图,然后基于文本图学习图卷积网络,以此来获取语料库中具有非连续和长距离语义的全局词汇的共现。在CAIL2018-Small法律数据集上进行的多项对比实验表明,本文提出的模型能够显著地提高罪名预测和法条推荐这2个任务的性能。