基于注意力机制的辩护意见可采纳性预测

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:lizdy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在司法体系中,律师是一个非常重要且不可缺少的职位。相应地,律师提出的辩护意见是保护被告人权利的工具,是案件争议点的体现。然而在目前的“智能司法”领域中,并没有任务考虑到辩护意见,相关研究还是一片空白。因此,我们提出了辩护意见可采纳性(Defense Opinion Adoption Prediction,DOAP)这个任务,即根据给定的案件事实,预测相对应的辩护意见是否会被法院采纳。这个任务最核心的问题就是判断案件事实中的内容是否支持辩护意见中的主张。然而,机器并不能直接地理解自然语言,需要我们将自然语言转换为机器可以理解的形式,并对案件事实和辩护意见的语义关系通过自然语言的机器可以理解的表示进行计算。更重要的是,辩护意见可采纳性预测是一个司法任务。在司法程序中,任何一项判决都要求给出判决的依据;没有依据的判决结果是不可靠的,且无法被采信。因此,DOAP任务要求模型对可采纳性预测的结果有一定的解释能力或提供预测依据。针对以上问题,我们首先采用词嵌入技术(Word Embedding)将案件事实和辩护意见中的词表示为机器可以理解的数学向量,并采用注意力机制来建模案件事实和辩护意见之间的关系。为了提高模型准确率及可解释性,我们通过强化学习的策略梯度算法从案件事实中筛选出与辩护意见相关的文本段,并依据筛选出来的相关文本段来预测辩护意见是否会被采纳,同时筛选出来的相关文本段也作为模型结论的一个解释。我们从中国裁判文书网上收集了大量的判决书,经过一系列的数据处理和手工检查,构建了辩护意见可采纳性预测数据集,提取了5万多条案件事实和辩护意见对。我们选择了双向注意流网络(Bi-Directional Attention Flow,Bi DAF)作为对比实验,并在我们构建的数据集上得到了与Bi DAF基本相同的准确度以及比Bi DAF高1.52%的F1值。我们进一步研究案件事实长度和辩护意见长度对模型的影响时发现我们的模型相比Bi DAF在处理较长的案件事实和辩护意见上,表现出了比较明显的优势。此外,我们研究了强化学习筛选出来的文本段,发现筛选出来的文本段确实与辩护意见有相关,在一定程度上可以作为模型预测结论的解释。
其他文献
随着垃圾分类政策的逐渐推广落实,且传统的垃圾回收模式在以大规模垃圾回收、垃圾分类储存运输、邻避效应、逆向物流碳排放、经济成本等为主的诸多方面已不能满足需求,我国对科学合理垃圾分类回收体系的需求逐渐迫切。本文为促进解决垃圾分类回收体系的建设问题,对实际工作提供参考、指导以及为相关领域进一步研究做出铺垫,从回收点的角度建立基于不同垃圾类别、邻避效应、逆向物流碳排放、费用等因素的选址-路径问题模型,设计
学位
电子商务物流的飞快发展导致网络购物逐步成为人们休闲生活中的重要方式。而生鲜农产品作为人们生活中的必需品,其电子商务市场成为各企业优先选择的潜力市场;与此同时,为了迎合消费者的需求,生鲜电商企业的运营模式也在迭代不断。目前,生鲜电商企业的蓬勃发展也遇到了挑战,生鲜农产品较其他产品易腐坏、易损坏,对冷链物流及企业服务质量水平要求较高且弱点在消费者体验中容易放大,因此,需要及时了解消费者满意度,这对企业
学位
近年来,随着城市经济的快速发展,X市汽车保有量高速持续增长,截至2019年底已达到360万辆。汽车给人们的生活带来便利的同时,也导致城市停车供需矛盾突出,不仅影响正常的交通秩序,也造成了停车难、违规停车等一系列问题。城市停车供需矛盾问题已经引起了城市管理者和学者的高度重视,各地政府出台了一系列停车管理政策,相关领域的研究成果也在持续增加。因此,在宏观上对城市停车资源需求总量进行预测、在微观上对城市
学位
受地理位置、经济发展水平等影响,现阶段我国先进医疗技术与设备、高水平医生(本文统称为优质医疗资源)及患者均出现明显的聚集性特征,也即优质医疗资源与患者均集中于大中型综合性医疗单位,三甲医院尤为明显,进而造成占医疗单位总数九成以上的基层医疗单位门可罗雀而大型医院门庭若市的常见现象。为解决这一问题,国务院办公厅提出分级诊疗机制。基层医院作为分级诊疗机制“向上转诊”的输出单位,在基层患者的首诊及康复治疗
学位
移动智能设备快速发展并普及,人们在日常生活中经常使用移动智能设备处理个人的事项,比如网络购物、即时通信、个人支付等活动。因此,在这些设备上存储了大量的个人隐私数据甚至是商业机密等重要数据。为了保护这些隐私数据的机密性,智能设备可以采取加密的方式,比如i OS的基于文件的加密和Android的全磁盘加密(FDE)等。在一般敌手攻击下,这些加密方式能够保护数据的机密性。但是,如果用户面对能够强制访问设
学位
随着智能移动终端逐渐普及并成为用户日常信息的重要载体,存储敏感信息和重要数据的同时也成为了潜在的安全隐患,因此智能移动设备的数据安全问题也逐渐成为用户所迫切关注的问题。生产智能终端的公司也都采取了不同的安全技术去保护用户的数据安全,例如iOS平台的文件加密和安卓平台的全盘加密。通常情况下用户可以通过设置锁屏口令或者图案来保护自己的数据安全。这些数据保护技术在通常的情况下确实可以对用户的数据起到保护
学位
近年来随着互联网中隐私数据泄露事件的频发,为用户提供通信行为隐私保护的匿名通信网络受到各方广泛关注。匿名通信技术可以有效隐蔽和保护用户的身份信息及其通信关系,从而保护用户的隐私。cMix作为一种新型的高效匿名通信网络,将通信分为预计算阶段和实时阶段两部分,其中预计算阶段用于进行开销较大的公钥密码运算等前期准备工作,而用户仅需要参与对消息进行混淆盲化处理的实时阶段,具有实时运算开销小、时延低等优点,
学位
任务型对话系统旨在通过人机交流方式收集用户需求信息,为用户提供信息服务或完成用户指定的任务,而系统是否准确理解用户需求,自然语言理解模块至关重要。本文首先对单轮对话的自然语言理解任务展开研究,自然语言理解中最关键的两个子任务分别是意图检测和槽位填充,两者之间存在紧密的联系。近年来大多数研究都会构建意图检测和槽位填充的联合模型,并在模型内部建立意图与槽位之间的联系,比如显式构建意图到槽位的单向信息关
学位
互联网带来了信息产生方式和传播模式的深刻变革,在线社交网络目前已成为了人们互相沟通、知识共享和信息传播的重要媒介和平台。鉴于社交媒体的广泛使用,个人的思想,偏好和行为通常受到他们所参与的社交网络中的同龄人或朋友的影响。自2003年以来,影响力最大化问题已被广泛采用以建模创新和思想的传播,在社交网络中具有重要的研究意义。通过求解影响力最大化问题可以通过少数有影响力的用户将影响广泛地传播到社交网络中。
学位
2008年金融危机的爆发揭示了传统的货币政策与微观审慎监管在防范系统性风险方面的不足,必须研究探索新的宏观审慎监管体系。鉴于此,我国加快对宏观审慎框架的建立,在2015年12月提出宏观审慎评估体系(MPA),并在次年正式对商业银行进行考核评估。2017年我国又提出“双支柱”调控的概念:“健全货币政策和宏观审慎政策双支柱调控框架,深化利率和汇率市场金融监管体系,守住不发生系统性金融风险的底线。”当前
学位