【摘 要】
:
为了推进我国法治社会的建设,满足公民日益增长的法律诉求,司法行业正在不遗余力地进行深化改革。由于以律师、法官等代表的法律机构以传统人工的方式处理海量的法律文本已不再现实、“同案不同判”等涉及到司法自由裁量权的现象也屡见不鲜,因此如何借助大数据技术优势,提高相关机构工作效率,维护行政处罚决策的公平性就显得尤为重要。本文旨在通过大数据技术处理海量的法律文本,借助时下热门的深度学习方法,提高行政处罚决策
论文部分内容阅读
为了推进我国法治社会的建设,满足公民日益增长的法律诉求,司法行业正在不遗余力地进行深化改革。由于以律师、法官等代表的法律机构以传统人工的方式处理海量的法律文本已不再现实、“同案不同判”等涉及到司法自由裁量权的现象也屡见不鲜,因此如何借助大数据技术优势,提高相关机构工作效率,维护行政处罚决策的公平性就显得尤为重要。本文旨在通过大数据技术处理海量的法律文本,借助时下热门的深度学习方法,提高行政处罚决策的准确性。针对本研究中原始数据来源种类多、数据类型不明、裁量权推荐任务算法模型不定等情况,故在正式实验之前开展了预实验,确定了数据的具体类型以及具体的研究模型。并在随后的正式实验中,通过jieba分词、词频统计等方法,对收集到海量法律文书进行处理,使用TF-IDF构建专业的语料库,完成了数据的预处理任务。与此同时,为了证明案由分类任务的合理性,本文研究开创性的进行了案由论证任务,利用LDA模型为案由分类任务提供理论依据,在完成案由论证任务之后,使用Word2vec模型对部分文本进行文本向量化训练,并将向量化矩阵嵌入到卷积神经网络中去,完成本文研究的法律文本案由分类和自由裁量预测任务。虽然借助深度学习处理中文文本的案例并不少见,但是处理类型复杂、冗余信息繁多的司法行政文书的研究案例却非常少,所以为了保证研究的严谨性,本文作者从北大法宝、无讼网、中华裁判文书网等法律网站中选取原始数据,并在专业法律人士的建议下,对原始数据进行了重新组合(裁决书、判决书、裁决书+判决书等多种文本类型组合,以及有这些文本组合类型衍生出的信息组合)。通过在预实验中对上述这些类型文本的训练,结合多个不同阶段的效果,本文研究给出了最终的结论:由于判-决书保留的特征数最多,所以模型对其处理的效果最好。该结论从实验角度,证明了研究文本特征数越充分,研究模型的准确率也越高,对之后的相关研究具有借鉴意义。在本文正式实验中,为了给与案由分类任务直接的理论和实践支持,本文作者特意进行了案由的论证任务。在具体操作中,使用了LDA模型对法律文书进行无监督学习,取得了非常好的效果,证明了将研究收集的法律文书分为14种案由是合理的。区别于传统的法律专家评价机制,该结论在实践层面上,论证了相关法律网站将法律文书分为特定案由的合理性,对之后相关法律工作者进行案由分类提供了理论参考。为了选择最适合本研究的算法模型,本文研究借助多种模型评价指标对卷积神经网络等多种模型进行评估,并结合测试数据集的准确率情况,得出了最适合本文研究的模型,即Word2vec结合卷积神经网络。该部分成果可直接对法律工作者开展法律文本分类工作提供便利,也对相关领域选取何种模型进行分类任务具有很强的参考价值。在法律文书的自由裁量预测任务中,通过咨询法律专业人士以及相关文献,将原始数据的特定内容进行处理,得到自由裁量结果,并将其转为输出,构建了一个基于法律文本进行机器裁决的卷积神经网络模型,通过对模型的多次调参与训练,提高了模型进行法律文本裁量的准确性。该结果在一定程度上,填补了行政处罚领域有关自由裁量权的研究空缺,对后续的相关研究具有借鉴意义。
其他文献
追诉时效制度是我国刑法的一项基本制度,在世界各国的立法中都占据着重要的地位,但该制度在我国并没有系统的理论研究。追诉时效,即经过一段时间以后,本该受到刑事追究的犯罪行为人不再被追诉,国家刑罚权归于消灭。该制度既是刑法理性发展的必然趋势,也是一种无奈之举。当犯罪行为人经过很长一段时间而没有受到刑法的处置,国家刑罚权的功能就会有所折损,行为人被追诉的必要性随着时间的流逝而降低,即使再进行追诉,其作用也
审查逮捕与审查起诉的权力属性与分配一直是学术界与实务界讨论的热点,关于捕诉关系的调整和尝试也从未停止。一方面由于经济社会的发展,重大刑事案件减少,但轻微刑事案件、新型犯罪案件数量爆炸式增涨;另一方面,新一轮司法改革环境下对检察人员的综合素质提出更高的要求,检察官数量上增长缓慢。随之而来的就是案件积压、人手严重不足,相应的办案质量没有保障,也就无法实现司法公正。在重重压力之下,一线办案人员对改革的诉
共同抵押制度具有保障债权清偿和分散抵押物风险的双重功能,是实践中常见且具有争议的共同担保形态,因此受各国立法所重视。在我国颁布的《中华人民共和国民法典》(下称《民法典》)等现行法中,对共同抵押的规范相对于其盘根错节的结构形态,均显得过于简单和原则,诸多具体问题难获解决。在涉及共同抵押的问题上,应该使抵押权人的权利得到最完全的保护,同时使标的物发挥其最大的交换价值并与优先受偿权的实现呈现趋同性,进而
公司决议撤销之诉有维护公司决议合法合章的作用。但是,若股东滥用这一制度,则会影响公司内外部法律关系的稳定性,造成公司及其利害关系人权益减损的后果。从公司决议撤销之诉制度的域外发展来看,这一制度从诞生之初就饱受滥用问题的困扰。通过分析2019年至2020年的相关案件,发现我国也存在着类似问题。故针对公司决议撤销之诉滥用问题的研究,对于制度完善以及滥用问题的规制有着现实意义。本文共分为三部分。首先,确
近些年来,我国的房地产市场迅速成长起来,房地产价格大幅增长,而且虚高不下,这导致很多人买不起新房,因此人们只能将目光转向二手房;另一方面城市化导致大量土地被占用,新建房越来越少,而存量房却大量积压,导致我国房地产市场中心由新房转向了二手房市场。从房屋成交量方面看,很多城市的二手房成交量甚至有赶超新房的趋势。基于此,对二手房价格的精准预测变得至关重要,这一来可以为政府制定相关的房价调控政策提供参考,
随着大数据和互联网领域的飞速发展,现代互联网社区逐渐向UCG模式开始转变,与一开始大多用户只能从网上被动获取知识不同的是,现在的用户可以选择自己创造信息与用户互动,用户发表自己观点的同时也在接受他人的观点。于是许多用户在进行决策时会根据羊群效应,即依赖于相关的评论带来的信息作出决策。但是面对大量的数据,如何从中获取有效信息成为目前研究的主流。于是基于评论文本的情感分析为用户决策和节约时间成本等带来
在2015年前,学界与实务界都对是否应允许民事二审撤回起诉的问题有多种解读,致使司法实践出现混乱,无法统一。2015年出台的《最高人民法院关于适用<中华人民共和国民事诉讼法>的解释》第338条解决了问题,使当事人在民事二审程序中撤回起诉变得有法可依。这是一大创举。但它的缺陷也十分明显:过强的职权主义干预、诉权与审判权的失衡、部分规范内容不明确,实操性差等问题无不在扰乱其正常适用。为此,在借鉴两大法
人工智能的发展开拓着一个又一个新的领域,经济水平的提高使得人们对健康服务的需求不断扩大。目前我国医疗资源存在着分布不平衡、卫生服务供不应求以及医患关系紧张的问题,这些问题在疫情期间体现尤为突出。在线医疗平台是解决我国卫生服务不平衡的一个重要方法,医疗问答社区平台是在线医疗中的一个主要存在形式,患者可以通过与医生以在线交流的方式了解病情,但患者提出问题的数量远大于医生数量,如何通过人工智能的方法推进
建筑工程管理是项目作业中至关重要的一项工作,其能够优化作业安排、解决工程问题等,对提高工程作业的综合效益起到显著的促进作用。但传统建筑工程管理模式已难以适应当前建筑工程管理需求,不利于高质量建筑项目落地,在一定程度上影响建筑行业的健康发展。基于此,文章分析了建筑工程管理的现代化和精细化意义,探讨建筑工程管理过程中存在的问题,并提出了建筑工程管理现代化和精细化的实现途径,旨在全面提高建筑工程管理水平