基于文本分析的行政司法类案智慧推荐

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:liongliong559
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着司法智慧化的广泛开展,人工智能技术可以辅助专业人士提高工作效率,提升群众法律意识。对于法律行业相关人员来说,各级法院在案件审判之后记录的裁判文书具有具有宝贵的研究意义。不论是群众在自身面对纠纷想要寻求专业帮助或是法官进行案件审判前进行参照时,过往类案都能起到参考辅助、有效解决量刑偏差的作用。因此从技术层面利用计算机自动查找出相似司法案件,减少人工成本和主观偏差具有很高的研究价值。为了保证类案推荐的准确性和效率,本文结合深度学习和文本分析技术,提出了一种类案推荐算法。主要思想是应用卷积神经网络进行案件类目的识别,对法律文书进行初步选择后,利用文本相似度算法在初选文本数据集中进行相似推荐。首先,构建行政司法专有文书语料库,对数据进行预处理,采用词云图词频统计和TF-IDF算法对裁判文书中的专有名词进行识别并构造自定义词典和停用词典,结合Jieba分词与停用词表进行清洗;其次,基于对裁判文书的特征分析进行模块切割,在后期进行模型训练时只需将含有重要信息的模块放入其中,减少计算复杂度,增强词向量信息。使用Word2vec把法律文档形成词向量模型,用于后期模型训练;再次,将案件类目视为多分类问题,构建多种深度学习和机器学习模型用以训练预测,通过分析不同模型在本文数据集上的表现效果,选取表现效果最优的模型作为基线模型;最后,在对案件类目识别的基础上利用空间向量模型对案件数据集进行相似度计算,输出最相似的推荐案例。结果显示:待判案件经过类目识别后,再与同类案件数据集计算相似度,可以减少案件信息的冗余,增强特征的突出。本文共使用六种不同模型进行类目的识别,其中识别效果最好的是CNN,准确率可达88%,LSTM识别效果可以达到80%,SVM可达77%。剩余三种机器学习模型(Logistic Regression、朴素贝叶斯和随机森林)表现均不如两种深度学习模型。因此本文选取CNN作为基线模型,构建CNN类目识别与向量空间模型计算文本相似度相结合的推荐算法,通过对比实验和具体推荐案例分析,证实该算法推荐结果的平均准确率可以达到77.8%。并且相比于传统文本相似度计算方法,该算法可以节约数十倍的查询时间。通过本文的研究,达到了充分利用文本信息,兼顾类案推荐准确度和速度的目的,具有重要的理论与应用价值。
其他文献
报纸
随着大数据和互联网领域的飞速发展,现代互联网社区逐渐向UCG模式开始转变,与一开始大多用户只能从网上被动获取知识不同的是,现在的用户可以选择自己创造信息与用户互动,用户发表自己观点的同时也在接受他人的观点。于是许多用户在进行决策时会根据羊群效应,即依赖于相关的评论带来的信息作出决策。但是面对大量的数据,如何从中获取有效信息成为目前研究的主流。于是基于评论文本的情感分析为用户决策和节约时间成本等带来
学位
在2015年前,学界与实务界都对是否应允许民事二审撤回起诉的问题有多种解读,致使司法实践出现混乱,无法统一。2015年出台的《最高人民法院关于适用<中华人民共和国民事诉讼法>的解释》第338条解决了问题,使当事人在民事二审程序中撤回起诉变得有法可依。这是一大创举。但它的缺陷也十分明显:过强的职权主义干预、诉权与审判权的失衡、部分规范内容不明确,实操性差等问题无不在扰乱其正常适用。为此,在借鉴两大法
学位
人工智能的发展开拓着一个又一个新的领域,经济水平的提高使得人们对健康服务的需求不断扩大。目前我国医疗资源存在着分布不平衡、卫生服务供不应求以及医患关系紧张的问题,这些问题在疫情期间体现尤为突出。在线医疗平台是解决我国卫生服务不平衡的一个重要方法,医疗问答社区平台是在线医疗中的一个主要存在形式,患者可以通过与医生以在线交流的方式了解病情,但患者提出问题的数量远大于医生数量,如何通过人工智能的方法推进
学位
建筑工程管理是项目作业中至关重要的一项工作,其能够优化作业安排、解决工程问题等,对提高工程作业的综合效益起到显著的促进作用。但传统建筑工程管理模式已难以适应当前建筑工程管理需求,不利于高质量建筑项目落地,在一定程度上影响建筑行业的健康发展。基于此,文章分析了建筑工程管理的现代化和精细化意义,探讨建筑工程管理过程中存在的问题,并提出了建筑工程管理现代化和精细化的实现途径,旨在全面提高建筑工程管理水平
期刊
为了推进我国法治社会的建设,满足公民日益增长的法律诉求,司法行业正在不遗余力地进行深化改革。由于以律师、法官等代表的法律机构以传统人工的方式处理海量的法律文本已不再现实、“同案不同判”等涉及到司法自由裁量权的现象也屡见不鲜,因此如何借助大数据技术优势,提高相关机构工作效率,维护行政处罚决策的公平性就显得尤为重要。本文旨在通过大数据技术处理海量的法律文本,借助时下热门的深度学习方法,提高行政处罚决策
学位
以某复杂老矿山地质环境保护与土地复垦方案编制为例,总结复杂老矿山编制工作的相关经验,对编制该类矿山地质环境保护与土地复垦方案的要点进行阐述。对于复杂老矿山,必须在彻底调查地质环境条件的基础上,针对长期开采遗留的治理难题,以安全性为重点开展现状评估工作;对于边坡等敏感设施,需要做出稳定性分析以及必要的治理;开展预测评估工作时以土地损毁为重点,为后续开展的环境保护和土地复垦工作提供切实可行的技术依据。
期刊
随着经济全球化的深入,各种突发事件如金融危机、恐怖主义等发生的频率也越来越大,突发事件对股票市场的影响已经不再是地域性的,而是对全世界的股票市场都会产生冲击。此次新冠肺炎疫情是一个典型的突发事件,在短期内对我国的经济产生了冲击,而股票市场是经济的晴雨表,能够在一定程度上反映此次疫情对我国经济产生的影响。同时随着疫情的全球化蔓延,对世界的股票市场也会产生一定的冲击。准确评估突发事件对我国股票市场风险
学位
由于概率图模型便于建模变量关系、概率推理以及知识发现,所以其思想在人工智能前进的浪潮中发挥了十分重要的作用,最近更是有一些神经网络结合概率图思想的研究在某些问题上取得了state-of-the-art的结果。另外,无论是计算机硬件不发达的上个世纪,还是大数据时代的到来,提高算法性能都至关重要,而这一点在并行程序设计理论中找到了不错的解决方案。作为一名统计学学生,本文在研究了大量计算机理论的基础上,
学位
近年来,伴随着互联网技术的高速发展以及人们生活水平的日益改善,人们开始热衷于在挑选在线旅行产品时通过浏览在线旅游网站或互联网旅游平台的产品点评或游记等内容来寻找适合自己的旅游景点。然而,由于各大网络旅游平台的用户量迅速增多,越来越多的消费者开始在旅游平台上分享自己的旅游体验和感受,各类评论内容也多样繁杂。这些信息一方面能够为其他消费者提供指引,另一方面也使得消费者在挑选旅游产品时难以获得优质、适合
学位