【摘 要】
:
智慧法院建设促使现代化的大数据、人工智能等信息新技术与司法审判工作深度融合,不但可以极大提高审判效率,还让司法公正来得更高效、更有保障。按需标注的优质司法数据是智慧法院建设的数据基础。然而,裁判文书、法律条文等司法数据专业性强、形式多样、不同应用数据标注需求不一。众包标注方案难以保障标注质量。聘请经验丰富的司法专家进行专家标注可操作性差、成本高、效率低下。如何实现司法数据的高质量、高效标注成为智慧
论文部分内容阅读
智慧法院建设促使现代化的大数据、人工智能等信息新技术与司法审判工作深度融合,不但可以极大提高审判效率,还让司法公正来得更高效、更有保障。按需标注的优质司法数据是智慧法院建设的数据基础。然而,裁判文书、法律条文等司法数据专业性强、形式多样、不同应用数据标注需求不一。众包标注方案难以保障标注质量。聘请经验丰富的司法专家进行专家标注可操作性差、成本高、效率低下。如何实现司法数据的高质量、高效标注成为智慧法院建设的一大难题。针对以上问题,论文依托国家重点研发计划专项子课题“生态环保类案件智能审判辅助与态势预警技术研究”,在南京多个法院开展了调研,法官们对类案推送、裁判文书结构化入库、知识推送等辅助审判应用需求较高。针对这些需求,论文进行了法律文本智能标注方法研究,设计了一种结合规则和多种NLP算法的裁判文书智能标注系统。论文首先改进了一种裁判文书本体构建方法,并按照标注需求结合本体制定裁判文书标注标准和规则预标注模板。然后结合规则和多种NLP算法对裁判文书进行自动化预标注,其次提出了一种预标注结果合并算法处理预标注结果。最后论文基于前后端分离的思想,设计并实现了数据库、系统管理、智能标注以及标注结果分析等模块。论文的创新点有:(1)论文提出了一种面向智慧法院的裁判文书智能标注方法,利用司法数据内容和组成结构规范性强的特点,首先基于专家经验构建标注需求本体,然后利用标注需求本体制定裁判文书标注标准和规则预标注模板,最后结合规则模板和多种深度学习算法实现自动化标注。(2)论文提出了一种结合规则和多种NLP算法进行智能标注以提高标注准确率和效率的方法,利用深度学习算法预标注提高标注效率,再结合规则预标注降低算法的误判率,提高准确率,最后还通过人工校正和标注结果分析进一步提高标注准确率。经测试,论文设计的面向智慧法院的裁判文书智能标注系统运行稳定。在论文的测试环境下,标注准确率达到了86%,智能标注一篇文书平均耗时10秒,系统能够较好地满足类案检索、裁判文书结构化入库、知识推送等应用需求。
其他文献
后向散射通信(Backscatter Communication,Back Com)无需发射设备配备主动射频组件,能降低能耗和成本,但实现能量与信息传输须部署专用射频源,占用额外频谱资源。环境后向散射通信(Ambient Backscatter Communication,Am BC)可利用环境中现存的射频信号吸收能量和传输信息而无需分配新的频段。非正交多址接入(Non-Orthogonal Mu
在工业互联网实现智能生产制造的过程中,存在大量高度复杂的应用优化问题。启发式算法可以对这些优化问题进行简化处理,并得出合理高效的解决方案。花授粉算法是基于花卉授粉提出的一种启发式算法,具有优化效率高、可同时针对多个对象展开搜索过程等优点,已经被广泛用于解决多目标优化问题。然而,该算法也存在种群丰富度低、跳出局部最优解能力较弱等缺点。因此,本文针对花授粉算法存在的不足,分别设计了面向低维度和高维度优
无线通信设备中需要集成多个模块来满足人们日益增长的使用需求,而天线作为设备与外界信息交换的窗口也被寄希望于保持紧凑尺寸的同时能够具备更多的功能。极化可重构能在不增加天线端口数和尺寸的情况下,实现天线不同极化状态的转换,从而接收或发送各种信号,增强了天线的适用性。共口径阵列将各种功能的天线单元合理排布,使天线单元之间良好协同工作从而实现紧凑的阵列尺寸。基于此,本论文对极化可重构天线及其共口径阵列展开
随着应用场景、用户需求和技术演进的需要,5G新空口(New Radio,NR)通信应运而生。信道估计在5G NR通信系统中起着至关重要的作用,准确高效的信道估计算法可以保障通信的可靠性与时效性,确保整个系统的通信性能。针对城市轨道交通、城际高铁和车联网等高速移动环境,无线信道面临频率选择性和时间选择性衰落(双选衰落)的问题,这给信道估计带来了严峻的挑战,使得信道状态信息的准确获取变得困难,影响行车
电子鼻是一种用于检测和识别未知气味的智能仿生系统,主要由传感器阵列,信号预处理单元和模式识别单元三部分组成。在长期工作中,由于中毒、老化等原因会产生传感器响应漂移,从而降低电子鼻性能和使用寿命。对于漂移抑制,一种流行的方法是基于足够而完整的漂移校正样本进行识别模型修正,然而这忽视了实际在线场景中漂移样本难以进行定制的特点,将钝化识别模型效能,甚至使之失效。本文针对非理想化校正样本问题中的两个具体场
协作边缘计算能够通过联合边缘设备上的计算单元和存储空间发挥边缘计算的最大效益。近年来,面向边缘计算的协作策略研究取得了丰硕成果。然而,现有研究大多集中在优化协作效益,例如降低能耗、时延或提升用户体验等,很少针对协作参与方的可信水平进行分析研究。协作计算的本质是资源共享和任务外包,如果在协作过程中加入了恶意的服务节点和自私的参与节点,会对协作参与方的数据安全造成严重威胁。因此,如何在可信协作的前提下
21世纪是大数据时代,伴随着互联网流量的兴起以及多媒体应用的全面普及,图像/视频在人们日常生活中扮演者不可或缺的角色。然而人们在利用设备拍摄时受到的外界客观因素影响或人为操作失误等最终都反映为数字图像的失真,并影响图像后续的传输和处理过程。图像失真也就是图像退化,通常在视觉上表现为像素缺失、分辨率降低和模糊等不清晰现象。因此,利用退化图像进行恢复的图像复原技术,一直以来都是数字图像处理领域的研究热
目前,5G技术发展如火如荼,无线通信设备变得越来越丰富,因此通信系统小型化、集成化的需求也就使得无源器件——天线朝着平面化、紧凑型、集成化和宽带化方向发展。与此同时,透明天线可以在不阻挡光线传播的情况下收发电磁信号,能够应用在一些特殊需要透明化的平台。本论文针对天线对平面化、紧凑型、宽带化、透明化方面的需求设计了两款天线,主要内容如下:(1)设计了一种平面化紧凑型宽带透明超表面终端天线。该天线主要
图像在获取、压缩和传输过程中会被噪声污染而导致失真,不利于后续的高层次图像处理任务,因此图像去噪是图像预处理的关键步骤。自然图像的非局部自相似性先验是图像去噪领域最重要的先验之一,基于该先验的传统低秩近似去噪方法主要存在以下不足:一是标准核范数最小化通常会过度收缩每个奇异值,导致去噪后的图像过于平滑或模糊。二是现有方法只利用了图像的非局部自相似性,对整幅图像进行无差别的去噪处理,没有考虑到图像块的
合成孔径雷达(Synthetic Aperture Radar,SAR)可以实现对待测目标或场景高分辨的成像与探测,且不受气候和光照条件的影响。回波仿真(Raw Data Simulation,RDS)作为SAR相关研究的基础,它对SAR系统的设计、成像算法的验证和雷达参数的优化都至关重要。常规SAR-RDS大多基于理想地形假设条件,但实际场景通常比较复杂,剧烈的地形起伏将导致发射信号受到阻挡而产