面向法律领域案例归类判决系统的研究与实践

来源 :重庆交通学院 重庆交通大学 | 被引量 : 0次 | 上传用户:markhero
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
据统计,我国目前有12万律师、23万检察官和21万法官、每年1.2万法学院本科毕业生,他们对法律知识的获取、表达和应用能力参差不齐。特别值得注意的是人的推理功能远远超过机器,但人的记忆功能、检索速度和准确性又远不如机器。还有就是案例处理的公正性没有得到很好的解决,律师、检察官、法官、立法者、法学家已无法承受法律文献日积月累和法律案件不断增多的重负。因此研制一个能帮助他们推理和检索功能强大的法律专家系统已刻不容缓。在香港理工大学电脑系陈文中博士的帮助和支持下,作者对法律案例归类判决领域进行了深入研究,本论文就是作者攻读硕士学位期间的一个工作总结和理论提高。本文创造性的把法律案例文档的差异性、法律门类的类别差异性进行量化以及人工神经网络和遗传算法应用到法律领域,成功的解决了一个法律专家系统的两个难点——案例的归类和判决,为以后进一步完成法律专家系统的研发奠定了基础。我们设想的法律专家系统是用来做辅助案例判决,共分三个模块:归类一一给定一篇案情文档,将其归到相应的法律类;问题解答——每一法律类都对应有事先由法律专家们共同研究提出的一系列问题,从给定案情中搜索出问题的答案;判决——根据已得到的问题答案经过推理和演算,得到最终判决结果(原告胜诉或者败诉的概率)。本文详细讨论的是其中归类和判决两个模块的研发过程及关键技术,主要表现在以下几个方面:1、成功研制了法律案例归类和判决子系统个人独立完成研发了归类子系统,参与并组织同学研发判决子系统。经实验评测,归类子系统的对法律案例文档的归类准确率达到了75%以上,判决子系统对案例的判决准确率也在68%以上;速度非常快,一般在1.5秒之内;此外这两个子系统都具有非常好的可维护性、可移植性、可扩展性等,都达到了预期的目标。2、改进并扩展了层次归类算法,提出了文档特征词归类法归类子系统最重要的就是归类算法的研究,本文重点对“层次归类算法”中的特征词权值计算公式进行了改进,提出了独特的归类基本思想。在归类子系统中,首先通过大量的法律案例训练文档得到树结构中每个类(叶子类和中间类)的类特征词权值表,然后在此基础上计算新法律案例文档相对于各个类的累加权值,最后累加权值最大并且是叶子类的类即是该法律案例应归入的类。3、讨论了分词算法对当前比较著名的分词算法给予了评论,指出了其优缺点。在此基础上提出了适合法律归类的分词算法——基于法律词典的自动分词算法,并对法律词典的结构进行了编排,提高了系统自动分词的速度和准确性,同时也提高了归类的准确性。4、GA-BP算法的成功设计和运用在案例判决子系统中为每个法律门类都建立了一个相应的人工神经网络结构,由于人工神经网络算法本身有收敛速度慢和收敛到局部极小点得快可能性大,而遗传算法在这方面能有效的克服,所以我们采用遗传算法先对网络权值进行初选,后用误差反向传播算法对网络权值进行优化,在参数确定上也给与了讨论。实验结果证明,比用传统的统计分析得到的结果正确率要高,效果良好。针对法律案例分析领域的研究,文章提出了一些新的思想和算法,应用于实际系统中取得了较好的效果。但是由于法律专家系统研究工作是一项非常困难的工作,自今第二个模块(问题解答)的关键技术部分还没有得到完全解决,尚需要进一步的深入研究。尤其是归类的精确性、语义分析、找出相应问题的准确答案、系统自学习功能等方面尚需加强。
其他文献
自20世纪90年代以来,中国软件产业发展迅速,已经在国民经济中已经占有越来越重要的地位.但从软件企业成长方面来看,普遍存在缺乏核心技术、企业规模小等问题.企业成长速度较
有创新才有发展,科技创新对推动科技进步至关重要.因此一个国家和地区要充分利用科技进步推动其经济和社会的快速发展,必须构建一个包括企业、高校、科研院所、科技中介服务