【摘 要】
:
随着我国社区矫正相关政策的不断推进和各类业务信息系统应用的深入,机器学习算法在社区服刑人员的历史数据上开展各种研究和应用逐渐成为可能。其中,如何利用历史数据实现对社区矫正人员的危险性评估是最具有现实意义的一个。本文依托社区矫正真实数据提出了一种基于随机森林的社区矫正人员危险性评估技术,评估内容包含对社矫人员在矫正期间是否会发生脱管和是否会发生再犯罪的分类预测,并将该危险性评估技术应用到司法部社区矫
【出 处】
:
中国电子科技集团公司电子科学研究院
论文部分内容阅读
随着我国社区矫正相关政策的不断推进和各类业务信息系统应用的深入,机器学习算法在社区服刑人员的历史数据上开展各种研究和应用逐渐成为可能。其中,如何利用历史数据实现对社区矫正人员的危险性评估是最具有现实意义的一个。本文依托社区矫正真实数据提出了一种基于随机森林的社区矫正人员危险性评估技术,评估内容包含对社矫人员在矫正期间是否会发生脱管和是否会发生再犯罪的分类预测,并将该危险性评估技术应用到司法部社区矫正信息管理系统中,主要研究内容如下:(1)针对当前社区矫正人员数据量庞大、杂乱不规范、涉及的敏感信息多等实际问题,对社区矫正人员的脱管和再犯罪数据集进行预处理,具体过程为:1.对脱管数据集和再犯罪数据集分别做数据特征的筛选与敏感数据剔除,对数据做离散化转换和数据修正;2.利用OOB(袋外数据)对社区矫正人员的脱管数据集和再犯罪数据集进行特征选择,得到与脱管和再犯罪预测相关性最大的数据集。(2)提出基于随机森林的社区矫正人员危险性评估技术并在实际生产环境中落地。通过利用历史数据建立分类预测模型,对新增的社区矫正人员在矫正期间是否会发生脱管(再犯罪)进行预测。针对数据集中的类别不平衡问题使用随机均衡抽样方法得到训练数据,再用随机森林得到危险性评估模型,利用预测模型标记语言(PMML)实现评估模型在Java生产环境中的应用。(3)在全国社区矫正信息管理系统中设计并实现集数据汇集、数据统计、数据挖掘于一体的社区矫正人员危险性评估模块,展示实现效果;对危险性评估模型进行实验并分析结果,验证本文提出的社区矫正人员危险性评估技术的预测能力和实践效果。
其他文献
为了解大蒜(Allium Sativum L.)根系分泌物主要成份对烤烟的化感作用,通过气质联用仪(GC/MS)测定了大蒜根系分泌物的成份,并选用大蒜根系分泌物的2种主要成份,研究其对K326种
纳米金刚石(NDs),作为一种具备良好生物兼容性、化学稳定性、药物负载能力和众多不可比拟优越性能的材料,其在生物医学领域的应用被广泛关注,尤其是在生物成像和抗癌药物传输
目的:果糖基转移酶在新型果糖基衍生品的制备过程中具有重要作用,获得酶活高、性能优良的果糖基水解酶是关键。方法:利用MEGA4.0以及ClustalX2等软件对黑曲霉的基因组进行分析,遴
普外科是医学院校教学的临床培训基地,也是外科临床工作的基础。临床医学专业在普外科教学内容和课时设置中临床实践课时安排较少,导致临床医学学生在普外科学习过程中存在理
实现资产的有效控制是实现单位内部控制的重要组成部分,而经营性资产的有效控制是资产控制的主要内容,资产控制的目标是实现资产的安全完整和合理高效。在实现资产控制目标的
目的探讨人原发性肝癌(肝癌)组织中肝癌相关成纤维细胞(hCAF)与肝癌血管生成的关系。方法本前瞻性研究对象为2014年1月至2014年5月在中山大学附属第三医院接受肝癌根治性切除术的
2017年,统编语文教材在全国小学一年级投入使用。如何用好新教材成了大家研讨的热点话题。开学前,笔者所在学校的语文教研组围绕一年级上册的起始单元开展了一次研讨活动。活
<正> 管花肉苁蓉(Cistanche tubulosa(Schenk)Wight.)是寄生在不同种红柳根部的多年生寄生植物,是新疆沙漠地区传统的名贵中药材,有“沙漠人参”之美称,因为它专门寄生在红柳
目的研究安立生坦在先天性心脏病术后肺动脉高压中的治疗效果。方法选择近一年我院接受的74例先天性心脏病术后肺动脉高压患者作为案例,按照编号分组,以甲组和乙组为主,实施
"一带一路"沿线国家的发展历史悠久,在现阶段"一带一路"的新经济发展大背景之下,一定要立足于培养国际化的人才,对于国际商务的相关工作人员来说,跨文化商务沟通等能力的要求