基于R语言的罪犯数据聚类研究

被引量 : 7次 | 上传用户:liudanfeng123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘中的一个重要研究方向,是一种发现数据集中非随机结构的方法,被广泛用于统计学生物学、市场营销等领域。聚类算法可以分为基于划分的方法、基于层次的方法、基于密度的方法、基于网格的方法和基于模型的方法。每种聚类算法均有其特点以及适用范围。本文应用R语言对罪犯的数据进行了聚类研究,分别采用了划分的聚类算法kmeans与层次的聚类算法agnes。通过对算法进行相应的实验,分别对5567名罪犯的4个属性上进行聚类,结合监狱业务的实际情况,把罪犯分成5至20个类别,然后对聚类的结果进行了评价。实现结果显示,采用kmeans算法把罪犯分成10个类别,并对每个类别采取针对性的管教措施是合适的,给目前单纯根据罪名或个别属性对罪犯进行分类的情况,提供了一定程度的参考。在agnes聚类实验中,agnes划分的罪犯的簇类别在数量上的分布较特殊,不同簇在数量上差异较大,不利于分管分押,但由于该算法发现了较多的孤立点与离群簇,因此对发现罪犯中的特殊人群,预防突发事件有一定的参考意义。
其他文献
<正>1听课前的思考前不久,我校数学组开展组内公开课活动,高二的Y老师准备上的是"异面直线所成角".异面直线所成角虽然是立体几何中"三角"中的重要一"角",但在新课标中,异面
应用ANSYS有限元分析软件对唐氏螺纹和普通螺纹的联接结构进行模拟分析,研究在总轴力分别为15kN、20kN、25kN、30kN时唐氏螺纹和普通双螺母螺纹牙的应力情况,并且对照结果做
随着全球机动车辆的增加,汽车尾气的排放对环境的影响越来越引起人们的注意,加之石油价格上升和石油储量的日益减少,这些都促使电动汽车的研究成为热点。同时随着新的永磁材料的
<正>《难忘的泼水节》一文位于人教版二年级下册第三单元,这一单元的主题是"爱祖国"。编者安排这一篇传统课文,其最大的用意便是让学生体会"人民爱总理,总理爱人民,人民和总
期刊
1956年在北京西二环百万庄建成的红砖小楼,作为中国早期自主设计规划的民宅群楼,其住宅小区规模化,个性化特色的形成与发展,赋予了人们新的居住模式与生活理念。随着社会经济
生命科学是自然科学中的一门基础学科,是研究生命现象和生命活动规律的科学。分子生物学是从分子水平研究生命现象和生命活动规律的新兴科学。在新《普通高中生物课程标准》中
随着我国经济的快速发展,越来越多的社会矛盾和问题突显出来,并不断恶化,社会风险不断积累。腐败、就业、工程质量、食品安全等影响社会稳定问题不断涌现,极大的影响了整个社会的
强化商业职业道德建设促进社会主义精神文明健康发展周德新,王萍商业职业道德属于社会主义精神文明建设的范畴,它是社会主义精神文明建设的重要组成部分。在社会主义市场经济条
文章旨在揭示企业社会责任对内部利益相关者的行为的影响效果及影响机制,为此,把员工角色外行为作为结果变量,把员工关于企业社会责任的共享知觉(企业社会责任)作为自变量,把
目的研究海风藤及其常见混淆品的鉴别方法。方法从性状、显微、薄层色谱及紫外光谱对海风藤及常见混淆品进行比较。结果海风藤与常见3种混淆品有明显区别。结论本文报道的几