公安系统犯罪数据挖掘系统的研究与应用

被引量 : 0次 | 上传用户:liuweieasy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据挖掘技术的不断发展,对于传统公安系统来说,越来越多的犯罪案件数据亟待处理。到目前为止,没有一个功能完善的公安系统犯罪数据挖掘系统可供使用,本文通过深入研究犯罪案件数据特性以及数据挖掘方法,通过关联规则方法和增量聚类算法构建了一个完整的公安系统犯罪数据挖掘系统。在对犯罪案件数据挖掘算法上,选择了更高效、更精确的FP-Growth算法代替传统的Apriori算法完成关联规则提取工作,在增量聚类算法上做出了一系列改进,使得改进算法的效果精度更好,鲁棒性更好:(1)采用FP-Growth算法代替传统的Apriori算法,该算法与Apriori算法一样,首先需要完成频繁项集的提取,提取完成之后建立FP树,之后在FP树上提取关联规则。(2)树形规则可以采用递归的方式提取关联规则,能够较快地完成关联规则的提取。另外,通过FP树将可以避免传统Apriori算法的重复计算冗余频繁项集的不足之处,减少了计算开销和存储开销。(3)在增量聚类算法中,使用属性约减后的犯罪数据属性特征进行BIRCH进行聚类,得到K个类别的中心点,将中心点作为核心树的叶子进行构建,计算后续进入的数据与叶子节点的距离,将不同的数据归类到相应的类别中,每个类别作为核心树的一个分支。(4)通过核心数据的迭代完善核心树各个部分的枝叶。将读入的新对象首先与各个类别的中心点进行比较,判断比较阈值,若小于阈值则归为该类,若没有类别合适,则重新构建一个核心树分支。(5)通过K-means算法对叶子节点进行后续处理,增强了核心树的鲁棒性。将叶子节点连接成链表,在链表中将每个叶子节点进行聚类,更新聚类中心。在改进算法基础上,本文设计和实现了公安系统犯罪数据挖掘系统。实验和测试结果表明,该系统与改进算法能够较快地从大量犯罪案件数据中挖掘出一些有意义的关联规则和聚类分类结果,通过实验发现关联规则和聚类结果都较好。系统从犯罪案件数据中挖掘出的关联规则和聚类特征分析,将会给公安系统相关部门的侦查破案带来很多帮助,同时也为广大老百姓提供了一些预防犯罪的信息。
其他文献
用女权主义观点来解读玛格丽特.杜拉斯的《情人》,我们可以发现这部小说在显性的话语层面和情节主题以及人物设置方面都表现出鲜明的女性意识。但是,女主人公用来张扬女性意
伴随着社会的进步以及经济水平的提升,人们的生活质量也在不断的提高,然而却存在一些危害人类健康生活的现象,如食品安全问题时常发生,总是存在这样那样的问题,因此为了使食
本文利用中国2001-2010年的省级面板数据,分析中国东、中、西部对外贸易就业效应的差异。并基于产出约束和资本约束模型中对外贸易对就业的不同影响路径,采用了固定效应静态面
相对于话语理解 ,语用预设具备合适性和共知性。而其具体使用则有单向性 .主观性和隐蔽性。在广告修辞用语中利用语用预设 ,广告者在价值、态度、信念、知识等方面追求与消费
本文从中药农业、中药工业、中药商业和中药知识产权等4个方面概述了中药产业的现状。作者认为:中药材生产在建立GAP基地,保证药材的质量的同时,应采用先进的生物工程技术开
<正> 老舍,在我国现代文学史上,是一个具有独特创作个性和艺术风格的作家。他写的小说、戏剧、散文、诗歌,都诙谐风趣,充满了幽默感。读他的作品,时时都会使人忍俊不住。舒济
在教学思路设计、课堂板书设计、课堂提问设计、课堂教学中的过渡和总结、日常教学中的练习、检测、讲评都从整体角度入手 ,以培养学生能力 ,提高教学质量。
近年来,随着我国社会主义事业的不断发展和进步,我国在国际上的地位进一步提高,与世界各国之间的政治、经济、文化交流越来越频繁,而这些都促进着我国社会方方面面的转型,尤
收入确认是会计理论与实务中的一个重要问题。对此《企业会计准则》与行业会计制度中都有规定,但有些企业在具体运作时采用了不同的做法。本文对此试作剖析,并提出改进建议。一