论文部分内容阅读
利用时空数据对犯罪现状进行分析和对犯罪趋势进行预测,在公安部门对于犯罪分子等重点人员的排查工作中一直占有重要地位。随着信息化的发展,通过移动终端、监控设备等传感器,采集人们的移动时空数据,从中分析辨别犯罪分子等重点人员,成为近年来公安部门关注的热点。随着采集数据的爆炸式增长,传统的使用GIS进行排查的方式已捉襟见肘。本文根据某市公安部门采集到的移动终端联网时空数据,以及公安部门提供的重点人员移动终端MAC地址,设计并实现了一个重点人员分类模型。本文的主要工作如下:1.对原始采集数据进行多种形式的清洗,提取本文关注的时空数据字段。2.原始数据特征维度很高,为了对原始数据进行特征降维,本文从不同的角度提出了 TSG和STPS两种时空特征提取算法。其中TSG算法对时间和空间进行统一划分,将时空信息划分后的统计数据作为特征;STPS算法从上班族工作日作息时间的角度出发,将时空占比信息和日常活动相似度作为特征。这两种算法都大大减少了原始数据集的特征维度,同时,弥补了数据采集过程中某些AP设备重复采集和漏采的缺陷。3.通过两阶段集成学习,持续改进本文分类模型的性能。第一个阶段中,首先根据本文关注的分类模型性能指标,确定适合TSG和STPS算法生成的训练集的分类算法,然后使用集成学习方法中的Bagging算法,对分类模型进行集成学习,得到更高性能的分类器。第二个阶段,使用广义上的集成学习方法,将TSG分类模型和STPS分类模型按照指定的规则组合,进一步提高分类器的性能。实验结果表明本文实现的重点人员分类模型在公安部门识别重点人员工作中的有效性。本文的分类模型已经在某市公安部门的人员分析系统中得到应用。