论文部分内容阅读
大数据时代的来临,带给我们众多的冲击。特别是对于公安机关来说,既是挑战,也是机遇。近年来随着信息化技术的不断发展,现有的公安警务数据中心无论是规模还是架构都很难适应在海量数据场景下的数据管理和分析,直接影响了公安形势预判和重大决策,在现阶段建设新的能够匹配公安业务场景的大数据系统是公安部门的迫切需求。同时,数据挖掘对于越来越庞大的警务数据规模具有很强的应用能力和推广力,更能提升公安工作的信息化、科学化和现代化水平,引领科技强警战略和警务战略未来的发展。因此,建设警务数据分析平台,深入分析各种信息资源和视频资料。从大型数据库或数据仓库中提取隐含的、有潜在应用价值的信息或数据,应用到公安领域,来辅助一线实战。这项工作包括海量数据的应用、挖掘和比对,以及各种技术的合成,通过对数据的挖掘,提升警务信息化,对于案件分析、侦破,更好的提高工作效率和服务群众。本文通过厘清大数据带来的警务变革和应对大数据时代的挑战,研究数据挖掘的技术和算法,将警务数据中的出境数据和案件数据做为数据源,对数据进行预处理和多维数据建模,从而运用到公安实践中。本文的主要工作有如下几方面:1.公安需要一个什么样的大数据系统?了解当前警务数据特点和大数据。公安大数据也是“大数据”的一种,数据体量大、增长快;数据来源非常丰富,种类繁多,结构不一;成规模存储,其价值密度较低;对时间相当敏感。2.研究警务数据仓库。进行数据提取、清理、变换,以及载入和刷新,以更新数据仓库。数据上层是OLAP服务器层,其顶层是客户端层。客户端层包括查询、报告、分析和挖掘工具。3.构建警务多维数据模型。基本技术为数据立方体和OLAP联机分析,并对所涉及的数据进行概念分层示例,分类方式为数值型数据和非数值型数据。多维数据模型采用星形模式构建,由事实表和维表构成。