论文部分内容阅读
随着移动通信网络的发展,用户接入网络的方式变得多种多样,WiFi、蜂窝网络已经成为用户接入网络的主要途径。另一方面,移动互联的兴起,用户行为分析的研究也逐渐成为热点。本研究将利用无线技术实现的实境分析系统称为无线实境分析系统,并采用WiFi技术获取用户信息进行用户行为异常分析。该研究中的分析模型可用于公共场所人员流动性监控与疏导,商业客流检测与服务指导等。用户行为异常指的是不符合用户历史行为模式,或者不符合惯例的用户行为,而异常检测则是指找出那些模式不符合期待的用户行为。异常检测可用在不同领域,例如,在医学上可进行远程医护监控,在公共服务领域进行盗窃行为检测及应急安全监控,在交通上可用于车流量异常检测及疏导,在商业中可用于商场客流控制等。本文基于无线实境分析系统以及用户行为异常分析所做的主要研究工作有:(1)总结了人类移动性的研究重点,归纳对比了基于WiFi、移动蜂窝网络、及GPS获取用户信息的技术特点。对当前现有的用户行为异常检测研究进展进行了介绍,并概括了数据挖掘中关于异常检测常用的四种方法。(2)概述了本研究的工程基础,无线实境分析系统。它具有实时性,持久性,大数据,检测范围广的特点。对系统的三个模块,数据采集模块,数据分析模块以及Web展示模块进行分别介绍。并基于现有系统存在的问题和缺陷,从无线实境系统架构优化与功能的新增提出了优化方案并实现。(3)使用信息论中的交叉熵概念对用户群体行为进行异常检测。虽然人群流量在不同时间段内是不同的,但不同时刻之间的变化都有着一定的规律。本文主要是从用户流量的分布规律上对用户群体行为进行异常检测。我们采用模糊数学中的隶属函数对交叉熵模型进行优化,并用于校园无线热点的用户进行异常检测处理。实验结果验证了交叉熵模型的有效性和实用性,以及加权交叉熵的优化效果。(4)采用分层聚类方法对个体用户进行分类识别,并采用贝叶斯模型判别用户所属类型,实现个体用户的差异分析及判别,达到数据清洗的目的。文章结合原始数据可挖掘到的用户停留时间,用户到访频次,用户信号强度这三个主要属性,进行联合分析。可识别出实验地点的四种不同特征的用户。然后,采用贝叶斯模型对给定数据进行用户类型识别。因为,不同类型的用户在针对性不同的研究中会属于非正常情况,用户分类可以当作异常检测从而达到数据清洗的目的。(5)简要提出了三个用户异常分析可应用的场景与方案。