论文部分内容阅读
随着移动互联技术的发展和智能移动终端的普及,基于位置数据的服务受到了越来越广泛的关注,目前已广泛应用于智慧城市等民用领域。聚焦维护国家主权和社会安全稳定,作为网电对抗领域新的发展方向,从海量位置数据中实现用户特征的挖掘尤其是用户行为模式的推断,更可有力支持军队等国家强力部门遂行反恐维稳多样化任务,研究内容具有重要的理论意义和价值。论文在阐述了基于位置数据用户特征挖掘的研究背景和现状以及分析了基于位置数据用户特征挖掘技术中所涉及理论知识的基础上,明确了论文的研究对象为基于智能移动终端的位置数据,并以此为应用场景对用户特征挖掘与用户行为模式推断中用户兴趣区域识别和未来区域预测等关键技术展开研究。首先,论文针对智能移动终端位置存在的数据质量不高和数据量过大的问题,基于统计理论对位置数据预处理技术展开研究。首先采用速度剪枝方法剔除掉一部分显著的异常点,在此基础上,提出了一种基于转角偏移度与距离偏移量的轨迹划分算法,通过设定偏移度阈值来提取出用户行为变化较大的位置点,并将这些位置点定义为特征点,为后续用户兴趣区域识别和未来区域预测奠定了基础。实验表明,该算法具有良好的特征点提取性能与运行效率。次之,论文针对位置数据因分布密度不均匀而导致的误聚类问题,基于机器学习提出了一种改进的密度峰值聚类算法实现用户兴趣区域的识别。算法引入了K近邻思想,采用反函数与高斯核函数乘积的形式重新定义了局部密度,并根据排序图中权值的斜率变化趋势确定聚类中心临界点,实现聚类中心的自动选取。接着结合逆向地理编码,将提取出的兴趣区域经纬度坐标转换成对应的地点语义名称,实现从数据层到语义层的转变。实验证明,研究的算法能准确地识别用户的兴趣区域。最后,针对用户未来区域预测中低阶Markov模型预测精度差以及高阶Markov模型匹配稀疏率高的问题,提出了一种基于Adaboost算法的多阶融合Markov模型。该模型首先通过前缀轨迹序列与历史轨迹序列的匹配情况自适应确定模型阶数k,并采用Adaboost算法根据1~k阶模型的重要程度为其赋予相应的权重系数,最后生成一个多阶融合Markov模型用于预测目标用户未来可能访问的区域。在真实用户轨迹数据集上的实验结果表明,Adaboost-Markov模型具有良好的预测性能与普适性。