居民出行热点路径及区域发现系统的设计与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zjzjzj13
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着GPS设备、无线通信与卫星等技术的快速发展以及移动互联网的广泛应用,越来越多的轨迹数据可以很方便的获取。同时,这些数据又蕴含着大量的有用信息,从而可以有效的映射出人的出行信息、活动规律等,因此怎样利用新的技术有效的挖掘轨迹数据蕴藏的知识一直是研究人员进一步研究的方向。本课题的主要目的是以北京市为例,分析用户出行热点路径及区域的分布情况。即通过统计分析城市中居民的轨迹数据,参考其密度与时间因素,从轨迹数据中提取经度、纬度和时间信息等关键字段,从而确定用户在城市中有效的停留位置,进而识别用户出行的路径以及区域,从中挖掘出特定时空环境下人群的变化规律。同时,在数据规模不断变大的环境下,针对已有的热点路径及区域识别处理存在效率低下的情况,使用基于K-D Tree索引结构和Spark GraphX的DBSCAN聚类算法处理数据。本系统以移动互联网用户位置轨迹数据为源数据,将数据清洗分为了两个步骤进行,首先将出现在数据中的空值和重复值等看作常规的脏数据,然后针对基站数据中专有的乒乓数据,分析了其成因并采取改进的滑动窗口方法对其进行处理。由于轨迹数据为时空数据,因此针对这一特性设计使用了基于时间-空间双维度的停留点提取算法,提取出数量合适的包含用户位置数据及其基本属性的停留点。将停留点作为特征点划分出若干子轨迹段,在此基础上设计和实现基于Spark GraphX的DBSCAN聚类算法,分别对轨迹段和出行起讫点进行聚类分析,获取到满足设定阈值的包含用户位置数据和基本属性的簇,得到在不同的时间段内居民出行热点路径和出行热点区域。在获取结果的基础上,将中间结果以及最终结果保存至数据库中。最后通过调用百度地图接口实现展示平台,通过Web的形式展示结果,将获取到的停留点以及用户的出行热点路径及区域投影到北京市地图上。
其他文献
近年来,生物质碳材料由于来源广泛、化学稳定性好、比表面积高、环境友好等优点已成为备受关注的电极材料,在能源转化和能量储存领域显示出巨大的应用潜力。但是生物质碳材料
给出了孤岛效应定义和孤岛效应形成原理。介绍了孤岛效应对电网、设备形成的危害。阐述了常用的孤岛效应检测方法及其遇到的一些问题。为了解决这些问题,保障电网安全稳定运
近年来随着激光器的发展,激光探测逐渐成为当今科技研究的热点。激光雷达作为激光探测一个热门方向,是人工智能和自动驾驶领域的核心。盖革模式激光雷达以其灵敏度高、像元电路简单易于集成等特点在实际系统应用中显示出强大的生命力。本文致力于研究激光雷达模拟信号读出电路,设计了一款基于盖革模式APD阵列型激光雷达探测器读出电路和一款应用于车载激光雷达探测器的TDC。本文首先对激光雷达的系统架构和工作原理进行描述
[目的]分析重庆城市妇女主要恶性肿瘤发病年龄特征。[方法]用2001~2004年重庆主城某区的恶性肿瘤新发病例监测登记资料,计算各年龄段恶性肿瘤粗发病率、疾病别发病率及构成比
湖北省是我国的产粮大省,每年到水稻、玉米和小麦收割的时候,农户通常会焚烧这些作物的秸秆来清理农田,为一轮播种做准备。由于焚烧秸秆时间集中在夏秋两季,并且秸秆数量庞大
本文对智能家居语音交互系统进行了研究,将离线语音识别技术应用到智能家居语音交互系统中来,同时把传统家电也整合进本控制系统,让智能家居交互系统不仅仅可以控制智能家电,也可以实现对传统家电的控制。本文主要研究内容为:对语音指令的定向拾取进行了详细的分析,然后对离线状态下的动态时间规整(Dynamic Time Warping,DTW)语音识别算法进行详细的介绍。针对动态时间规整算法中的模板匹配路径的搜
目前,国内外皮带输送机技术发展已经进入了一个新的阶段,大批先进的高技术含量的皮带输送机已经研究开发成功,极大地提高了皮带输送机的运输距离、运载量以及运输速度。本文
目的通过对2008-2010年呼和浩特市各档次的酒店、宾馆客房内甲醛含量进行监测,了解呼和浩特市酒店、宾馆的空气质量,为卫生监督管理提供依据。方法采用现场调查监测,用仪器现
在我国政治经济生活中农村、农业、农民问题占有举足轻重的地位,因为农村人口占全国总人口80%以上.改革开放以来,随着社会主义市场经济体制的建立,农村经济发生了巨大变化,产
吉林省是历史上碘缺乏病流行的重病区.儿童甲状腺肿大是缺碘的主要体征,为了判定甲状腺大小,选用B超法测量甲状腺容积,成为评价碘缺乏危害严重程度的1个重要指标.现将1995~200