基于移动轨迹大数据的时空特征挖掘与异常轨迹检测

来源 :贵州民族大学 | 被引量 : 0次 | 上传用户:xia__1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随数字技术时代的到来,基于智能计算(如人工智能和机器学习)的大数据分析与挖掘技术受到了高度关注。从海量的移动轨迹数据中挖掘有趣的、隐含的、先前未知的、有价值的模式或者知识具有重要的理论意义和应用价值。尤其是,在交通领域探寻大规模移动轨迹数据之间蕴含的有意义的统计规律以及挖掘基于乘客出行受到的欺诈行为(异常的移动轨迹)。本文以时空特征挖掘与异常轨迹检测为主要研究内容,旨在于细粒度地分析乘客出行的时空特征分布规律,动态感知城市交通状况,实现基于司机绕行异常轨迹的高效检测,提升居民出行体验,进而为居民出行、客运服务、道路交通规划等提供理论基础与技术支撑。本文研究的主要工作及创新性如下:1.数据预处理:针对移动轨迹大数据在挖掘分析中存在的问题,对移动轨迹数据进行数据预处理。首先,对原始轨迹数据集进行经纬度和行驶状态的过滤以及重复值和缺失值的删除等预处理工作。其次,根据车辆的行驶状态提取出基于载客状态下的行驶轨迹。最后,基于高精度的隐马尔可夫模型的地图匹配算法,通过与路网数据相结合,将轨迹数据映射到实际道路中。2.时空特征挖掘:针对移动轨迹大数据(如出租车GPS轨迹数据)在构建智能交通系统中具有重要的社会价值和经济价值,对其进行高效挖掘与深度分析,能为城市交通管控和乘客合理出行提供重要有益的决策参考,提出一种基于伽马分布和聚类分析的时空特征挖掘方法,以分析乘客出行的时间特征、空间特征和时空特征,进而揭示乘客出行模式。首先,发展一个能够完整清晰地识别乘客出行轨迹的信息框架进行数据预处理。其次,构建一种新的分布模型,以准确探寻乘客出行的分布规律。最后,提出一种基于Spark框架的挖掘乘客出行时空特征的分布式聚类方法,以分析不同时段乘客出行的特征变化。案例研究结果表明,出行时长和出行距离呈对数正态分布,以及出行距离尾部与三参数伽马分布高度拟合。3.异常轨迹检测:针对异常轨迹检测效率低、无法准确识别绕路行为的异常轨迹等问题,提出一种基于成本因子的异常得分模型(ASM-CF,Anomaly Score Model Based on Cost Factor),通过充分考虑轨迹的空间位置差异性和乘客出行的成本差异性,能够较好地适用于司机存在侥幸心理绕行引起的异常轨迹情况。首先,发展一种城市路网栅格化方法,将轨迹以网格序列形式予以表达,并对轨迹进行增强处理,以得到连续的网格序列轨迹,解决行驶相同路径而轨迹点记录不同的问题。其次,提出一种识别出租车司机绕行的异常轨迹定义方法,以准确识别基于绕行的乘客出行异常轨迹问题。第三,构建基于距离和持续时间的成本因子,并通过成本因子建立ASM-CF模型,以提高异常轨迹检测的准确性。最后,案例研究表明,在不同的轨迹对数据集中,ASM-CF模型的F1值分别为0.960、0.977、0.927、0.976和0.993,可以有效地检测轨迹的异常程度,以及准确判别不按正常路线行驶和恶意绕路等异常行为。
其他文献
“酸性设计”是时下在部分青年群体中十分流行的一种新兴视觉风格,它特指一种在视觉感受上迷幻抽离、混乱无序、兼具复古感与未来感的图像类型,是2018年基于互联网平台形成的小众美学风格。在概念诞生的几年间,受到小部分青年的热烈追捧,并慢慢从小众美学转变为青年间熟悉的视觉语言,在当下已成为一种代表着青年文化的时尚标签。虽然其发展势头迅猛,但作为新型的视觉风格,在学术领域鲜少有学者对其进行深入的讨论,为填补
学位
随着数字化技术的飞速发展,图像恢复在监控、计算摄影和医学成像等领域有着广泛的应用。在数据采集过程中,图像常常会发生退化,通常在尽可能大的程度上改善图像质量的好处远远超过所涉及的恢复算法的成本和复杂性。从退化的图像中恢复出清晰图像的问题在许多实际应用中起着重要的核心作用。图像预处理时,求解不适定问题的方法包括图像去噪,图像平滑,去模糊等,为了解决这类问题,人们对盲图像去模糊进行了大量的探索研究。近年
学位
[目的]研究营养强化低脂羊奶粉对幼龄动物生长发育及脂肪含量的影响。[方法]给予幼龄SD大鼠营养强化低脂羊奶粉,试验周期42天。测定动物生长发育指标(体重、体长)、食物利用率、甘油三酯、胆固醇,及体内脂肪和股骨骨密度。[结果]营养强化低脂羊奶粉组与空白组比较,生长发育指标(体重、体长)无不良影响,股骨骨密度明显升高(P<0.01),营养强化低脂羊奶粉对体脂无明显影响。[结论]营养强化低脂羊奶粉可促进
期刊
近年来,新兴技术的不断发展推动着人类社会生活的急速转变,同时新冠疫情的冲击之下,各行各业面临着突如其来的冲击,大量社会劳动力面临着失业的风险,社会稳定性周受到一定的冲击,菜市场首当其冲收到严重影响,在一定程度上动摇了整个中国社会的整体民生保障;以互联网企业为代表的资本集团在受行业存量限制,盈利能力变弱的情况下,纷纷进入底层市场,对原有的底层社会市场造成了严重的打击,进一步挤压了作为基础民生保障设施
学位
在快速城市化的进程下很多城市表现出同质化的问题,城市缺乏个性,城市家具作为连接城市与人的媒介,与地域文化结合能成为冲破这种同质化的一个出口,并且随着物质条件的发展,人们开始关注城市在人文精神的塑造层面,文化品位变得愈发重要,新时代的城市家具需要满足人们对于城市的信仰和情感需求,让人们产生归属感,让城市家具发挥更多精神价值。本文以兴宁巷城市家具与地域文化的结合为出发点,通过研究城市家具在公共空间中的
学位
期权交易产生以来,学者们对期权定价问题进行相关研究.在价格波动的情况下,亚式期权比欧式期权和美式期权更实惠,其中亚式期权是一种具有活跃性和代表性的新型期权.研究时间分数阶BlackScholes(B-S)模型下亚式期权的数值差分方法,不仅有实际价值,又有理论意义.针对亚式期权定价问题,提出了时间精度2-?阶、空间精度4阶的高精度的?差分方法和高精度的显-隐(E-I)差分方法,以及高精度的隐-显(I
学位
现代信息技术在中职物理课堂教学中具有不可替代的优势,以教育的信息化来促进教学内容、教学手段和教学方法的现代化。能够让教师拥有更好的教学方式,能够提升学生的学习趣味性,在教学效率的提高方面有着极为出色的效果。
期刊
本文通过利用Ekeland变分原理、山路引理和对称山路引理研究了带有变指数的Kirchhoff型问题解的存在性和多重性.一方面,我们考虑了如下p(x)-Kirchhoff方程其中Ω(?)RN是光滑的有界区域,a≥b>0是常数,p∈ C(Ω)满足 1<p-=(?)p(x)≤ p(x)≤(?)p(x)=p+<N,f(x,u)为连续函数.我们讨论了下列两种情形:(1)当l=0时,应用山路引理和对称山路引
学位
众所周知,21世纪是信息传播速度急速暴涨的时代,具有辐射范围广,传播速度快的特点。在信息的世界里,图形的地位是毋庸置疑的,其所具有的直观性与传播性导致了原有的文字世界受到了冲击。图形逐渐崛起,与此同时,信息的爆发性增长促成了现代图形设计的流行。动物拟人化表现语言在当今互联网时代作为现代图形设计中的重要表现手法,越来越受到大众的关注。在现代互联网经济繁荣的当下,动物拟人化表现语言图形以多变灵活的图形
学位
病灶分割是医学图像分割的主要内容,决定了医学图像在临床诊疗中是否能够提供可信的依据。运用机器学习算法处理图像病灶并完成分割是热点也是难点,其一,精确分割的病灶可以为医生的早期诊断提供有力的证据,为确诊皮肤癌的患者及时提供治疗,有效降低癌症死亡率;其二,皮肤病灶的分割是一项艰巨的任务,因为成像技术对诊断效率的影响较大,且皮肤癌图像本身也存在关键信息占比小、背景信息扰动、病灶边缘模糊和信息表达能力不强
学位