【摘 要】
:
随着越来越多基于地点位置服务的产品得到应用,轨迹数据的体量也与日俱增,轨迹数据变成了一种常见的数据类型。面对海量的轨迹数据,如何有效地对其进行挖掘分析成为了事关重
论文部分内容阅读
随着越来越多基于地点位置服务的产品得到应用,轨迹数据的体量也与日俱增,轨迹数据变成了一种常见的数据类型。面对海量的轨迹数据,如何有效地对其进行挖掘分析成为了事关重要的问题。轨迹数据具有很多不同于其他数据类型的基本特征:1)时序性:轨迹是由传感器或定位装置在相同或不同的时间间隔下采集到的地点坐标信息;2)空间差异性:轨迹数据是有差异地分布在区域空间中;3)时空紧耦合:轨迹数据同时具有时间与空间上的特性,且时间和空间的关系极其紧密;4)结构复杂:通常来说轨迹之间长度不一,采样频率也会有差异。本文以时空轨迹数据为对象,研究对其有效的聚类和异常检测算法。在所有轨迹挖掘技术中,轨迹聚类和异常轨迹检测占有重要地位。通过对轨迹数据聚类和异常轨迹检测可以发现轨迹中存在的相似或异常的运动模式,进而为实际的应用诸如交通流量监控、地点热区发现和用户行为模式发现提供有效信息。本文中主要包含两个研究内容。第一,针对现存技术简单地将时间序列的算法迁移到轨迹数据上或者只考虑轨迹几何空间上的相似性,未能提出一种能够良好结合轨迹时空信息对轨迹进行表征和距离度量的方法,本文提出基于度量学习的轨迹聚类算法,它能有效提取轨迹时间和空间的相似性信息,并在相似空间中迭代地优化轨迹图谱聚类结果和轨迹之间的度量函数,从而最终得到轨迹特征向量、轨迹度量函数和轨迹聚类结果;第二,针对全局异常轨迹检测问题,提出基于密度聚类的异常轨迹检测算法。该检测算法首先提取轨迹的上下文相似性信息,从而构造轨迹特征表示,然后通过密度聚类的思想发现全局异常轨迹点,最后提出了基于核密度函数的异常评分因子,通过该异常因子对全局异常轨迹进行打分排序,查找出全局Top-N的异常轨迹。
其他文献
《离骚》中贯穿着一个宏大精密的比兴体系。它可分为材料、本体、运作三个系统。材料系统分为十二个子系,既丰富又具条贯;本体事理分为五大方面,涵盖了《离骚》的主要内容;运作系
地方政治相对于中央政治而言,是历代王朝政治的组成部分。地方政治的变迁既受制于中央王朝政治,同时也对中央王朝政治的方方面面施加着自己的影响;尤其是它处于国家与社会之
器乐合奏课在高师音乐教育中具有重要的意义。针对目前高等师范院校在器乐合奏课教学的薄弱状况甚至是空白的现状,笔者进行了分析,并对课程设置的教学目标、课型课类的安排以
多目标优化问题(Multi-objective optimization problems,MOP)是指需要同时对不止一个目标进行优化求解的问题,这些目标之间是相互矛盾的,在对其中一个目标优化的同时会导致其他的目标劣化,该类问题的求解是需要找到一组能够使各个多目标之间优化性能均衡的解。机组组合优化问题作为一种典型的多目标优化问题,其研究具有很大的经济效益与环保效益,遗传算法在解决机组组合优化问题时
目的:探讨芒针治疗中风后平衡功能障碍的临床疗效。方法:将我院收治的204例脑卒中后肢体功能障碍患者分为对照组和治疗组。治疗组采用芒针治疗,对照组采用普通针刺治疗,两组
目前高等院校教学管理信息系统对成绩管理更多的是一种数据的积累,在根本上并不能提高教学质量。学习一直以来都是一个循序渐进的过程,因此,必须重视学习的过程,否则获得的成
网络购物平台让老百姓的生活变得更加便利与丰富多彩,网络购物的迅速发展离不开物流行业的发展。物流行业发展较快,其自身的工作模式和性质决定了物流行业发展需要吸纳更多的
<正>习作是小学语文学科最重要的课程内容之一。常态的习作教学课堂,惯用的模式是"激发习作兴趣——明确习作要求——发出习作指令",但是这样的习作课仅仅是"学生进行习作"的
新中国美术史写作是近年来学界的热门话题。史料问题在中国古代美术史写作中已经得到了研究者的普遍重视,但在新中国美术史写作中却几乎没有得到重视。运用"知识考古学"的方
如今,外宣翻译的需求量与日俱增。通常外宣文本中含有大量文化负载词,而文化负载词最能体现一个国家的文化与语言特色。由于中西方在文化背景、思维方式、语言表达等方面存在巨大差异,使得文化负载词的翻译成为外宣文本翻译中的一个难题。本文首先简单介绍了《九世班禅》英译项目,然后从不同角度对文化负载词进行定义,并根据项目真实案例,总结了本项目中文化负载词的翻译难点,包括文化背景知识缺省、反映藏族特有事物、大量汉