【摘 要】
:
随着移动互联网和移动定位技术的快速发展,海量轨迹数据得以汇聚。轨迹分类是时空数据挖掘领域的重要研究内容。近年来,不少学者将深度学习应用在轨迹分类领域,并取得了不错的进展,但如何有效利用轨迹的时空信息一直是一个研究难点。本文以提高轨迹分类精度为目标,立足于时空信息增强和神经网络模型构建两方面,针对数据集是否含有标签,开展有监督和无监督的轨迹分类研究。主要研究工作包括:1.在轨迹数据时空信息增强方面,
论文部分内容阅读
随着移动互联网和移动定位技术的快速发展,海量轨迹数据得以汇聚。轨迹分类是时空数据挖掘领域的重要研究内容。近年来,不少学者将深度学习应用在轨迹分类领域,并取得了不错的进展,但如何有效利用轨迹的时空信息一直是一个研究难点。本文以提高轨迹分类精度为目标,立足于时空信息增强和神经网络模型构建两方面,针对数据集是否含有标签,开展有监督和无监督的轨迹分类研究。主要研究工作包括:1.在轨迹数据时空信息增强方面,针对轨迹运动特征呈现的移动物体行为模式不够全面、准确的问题,引入了停止状态和转向状态两个辅助特征来增强空间信息。同时,为了使轨迹特征数据中的时间信息更清晰、周期规律更明显,提出了基于递归图的时间信息增强方法。2.在有监督分类模型构建方面,首先针对输入数据的特点,构建了双自编码器模型来初步学习输入数据的高层次特征。其次,针对高层次特征数据分布的特点,提出基于预定义质心生成算法的分类层及其损失函数计算方法,能够进一步学习有助于有监督分类的高层次特征。无监督分类模型方面,则进一步提出了无监督分类模型。同样基于预定义质心生成算法,引入两种不同统计距离类型的损失函数来构建聚类层,能够确保模型学习到有助于无监督分类的特征。3.在模型训练方面,为了使训练过程能较快收敛且模型性能良好,提出了先预训练后联合训练的两阶段模型训练方法,以及动态损失函数权重的训练策略。此外,针对有监督和无监督的分类任务,分别制定了不同的模型停止训练的策略。4.为了检验本文方法的有效性,在Geolife和SHL两个真实世界轨迹数据集上进行对比实验。在进行消融实验后,对模型复杂度和数据采样率敏感度进行了分析测试。本文方法在Geolife数据集上,最高有89.5%的有监督5分类准确率、64.1%的无监督3分类准确率;在SHL数据集上,最高有89.6%的有监督5分类准确率、83.5%的无监督3分类准确率。结果较近年来代表性方法均有不同幅度的领先。
其他文献
随着第五代移动通信(5th Generation Mobile Communication,5G)技术的出现,移动到移动(Mobile-to-Mobile,M2M)通信系统朝着信息化、智能化方向飞速发展。由于具有低成本、低时延和较好的信噪比等特点,M2M通信系统中车辆、无人机(Unmanned Aerial Vehicle,UAV)等移动通信端在军事、农业和交通等领域得到广泛应用。但复杂的通信场景
目标跟踪技术作为计算机视觉技术中一个不可或缺的组成部分,在自动驾驶、医疗诊断、智慧交通、国防军事等领域有着广泛的应用,受到了国内外学者的关注与研究。尽管近些年目标跟踪算法已经取得了长足的进步,但是构建一个能够适应形变、旋转、光照、遮挡等众多干扰因素的鲁棒跟踪算法依然是一项极具挑战性的任务。本文以Siam FC孪生网络跟踪框架为基础,从网络结构、多层特征融合、模板更新机制、重校验机制和时空上下文信息
“一带一路”的提出,为沿线国家相互合作、共赢互利提供了平台。虽然“一带一路”沿线国家的平均经济增长率高于世界的平均水平,但是能源使用量和CO2排放量却超过世界平均水平,其中CO2排放量更是占到全球CO2排放总量的近1/2,交通运输的CO2排放量占CO2排放总量的1/4。“一带一路”运输和物流系统的全球可持续发展已提上议程。因此,如何转变成低消耗、低排放与高效率的物流发展模式,实现经济社会发展与生态
第5代移动通信(The 5th Generation Telecommunication,5G)技术已经给我们的生活带来了极大的便利,但用户服务需求日益提高的同时,通信所需的频谱资源和能源也急剧上升。作为近年来快速发展和应用的无线传感网络因其高性能和低成本的优点迅速融入了以5G为中心的新一代无线通信网络中,由于传感节点对电源的过度依赖,如何保证通信的能量效率(Energy Efficiency,E
随着国民经济的飞速发展,现代人的消费观念已经发生很大转变。越来越多的人愿意花钱买“方便”,由此也催生了很多懒人经济下的产物,其中即时配送服务便是最具代表性的新兴产业之一,而外卖服务则是即时配送服务最为典型的服务类型。近年来,众包骑手(接包方)、商家(发包方)与外卖平台间的矛盾频发,外卖平台对众包骑手及商家服务提成的收取问题成为社会热门话题。本文首先通过研究国内主流外卖平台,发现外卖平台以及加入平台
根据文本自动生成图像有广泛的应用基础,例如文字联想图片、文字自动配图,以及通过文本存储代替图像存储实现图像压缩等。同时该研究还能有效推动视觉和语言的跨模态学习和推理的研究进展。在医学领域从诊断报告生成病例图像可以为医生提供疾病诊断的参考,也可以一定程度上解决医院定期删除数据造成的对过往病例图像查询困难的问题,为医院节省存储资源。目前所有的文本到图像生成研究都基于自然图像,由于自然图像追求内容的丰富
车载云计算是目前车联网技术中的研究热点之一,而计算卸载是车载云计算中重要的技术组成部分,它是平衡车联网中多样化业务需求和车载计算机有限能力之间矛盾的有效技术之一。本文以车载云为研究背景,重点研究车载云计算中的任务卸载策略。在对现有计算任务卸载技术进行总结和分析的基础上,分别从资源分配和任务分配两个方面对车载云计算中的任务卸载策略展开深入的研究,主要工作内容如下:1.现有基于博弈的车载云计算的资源分
商品商标一般由商标图案与商标文字两部分组成。随着商品经济的不断发展与人们的知识产权意识不断提升,商标在商品流通过程中扮演着越来越重要的角色,商标申请数量逐年上升,商标侵权案件特别是与商标文字相关的案件也逐年增多。现有主管部门的相关工作需要自动化手段的辅助,因此商标文本检测作为多种自动化手段开发的首要步骤有着重要意义。然而,由于商标文本结构复杂,背景干扰丰富等问题,现有文本检测方法在检测商标文本时会
自2008年比特币诞生以来,作为比特币底层技术的区块链,在金融、医疗和保险等众多领域得到了广泛的应用。但由于区块链技术本身的特点,大多数的区块链应用都是一个个独立的网络,不同的区块链之间难以进行有效的资产或者数据的流通,所以产生了区块链跨链技术来解决不同区块链之间的价值交换的问题,在当前的跨链技术中,应用最广泛的是原子交换技术,但当前的原子交换技术还存在着安全性低、交易速度慢等问题,针对此类问题,
随着互联网不断超出预期的快速发展,单一的集中式控制器已经无法满足当今运营商、互联网企业以及用户的需求。据估计SDN未来产值在2024年将会达到704.1亿美元,单一的控制器架构延伸到多控制器架构是必然趋势。实用拜占庭算法就是多控制器同步算法之一,但是其通信和时间复杂度达到了O(2)。同时在分布式SDN选路过程中,在计算控制层面的逻辑节点拓扑时需要考虑每一个控制器所管控的交换机拓扑情况,只针对控制器