【摘 要】
:
随着移动互联网、位置信息获取等技术的进步和发展,很多带有定位设备的装置(比如车辆、船舶等)产生了大量的移动目标数据。当前,时空数据的轨迹相似性挖掘研究已经成为了数据
【出 处】
:
中国科学院大学(中国科学院大学工程科学学院)
论文部分内容阅读
随着移动互联网、位置信息获取等技术的进步和发展,很多带有定位设备的装置(比如车辆、船舶等)产生了大量的移动目标数据。当前,时空数据的轨迹相似性挖掘研究已经成为了数据挖掘的热点研究方向之一,它对于用户个性化路线推荐、道路交通优化、气候变化规律分析等都具有十分重要的意义。轨迹相似关系挖掘是指通过不同的轨迹匹配度量方法计算轨迹之间的匹配程度,它是轨迹聚类、轨迹异常检测、轨迹-用户链接关系挖掘等一系列问题研究中最关键的方法之一。通过轨迹相似关系挖掘,可以很形象的刻画时空数据中轨迹与轨迹之间的关系,为把握分析对象的特性提供更好的参考依据。本文充分利用目前深度学习技术在语义特征提取分析方面的技术优势,重点研究了轨迹相似关系挖掘问题,及其在轨迹-用户链接关系中的应用和优化。本文的创新性主要体现在:1.本文提出基于深度学习的轨迹语义信息表征的方法,其中语义信息包括轨迹中的序列依赖性、时间规律、位置偏好等特性,该方法以轨迹的POI(Point of Interest)位置序列信息为输入,通过基于LSTM(Long Short-Term Memory)的方法对POI位置序列做向量表征,使用表征的向量来判断轨迹和轨迹之间的相似关系。同时利用轨迹和轨迹之间的相似关系提出TULSN(Siamese Network for Trajectory-user Linking)模型解决了大规模的时空数据由于隐私性原因所造成的难以准确进行轨迹和用户链接的问题,该方法分为训练和分类两个部分。通过训练使得同一个用户产生的POI位置序列信息的嵌入表征接近,不同用户的POI位置序列信息的嵌入表征远离;通过KNN(k-Nearest Neighbor)的方法找到与已知用户轨迹最相似的轨迹判断未知轨迹的用户。论文在两个公开数据集上进行实验,评估TULSN模型的性能,实验结果表明,与已有的轨迹-用户链接相比,TULSN模型在识别轨迹的用户准确率上提升了18.72%。2.本文针对时空数据规模较大,难以高效地查找相似轨迹以及不同位置点对轨迹之间相似关系影响不同的情况,提出基于self-attention的方法,获得可以用于区分轨迹目标最重要的POI点,并为其赋予更高的权重,提高了轨迹语义相似性计算的准确率;同时为了提升大规模时空数据中相似轨迹检索效率,引入了deephash的方法,将基于深度学习得到的轨迹嵌入表征进行了简化,提高了搜索效率。实验结果表明,改进后的TULSN方法在准确率和效率上都优于改进前的TULSN方法。
其他文献
西蓝花(Brassica oleracea L.),又称青花菜,是富集具有抗癌活性的异硫氰酸酯(Isothiocyanates,ITCs)和硒的良好试材。ITCs是硫代葡萄糖苷(简称硫苷)在内源黑芥子酶的作用下降解的产物之一,能够有效地防止膳食中多种致癌物质引起的DNA损伤。硫酸盐胁迫通过提高硫苷含量进而促进西蓝花中ITCs的富集,而硫苷含量与植物体内硫含量密切相关,由于硒和硫在原子大小、化学性质
肟类化合物是一类廉价易得、储存方便且反应活性高的含氮合成子,关于该合成子的研究备受关注。肟类化合物的N-O键键能较弱(平均键能57 kcal·mol-1),比一般的C-X(X=C,N,O)键键
20世纪50年代以来,由于环境恶化加剧,环境保护在世界范围内逐渐被重视。众多国际条约、“环境宣言”及各国宪法、法律都对环境及其保护进行了明确规定。环境权亦在各种文本的法律条款中被明示抑或暗示,也逐渐成为众多学者进一步探讨环境权的理论依据。特别近些年来在我国,环境权作为一种新兴权利,受到了学界及社会各界的高度重视,就其是否应该作为一种基本权利——环境权在宪法及法律中予以明示引起了激烈的争论。分析各国
对于日地环境耦合过程的深入探测以及对空间天气的实时监测将有助于保障人类日益频繁的空间活动。其中空间电场的探测数据可用于揭示空间粒子能量来源和加速机制、极区物质的
人体基因编辑技术是在分子层面对遗传信息进行精准修饰的技术,通过删除、替换、增加特定基因组序列,改变生物体遗传信息,进而影响人体相关性状表达。基因编辑技术在人体运用的首要目的就是预防和治疗重大疾病,并在此基础上推动我国医疗技术的进一步发展,但是人体基因编辑技术在给我们带来医疗红利的同时也引发了社会、伦理、法理等诸多不容忽视的问题。通过对我国现行人体基因编辑技术相关法律规范的梳理,不难发现现行行政法律
目的:进行脓毒症患者不同阶段的血栓弹力图(thromboelastography,TEG)和常规凝血指标的动态研究,综合评价脓毒症患者中TEG及常规凝血指标对凝血功能障碍的诊断价值。方法:根据
随着科学技术的不断发展,信息技术的进一步革新,传统的生产生活方式都在向着数字化、智能化转型。电子数显式仪表作为数据监控与测量的重要工具,在工、农、林、牧、渔等行业发挥着重要作用,对保障正常、合理、安全的生产生活具有重要的价值。电子数显式仪表凭借其直观性强、测量精度高等优点得到了越来越广泛的应用。但是,目前仅有少量的电子数显式仪表具备网络传输数据功能,可以实现测量数值的自动获取。在很多户外便携式设备
苯硼酸和氨基化合物在有机合成中都是非常重要的物质,可以参与很多不同类型的化学反应,并且两者共同参与的有机反应在合成化学和医药化学中更是存在着无限可能性,对于这类反
目的:凝血因子Ⅷ(coagulation factor Ⅷ,CFⅧ)是机体内源性凝血途径中的核心酶系,在组织因子触发的凝血级联反应中发挥关键作用,CFⅧ活性降低将会增加颅内出血风险。同时,CFⅧ与von Willebrand因子(von Willebrand factor,v WF)可形成CFⅧ/v WF复合物,以进一步维持彼此性质的稳定。另一方面,CFⅧ/v WF复合物也可介导血小板的聚集和粘附
日冕物质抛射(CME)会影响近地空间环境,带来地磁扰动,严重时会使卫星失效,电网瘫痪,全球定位系统和通信受到干扰,影响人们的生产生活,因此预报它能否到达地球及何时到达地球