基于自监督学习的用户轨迹分析

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:xpz_peng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能手机和基于位置服务(Location Based Service,LBS)的软件的广泛使用,越来越多的人们开始使用这些软件对去过的地方进行签到,因此积累了大量的移动轨迹数据,给从轨迹数据中学习用户移动模式提供了前所未有的契机,这也将帮助提升一系列基于地理位置的业务以及管理应用,例如:位置推荐、异常的轨迹检测、犯罪辨别和流行性疾病追踪等。针对用户轨迹数据存在的稀疏性和嘈杂性以及现有的模型存在隐式反馈和弱监督等问题,本文提出了一个基于自监督移动学习(Self-supervised Mobility Learning,SML)的框架,该框架应用在用户位置预测(SML-LP)和轨迹用户分类(SML-TUL)两个子任务上。第一,SML框架主要利用辅助任务(Pretext Tasks)从大规模的没有标注的数据中挖掘出数据本身的监督信息,通过构造监督信号对模型进行训练,可以学习到对下游任务有用的表征;第二,SML是为稀疏和嘈杂的用户轨迹数据建模而设计的,通过利用丰富的时空上下文信息和增强的数据来改善轨迹的表征,可以增强模型的泛化能力;第三,SML提供了一种原则性的方法来描述内在的运动相关性,同时解决了现有的基于模型的方法中隐式反馈和弱监督问题;第四,SML在时空数据训练中引入对比实例判别法,明确区分真实用户签到点与容易被错误预测的负样本签到点。针对现有的模型性能较差和对比损失函数中存在正负耦合效应(NegativePositive-Coupling,NPC)等问题,本文提出了一个基于解耦对比移动学习(Decoupled Contrastive Mobility Learning,DCML)的框架,该框架应用在位置预测任务上(DCML-LP)。第一,DCML通过解耦对比学习(Decoupled Contrastive Learning,DCL)的目标函数,解决了轨迹正负样本中的存在的NPC效应,这个解耦操作明显提高了自监督移动学习的效率;第二,DCML去除了NPC乘数,使模型不需要依赖于较大的批处理数量来实现自身竞争性能,同时也缓解了对计算机计算性能的要求。本文在多个真实世界的数据集上对模型展开了评估,将本文提出SML和DCML框架与之前的基准方法进行比较,实验结果表明,本文的方法的性能更优越,可以改善基于位置的服务的准确率。
其他文献
数据共享开放和流通是提升沉淀静态数据价值并转换为动态资产能力的一种实现方式,通过行业间的数据共享互换从而构建多维度且丰富的数字经济产业。在数据为核心的思想下,数据在共享交换过程中的安全性、便捷性以及多方权益的考虑将直接影响到该经济产业形态下参与各方的合作意愿度。在当前的解决方案中,更多的是将多方数据汇聚于中心化的存储网络,并通过远程调用实现数据的获取,此种方案存在数据同步困难、存储维护成本高以及数
学位
按照人体由内及外的抽象结构顺序,分别从心脏电传导系统、心脏结构(包括瓣膜、心肌、冠状动脉等)、心脏外部其他系统等方面,列举人工智能(artificial intelligence, AI)特别是深度神经网络在心电分析领域的最新研究进展。本文介绍了AI心电分析技术在识别心律失常、电解质紊乱、心脏瓣膜病、冠心病及循环系统、消化系统等疾病方面的应用,还涉及其在个人身份识别领域的创新应用,以及迁移学习等A
期刊
强化学习是神经网络技术研究与应用的一个重要领域。强化学习算法主要被用于序列决策和智能体控制任务。在机器人控制、游戏AI和围棋等许多领域中,强化学习都得到了成功的应用。强化学习中的环境奖励对模型的训练起着关键的作用。然而,在很多运行环境中,算法经常会遇到奖励过于稀疏的问题。缺乏有意义的奖励信息会使模型难以高效地寻找到最优策略,这限制了部分场景中强化学习算法的实际应用。因此,研究稀疏奖励问题和其解决办
学位
随着通信技术与互联网的普及,人们所接触到的数据量呈现指数级上涨,大部分都是未进行标注的数据并且数据结构呈现出多视图,图结构的特性。多视图聚类算法通过挖掘数据之间潜在的联系,将数据分为指定的簇,从而对数据进行有效的利用,以解决生产实践中的各种问题。多视图聚类算法可以大概分为基于传统机器学习和基于深度神经网络的聚类算法。受益于自表达模型和深度神经网络的强大特征表示能力,这些算法在许多任务中展现了良好的
学位
<正>心电图(electrocardiogram,ECG)因其无创无痛、价格低廉、简便快速等优点,成为临床上诊断疾病和评价心脏及全身状态最常用的工具之一。然而专业医务人员需要结合肉眼观察和丰富的个人经验出具心电图报告,耗费大量时间和精力且无法保证稳定的准确性。结合人工智能(artificial intelligence,AI),心电分析技术应运而生,并迅速引领了临床疾病诊疗、预后评估、结局预测及发
期刊
按照党中央、国务院关于全面划定永久基本农田并实行特殊保护以及建立健全永久基本农田"划、建、管、补、护"长效机制的决策要求,自然资源部部署全面开展永久基本农田划定成果核实工作,要求建立永久基本农田储备区和耕地保有量储备区,构建动态监管体系。本文结合北京市永久基本农田评估调整工作,重点探讨基于北京市空间大数据平台,整合规划数据、现状数据、质量评价数据、监督检查数据、审批数据等,建立永久基本农田专题应用
期刊
在计算机视觉技术高速发展的时代,传统的目标检测算法虽然能检测出某些目标物体,但其准确度不够,相比之下,基于深度学习的目标检测技术能够更好的检测出目标对象。但随着相关技术的发展,逐渐涌现出一些问题,比如在某些应用场景下,可供训练的样本数据量很少,因为搜集满足要求的标注数据需要耗费极大的财力和物力,这在一定程度上限制了现有目标检测方法的落地应用与推广。针对以上问题,本文对基于小样本的目标检测与跟踪模型
学位
近年来,国内社交媒体上关于在华外国人“受优待”的报道多番引发热议,讨论中不乏国民对于在华外国人群体的负面评价。此类媒体报道如何影响国民对外国人群体的态度?如果引起负面群际态度,会如何影响外国人群体在中国的跨文化适应,以及国民与在华外国人之间的跨文化交际?现有文献虽然关注在华外国人的跨文化适应,但是较少聚焦媒体相关报道这一因素对整体群际态度的影响,也很少考虑受众个体跨文化敏感度的差异,无法为改善群际
学位
在后疫情时代,“大学生就业难”成为社会关注的热点话题。随着人才市场上的竞争越来越激烈,越来越多的大学生选择通过实习提升求职时的竞争力且选择职业的价值取向也发生了改变。已有文献更多关注通过实习提升的技能对求职成功率的影响,很少文献关注实习对实习生心理状态的影响以及它对就业产生的影响。另外,很少文献将实习生和正式员工看作两个群体,研究实习生对正式员工的态度是否对实习生的心理状态产生影响。因此,本研究将
学位
掌握俄语并利用其丰富的资源,与悉心研究词汇的本质和意义密切相关。多年来俄罗斯语文学家始终高度关注有关俄语语言规范和言语素养方面的关键性问题。本论文的研究对象是积极运用于人类活动各个领域、经常在言语使用中遇到困难的俄语近音词。众所周知,俄语近音词的巧妙运用,有助于文学家、新闻工作者、格言创作者和广告策划人准确清晰、生动形象地表情达意;反之,其无意混用,常导致口笔语表述者出现各种各样的言语错误。本论文
学位