【摘 要】
:
近几年,随着移动电子设备和智能手机的迅速普及,基于位置的社交网络(Location-based Social Network,LBSN)为基于位置的研究带来了大量用户签到数据,使位置预测领域取得重大突破。通过现有的预测模型可以预测出人们的出行模式、访问位置、某个特定地点的访问量和访问人员,以往难以做到的服务在如今都随着技术的进步和数据的丰富而变得易如反掌。道路规划、拥堵控制、广告投放和人流控制,这
论文部分内容阅读
近几年,随着移动电子设备和智能手机的迅速普及,基于位置的社交网络(Location-based Social Network,LBSN)为基于位置的研究带来了大量用户签到数据,使位置预测领域取得重大突破。通过现有的预测模型可以预测出人们的出行模式、访问位置、某个特定地点的访问量和访问人员,以往难以做到的服务在如今都随着技术的进步和数据的丰富而变得易如反掌。道路规划、拥堵控制、广告投放和人流控制,这些应用侧面反映了位置签到预测技术对于人们出行生活的重要意义。但是用户的签到数据往往存在着稀疏性较高、多特征交互不充分、正负样本不平衡等问题,严重影响了预测准确度。为了解决上述问题,本文提出了一种基于特征交互和训练数据挖掘的位置预测研究方法,具体研究内容如下:1.提出基于注意力机制与高阶特征交互的位置预测模型Ax DFM(Advanced Attention Depth Factorization Machine)。多特征签到数据通过SENet动态增加重要特征的权重并减少噪声信息的干扰;结合CIN结构将特征交互层级提升至vector-wise,充分考虑了隐式高阶特征交互和显式高阶特征交互,避免了人工提取特征的繁琐和局限性;最后使用注意力机制赋予高阶交互特征不同的权重来改变其对训练结果的影响。解决多特征交互不充分与稀疏性较高等问题,进而优化模型的位置签到预测准确度。2.提出基于训练数据挖掘的位置预测模型TDM-p DFM(Product-based Deep Factorization Machine for Training Data Mining)。参考点击率预测领域的曝光数据提出使用聚类分析挖掘区域流行曝光位置的概念与低信任度集合的概念,通过大量的实验对聚类个数进行选择,衍生出新的负样本抽样方式并结合信任度对负样本多样性进行扩充,以解决正负样本不平衡的问题。然后提出一种善于处理跨领域特征交互的联合训练模型进行训练,有效地提升了位置签到预测准确度。3.设计并实现了一种基于用户签到记录的位置预测平台UCP(Location prediction platform for user check-in records),该系统原型包含四个模块,主要通过位置签到预测和可视化展示直观且便捷的为用户提供服务。
其他文献
随着目前各种感知设备的发展以及各个领域都开始向数字化转型,海量数据爆发,点云作为一种典型的通过三维坐标表示物体的数据格式,被运用在了越来越多的应用场景,如医学模型重建、自动驾驶等领域。传统的点云算法在面对海量数据及复杂场景的情况下显得越来越乏力。近年来随着深度学习的快速发展,有学者开始将深度学习运用到点云处理中。其中PointCNN作为点云深度学习的代表性神经网络,在诸多领域表现出了优异的效果,然
绘画是一项古老的技术,可以追溯到旧石器时期,古猿人用绘画的形式来记录生活。随着人们物质生活的提高,绘画作品往往用来保存与传递作者所要表达的信息,与此同时它还给人们带来感官上的享受。绘制某种特定风格的图像需要具有一定绘画技术,而刻意去学习绘画技术往往需要耗费大量的时间和经历。图像风格迁移作为图像处理领域的一个分支任务,它可以在短时间内将一张普通照片转换成某种艺术风格的图像。风格迁移技术能够节省了使用
桥梁是城市交通系统中重要的组成部分,一旦发生事故往往将造成极大的经济损失,甚至人员伤亡。因此,需要对桥梁进行定期检测与维护,及早发现桥梁病害以防止出现严重的桥梁坍塌事故。目前,桥梁表观病害检测主要采用人工检测的方式,然而基于人工的桥梁病害检测方式存在主观因素大、劳动强度高、自动化程度低等缺点。随着桥梁数量的进一步增长,基于人工的检测方式已经无法满足实际工程应用的需求,因此迫切需要研究更加高效、智能
一直以来,建立一个能够和人类正常交流的对话系统是研究者们追求的终极目标,情感对话生成任务和对话中的情感识别任务都是达成这一目标的重要研究方向。目前情感对话生成模型已经能够生成包含情感的语句,但是语句的情感表达强度不够,在指定情感的情况下,生成语句的情感准确率还是无法满足现实需求。目前对话中的情感识别任务处于起步阶段,在近几年才开始受到重视,情感识别的准确率也处于一个较低的水平,准确识别对话中的情感
人体姿态估计是近年来计算机视觉领域的主流研究内容,在人机交互、电影制作、监控安全和互联网领域有广阔的应用前景。当前人体姿态估计方法在困难任务中的表现仍不尽如人意,大多数方法使用图像的全局上下文信息来预测关键点,忽略了关键点之间的关联性信息,容易导致网络负迁移学习。其次,人体姿态估计作为一项基础性研究,缺少一套完善稳定的软件系统将其应用于后续研究中。针对以上问题,本文引入了信息论中的相关性理论,将关
空间异质性是指因地理位置和时间的变化而引起的变量间关系或结构的变化,主要表现为时空非平稳性。城市用地扩张及其驱动因子表现为强烈的时空非平稳性,通过动态建模方式深入揭示这一特性,能帮助我们更好地理解城市变化的动态过程。分区建模可有效解决数据驱动的元胞自动机(Cellular Automata,CA)耦合模型中对用地转换规则的局部特征学习不充分的问题,以减小空间异质性对模拟结果的影响。针对城市群空间扩
濒危动物监测是野生保护研究的重要手段之一,但常规的监测手段需要大量人工干预,不利于全时监测的开展。因此,发展智能化的濒危动物监测系统成为迫切需要,而构建高效的目标检测模型是其中的关键所在。然而,由于濒危动物数量和分布都有典型的稀疏性,导致濒危动物图像样本的极度匮乏。若直接采用稀疏样本进行训练,模型会出现严重的过拟合,难以正常工作。如何利用极少量濒危动物样本进行学习,就成为濒危动物智能监测需要关注的
近年来,随着自然语言处理领域的快速发展,事件抽取作为自然语言处理领域非常重要的基线任务展现出了颇高的学术价值以及研究价值,因而吸引来了众多的国内外科研工作们的关注。目前大部分事件抽取相关研究是基于英文文本进行的,基于中文文本事件抽取的研究工作相对较少。事件抽取任务可分为句子级事件抽取与文档级事件抽取。句子级事件抽取相对比较容易,主要是因为句子级文本的长度相对较短,并且所描述的语义信息比较集中。对于
传统回归任务是指使用一组输入变量来预测单个连续变量,而多目标回归旨在使用一组输入变量同时预测多个连续目标变量。尽管在多目标回归方面取得了很大进展,但仍然存在三个具有挑战性的问题,即如何建模输入特征和输出目标之间的潜在关系,如何探索输入间的潜在关系以及如何探索目标间的依赖关系。本文围绕这三个挑战性问题展开研究,提出了两种有效的多目标回归算法,主要研究内容如下:1.提出了一种学习本地局部实例关联的多目