基于注意力机制的Hashtag推荐算法研究与实现

来源 :西北大学 | 被引量 : 0次 | 上传用户:youxiing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Hashtag在社交平台中很常见,它是用来标注主题和参与话题讨论的一种方式,它能够提升信息组织和信息传播的效率,从而提高社交网络中的用户参与度。标注Hashtag是一个既复杂又费时的过程,因此大部分用户不愿手动为社交内容添加一些Hashtag。针对这个问题,如何高效地根据用户发表的内容自动推荐Hashtag成为了热门的研究话题。利用文本数据进行Hashtag推荐的研究相对较多,而集中在图像或者将图像和文本结合的Hashtag推荐方法比较少。在社交媒体中用户分享的图像通常包含丰富的语义信息,如果可以借助这些信息,Hashtag推荐的效果就会显著提升。因此,Hashtag推荐研究要充分考虑到图像或者图文结合信息和Hashtag之间的相关性。针对两个不同社交平台的Hashtag推荐问题,本文提出了多个基于注意力机制的推荐算法,并实现了一个博客系统。本文具体的内容如下:(1)针对Instagram社交平台中的图像Hashtag推荐,本文提出了三个基于注意力机制的Hashtag推荐模型:Single-Attention模型是由单个预训练的VGG-16网络和一个注意力模块构成;Hierarchical-Attention和Stack-Co-Attention这两个模型分别使用两个不同数据集训练的VGG-16网络提取图像特征,并利用注意力机制从图像信息中选择出对推荐有用的特征,过滤掉无关的特征。在开源的HARRISON数据集上进行充分实验,验证了提出的模型拥有更好的推荐效果。(2)考虑到Twitter社交网络中信息的多模态性,本文设计了一种基于自注意力与协同注意力机制的Hashtag推荐模型。图像和文本结合能弥补图像Hashtag推荐的不足,自注意力机制能够解决文本序列长距离依赖问题,协同注意力机制可以利用图像和文本之间的互补关系。在Twitter数据集上做了一系列对比实验,结果显示该模型的效果优于其它算法。(3)设计并实现了一个博客系统,并将本文提出的推荐算法融入到该博客系统的算法模块中,完成系统总体架构和数据库的设计,最后进行系统的开发和测试等工作。
其他文献
兵马俑是我国优秀历史文化的重要载体。随着光学感知和计算能力的提升,基于三维扫描的数字化建模广泛应用于兵马俑的保护和展示中。三维扫描构建的兵马俑稠密点云冗余数据多,数据量大,降低了处理、传输和展示的效率,现有点云简化方法往往强调执行效率而忽视了点云特征的保持。本文针对兵马俑点云在应用和展示中对特征保持的要求,提出了一种基于深度学习的三维点云简化方法,通过二维图像特征线提取三维点云的特征点,对非特征点
源代码漏洞检测是确保软件系统免受网络安全攻击的关键。构建深度学习模型进行漏洞检测是目前重要的研究方向,但已有的工作在模型训练时大多将程序视为顺序序列或无类型代码属性图,由于忽略了代码本身的结构信息,因而导致产生大量的误报情况。为了改进上述问题,本文提出一个新型漏洞检测模型框架FUNDED,利用图神经网络(GNNs)构建基于图关系的漏洞模式匹配方法,用以捕获程序的控制,数据,调用和依赖等代码间的关系
基于内容的图像检索作为信息检索领域重要的研究技术之一,可以在海量的图像数据中检索出所需要的数据,在大数据时代背景下具有重要的作用。社交媒体图像检索作为一个重要的应用场景,在长期的发展过程中,主流的方法都将图像使用单个特征进行表示,其内在的缺陷导致检索形式单一、检索效果欠佳。在实际的检索应用中,人工标签缺乏导致训练不佳、维度灾难导致检索响应慢等问题也会同时出现。在本文中为了解决社交媒体图像检索在实际
口腔白斑(OLK)是一种有癌变风险的慢性疾病,但由于其癌变潜伏期长,人们容易对其忽视从而导致严重后果。目前对于口腔白斑的诊断主要依靠专业口腔医生视觉判断,但由于口腔白斑的病变组织与口腔内其他健康组织极为相似,疾病的误诊率较高。利用图像分割进行口腔白斑辅助诊断能够在一定程度上降低疾病误诊率,但由于口腔白斑病灶形状复杂、质地不够均匀、病变区域特征信息丰富等原因,传统的Mask Scoring R-CN
临床诊断和定量分析通常需要高分辨率的磁共振(Magnetic Resonance,MR)图像。然而由于新生儿大脑体积小、大脑发育不成熟和缺乏专用成像设备等因素,磁共振扫描仪采集的新生儿图像存在分辨率不高、信噪比偏低和部分容积效应等失真现象。为了提高新生儿磁共振图像的质量,超分辨率(Super Resolution,SR)技术是一种有效并且可行的方法。与传统的图像超分辨方法相比较,基于深度学习的方法
移动增强现实应用近年来发展十分迅猛,它新奇的交互方式带给了使用者独特的沉浸式体验,目前已经被广泛应用于娱乐,医疗,教育等领域。但是由于移动增强现实应用存在大量计算密集型任务(目标识别、检测及渲染),能耗开销较大,从而给计算资源和电池资源有限的移动端设备带来很大的能耗负担。由此,通常将移动增强现实计算密集型任务卸载到云端进行处理,并给移动端返回处理结果。但针对高清移动增强现实图像内容,有限的上行带宽
自适应软件能够在不断变化的软件操作环境下自主动态的改变软件行为以提高软件鲁棒性,软件资源配置是软件的重要组成部分,针对目前应用软件的资源配置不能根据软件状态动态调整的问题。本文研究在软件资源配置中自适应软件的应用。结合资源配置场景,本文给出了自适应软件较为通用的解决方案——和普。本文首先提出了和普系统模型,该模型结合了强化学习技术的智能体-环境架构,解决了传统自适应软件耦合度高的问题。第二,针对不
病理组织的精准分割为癌症的临床诊断与分级的提供重要依据,然而精准的分割依旧面临着多种阻碍。目前对病理组织的分割任务主要分为两方面,一是对组织区域进行分割,这部分存在组织区域中异常区域和正常区域相似,难以准确分割的问题,和组织切片中其他结构的影响导致分割出的组织区域内部连通性差的问题。二是对组织中的以腺体为代表的个体水平的分割,这部分存在不同癌变程度下腺体形态多变,同一网络难以同时高精度、高形状准确
随着移动互联网应用的迅猛发展,数据信息呈井喷式增长,同时也带来了“信息过载”问题。在此背景下,推荐系统应运而生。个性化推荐系统可以根据用户的兴趣特征和历史行为,为用户推荐其感兴趣的信息。尽管推荐系统被广泛使用于各个领域,但在实际的应用中也存在着以下不足:(1)就优化目标而言,许多推荐算法的研究往往集中在提高推荐结果的准确性,而缺乏一定程度的意外性、偶然性和多样性推荐,因而产生的推荐结果不能满足用户
近年来,数字化技术在文物的研究、保护上取得了飞速发展和应用。传统的三维扫描建模,不能了解文物内部的损毁情况、结构等。计算机断层成像即CT(Computed Tomography)技术,可以通过无损检测技术重构文物的内部构造。CT技术的核心是图像重建算法,代数重建算法(Algebraic Reconstruction Techniques,ART)是一种迭代算法,适合于不完备投影情况下的图像重建,其