【摘 要】
:
在现代社会,网络社交成为人类社交活动的主流方式。对社交网络中信息的演化方式及传播过程进行理解和研究,发现其中潜在的规律是一大研究热点。信息级联预测主要通过观察信息的早期传播情况,从而预测信息级联最后的增量。尽管关于级联预测的研究已经有很多,但仍存在以下问题:一是忽略信息级联演化过程的问题,主要包括信息级联动态演化过程缺失以及单一静态图无法表征实际信息级联演化过程等;二是对信息传播所产生的特征提取不
论文部分内容阅读
在现代社会,网络社交成为人类社交活动的主流方式。对社交网络中信息的演化方式及传播过程进行理解和研究,发现其中潜在的规律是一大研究热点。信息级联预测主要通过观察信息的早期传播情况,从而预测信息级联最后的增量。尽管关于级联预测的研究已经有很多,但仍存在以下问题:一是忽略信息级联演化过程的问题,主要包括信息级联动态演化过程缺失以及单一静态图无法表征实际信息级联演化过程等;二是对信息传播所产生的特征提取不全面的问题,主要包括建模角度单一、缺失整体建模思维以及整体与局部信息无法同时提取的问题。本文主要针对以上两个问题进行研究,主要研究成果如下:(1)针对忽略信息级联演化过程的问题,本文提出了一种基于信息级联子图采样的级联预测模型Sub Cas。该模型根据设定的时间步参数,将静态信息级联图划分为若干级联子图,每个级联子图通过基于节点的方法进行采样,然后结合自注意力机制对邻阶结构特征和历史时序特征依次进行学习,并运用多头注意力机制来捕获社交网络不同面的影响。该模型在两个公开数据集上,与基线模型进行了对比,就影响模型的参数、组成必要性进行了分析,实验结果显示本文所提模型Sub Cas是有效的。(2)针对级联特征提取角度单一,无法同时提取整体和局部特征的问题,本文提出了一种融合局部图和全局图的信息级联预测模型GLCas。该模型在考虑信息级联动态演化过程问题的基础上,从局部图和全局图两个角度对信息级联图进行特征捕获。该模型运用图卷积网络学习局部图结构特征,再通过双向长短时记忆循环神经网络捕获节点间的依赖关系和时序特征,与全局图的结构特征表示融合后进行预测。与信息级联代表模型的对比实验表明GLCas模型可有效融合级联图的局部与全局特征,预测准确性得到有效提升。(3)针对项目实际需要,本文设计并实现一个具有信息级联预测和用户统计分析功能的信息级联预测子系统。该系统主要包括用户模块、数据分析模块以及用户交互模块。用户模块主要实现用户基本信息及权限管理;数据分析模块基于Sub Cas模型和GLCas模型对社交网络信息进行处理,对模型进行训练,并实现级联预测;用户交互模块将预测结果及当前系统的用户分布、发布信息特点等通过表格或折线图方式进行展示。
其他文献
随着通信技术与互联网的普及,人们所接触到的数据量呈现指数级上涨,大部分都是未进行标注的数据并且数据结构呈现出多视图,图结构的特性。多视图聚类算法通过挖掘数据之间潜在的联系,将数据分为指定的簇,从而对数据进行有效的利用,以解决生产实践中的各种问题。多视图聚类算法可以大概分为基于传统机器学习和基于深度神经网络的聚类算法。受益于自表达模型和深度神经网络的强大特征表示能力,这些算法在许多任务中展现了良好的
<正>心电图(electrocardiogram,ECG)因其无创无痛、价格低廉、简便快速等优点,成为临床上诊断疾病和评价心脏及全身状态最常用的工具之一。然而专业医务人员需要结合肉眼观察和丰富的个人经验出具心电图报告,耗费大量时间和精力且无法保证稳定的准确性。结合人工智能(artificial intelligence,AI),心电分析技术应运而生,并迅速引领了临床疾病诊疗、预后评估、结局预测及发
按照党中央、国务院关于全面划定永久基本农田并实行特殊保护以及建立健全永久基本农田"划、建、管、补、护"长效机制的决策要求,自然资源部部署全面开展永久基本农田划定成果核实工作,要求建立永久基本农田储备区和耕地保有量储备区,构建动态监管体系。本文结合北京市永久基本农田评估调整工作,重点探讨基于北京市空间大数据平台,整合规划数据、现状数据、质量评价数据、监督检查数据、审批数据等,建立永久基本农田专题应用
在计算机视觉技术高速发展的时代,传统的目标检测算法虽然能检测出某些目标物体,但其准确度不够,相比之下,基于深度学习的目标检测技术能够更好的检测出目标对象。但随着相关技术的发展,逐渐涌现出一些问题,比如在某些应用场景下,可供训练的样本数据量很少,因为搜集满足要求的标注数据需要耗费极大的财力和物力,这在一定程度上限制了现有目标检测方法的落地应用与推广。针对以上问题,本文对基于小样本的目标检测与跟踪模型
近年来,国内社交媒体上关于在华外国人“受优待”的报道多番引发热议,讨论中不乏国民对于在华外国人群体的负面评价。此类媒体报道如何影响国民对外国人群体的态度?如果引起负面群际态度,会如何影响外国人群体在中国的跨文化适应,以及国民与在华外国人之间的跨文化交际?现有文献虽然关注在华外国人的跨文化适应,但是较少聚焦媒体相关报道这一因素对整体群际态度的影响,也很少考虑受众个体跨文化敏感度的差异,无法为改善群际
在后疫情时代,“大学生就业难”成为社会关注的热点话题。随着人才市场上的竞争越来越激烈,越来越多的大学生选择通过实习提升求职时的竞争力且选择职业的价值取向也发生了改变。已有文献更多关注通过实习提升的技能对求职成功率的影响,很少文献关注实习对实习生心理状态的影响以及它对就业产生的影响。另外,很少文献将实习生和正式员工看作两个群体,研究实习生对正式员工的态度是否对实习生的心理状态产生影响。因此,本研究将
掌握俄语并利用其丰富的资源,与悉心研究词汇的本质和意义密切相关。多年来俄罗斯语文学家始终高度关注有关俄语语言规范和言语素养方面的关键性问题。本论文的研究对象是积极运用于人类活动各个领域、经常在言语使用中遇到困难的俄语近音词。众所周知,俄语近音词的巧妙运用,有助于文学家、新闻工作者、格言创作者和广告策划人准确清晰、生动形象地表情达意;反之,其无意混用,常导致口笔语表述者出现各种各样的言语错误。本论文
随着智能手机和基于位置服务(Location Based Service,LBS)的软件的广泛使用,越来越多的人们开始使用这些软件对去过的地方进行签到,因此积累了大量的移动轨迹数据,给从轨迹数据中学习用户移动模式提供了前所未有的契机,这也将帮助提升一系列基于地理位置的业务以及管理应用,例如:位置推荐、异常的轨迹检测、犯罪辨别和流行性疾病追踪等。针对用户轨迹数据存在的稀疏性和嘈杂性以及现有的模型存在
2020年新冠疫情爆发,本次灾难对俄罗斯社会民生产生了极大的冲击。新冠病毒在对人们的身体健康产生极大危害的同时,疫情信息过载以及内容的真假混杂——“信疫”(Infodemic)也对人的心理健康造成了威胁。此种重大突发公共卫生事件下,媒体作为传播媒介,担负着引导舆论、安抚民众的使命。尤其在“信疫”这场次生灾难面前,使用合理、针对性手段报道新冠疫情是各媒体需要攻克的难题。近年来,俄罗斯官方媒体“今日俄
随着软件应用领域的不断扩宽,管理软件的体系结构日趋复杂化,对产品质量的要求日益增加。本文旨在通过研究如何快速高效地开发管理软件,基于可变性建模软件开发引擎的项目背景,构建一个业务组件分析管理子系统。该系统能够从代码级业务流中挖掘可复用组件,实现组件的可变性接口封装,以业务组件的形式为软件开发引擎提供技术支持。本文的主要工作如下:(1)组件挖掘方法:基于可复用组件挖掘方法的研究现状以及管理软件的特点