一种基于表示学习的传播模型研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:shunniu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络是继门户网站、搜索引擎之后互联网发展的第三次浪潮,2000年以来,诸如Facebook、Twitter之类的社交平台接连涌现,各种服务日新月异,社交网络已经完全重塑人们的生活和工作方式。出于商业推荐、舆论管控、谣言阻断等社会需求,社交网络上的信息传播问题成为了当下的热门话题。而研究此类问题的难点在于人类的行为十分复杂,我们很难量化影响信息传播的因素,同时也不能确定信息传播的模式。众多研究人员按照自己的思路建立了信息传播模型,他们提出的很多经典的社交网络传播模型都需要完整的网络结构,其中用户间的连边属性也是可获取的。但通常在真正的社交网络上,用户数量都特别巨大,人们很难准确地描绘出它的具体的网络结构。反观现实生活,在研究人与人之间的人际关系网络时,我们获取的网络拓扑结构也通常都是残缺的、不完整的,这就造成想要预测信息的传播变得相当具有难度。因此为了克服数据不全的问题,我们引入了表示学习的方法,在明确影响信息传播因素的基础上,用数学模型加以概括,最后尽可能地还原信息传播的动态过程。为了解释社交网络上信息扩散的机制,本文介绍了复杂网络理论和信息传播理论的概念,以四个著名的社交网络为研究对象,分析了在线社交网络特性与信息扩散的关系。基于复杂网络的基本理论,我们从节点的度分布、同配性、小世界和无标度特性等角度研究了网络拓扑与用户发布、转发等信息传播行为之间的关系,并尝试分析影响网络传播的潜在因素。随后我们介绍了表示学习的思想和相关模型,并基于此理论提出了一种基于用户偏好和影响力的社交网络信息传播模型(简称IPM)。该模型综合考虑了用户影响力和用户兴趣两种因素,自动将用户和传播项表示成欧式空间中的低维向量,再依据特征向量的值预测信息的传播结果。网络中的每个用户都被投影到一个隐空间中,此称为影响力空间。用户之间的影响程度由他们的特征向量间的几何距离决定,距离越近,影响力越强。同时,所有用户和传播项被投影到第二个隐空间中,此空间称为用户偏好空间。用户对传播项的兴趣由他们的特征向量间的几何距离决定,距离越近,偏好程度越大。我们的算法使用期望最大化算法作为基本框架,用随机梯度算法优化特征向量的值,通过模拟实验确定数学模型的参数。最后我们设计了两种方案、三个指标来评估模型,在多个人工网络和真实网络进行信息传播的预测实验。本文的模型在准确度和时间成本上也都好于其他的无需网络结构的模型,这说明它能更精确地模拟传播进程,预测信息传播的结果。综上所述,本文在确定了影响信息传播的因素之后,利用表示学习的方法,避免了繁琐的特征工程,丰富了研究对象的物理含义,结合了相关外部特征,提升了信息扩散模型在预测结果方面的精确度以及效率,为解释信息的传播机制提供了新的思路。
其他文献
随着城市建设的快速发展,地铁逐渐成为人们出行的主要交通方式之一,相较于地上交通,地铁有快速、不堵塞的优点,但是由于地铁站本身半封闭的结构特点,其内部的空气品质应该引
义务教育课程标准中明确规定了义务教育阶段各年级英语学习所应达到的听、说、读、写能力具体目标。写作是英语教学中的难点之一,只有学习者充分掌握语言规则,写作能力才能得以提升。而西南地区地理位置特殊,经济发展相对迟缓,教师群体教育观念更新相对较慢,社会大环境对学生个体发展影响颇大,且七年级学生处于初中英语学习的初级阶段,在词汇运用、语法理解等方面仍然存在困难,加之汉语与英语为不同的语言体系,存在较大差异
数据中心市场的规模化发展促使服务器电路板集成度越来越高,热流密度趋于密集化,释放的热量急速增加,有统计表明,单个电子元器件工作温度每提高10℃,其因为散热不良导致的热失效概率上升至少一倍,为满足数据中心服务器持续稳定运行要求,就需要及时对其运行中产生的热量进行平衡。数据机房基础设施的能耗主要由电子设备、空调系统、电源系统等组成,其中空调系统能耗占比仅次于IT设备,大约占数据中心全部能耗的40%。而
传统管幕工法是以单个钢管顶进为基础,各钢管间仅用锁扣连接,最终形成整体管幕结构,随后在管幕内部边开挖边架设临时支撑,最后再修建结构主体。传统管幕工法虽然能够减少开挖
社交媒体的飞速发展赋予了社交网络上的信息传播快速、海量的特点,使得对社交网络上的信息传播的研究具有重要的政治、社会、经济意义。其中对信息传播预测的研究,由于其在广
《中学生》杂志是开明书店在1930年创办的教育类综合月刊,它以中等教育程度的青少年为读者对象,以补足课堂知识、提供丰富的趣味、解答读者困惑、指导青少年前途和做便利的发
随着人类对未知领域的探索活动日益频繁,非完整约束移动机器人发挥着越来越大的作用。但由于机器人很多参数存在不确定性,而且在运动过程中,会受到外界环境施加的各种干扰,所
建筑物识别是通过计算机视觉设备获取建筑物图像信息,然后使用建筑物识别技术对图像中的建筑物进行分类和识别。该技术在智能视频导航、智慧城市智能交通和无人设备定位等领
基于深度学习的编码器-解码器框架在图像描述生成领域取得了很大的成就,它的本质是利用卷积神经网络挖掘图像中所蕴含的信息并进行编码,再利用循环神经网络来将此编码转换成
近年来,小篮球运动的发展越来越受到人们的重视,它降低了参与篮球运动的门槛,以其独有的魅力和特殊的教育意义赢得了广大儿童少年的喜爱,逐渐成为他们喜爱的体育项目。在此基础上,中国篮协在全国多地开展小篮球联赛,打造儿童少年篮球比赛的专属平台,小篮球联赛的建立极大的满足了儿童少年的需求,激发了学生对小篮球的学习兴趣。2018年10月,为推动我国青少年篮球项目运动的发展,促进长三角地区的经济与文化交流,经江
学位