社交网络事件热度预测的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:JK0803_gengjixiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速发展,社交网络信息预测成为信息内容管理的重要研究内容之一。此前的社交网络信息预测研究中,对社交网络中信息表示与量化计算研究不足,难以有效的支撑社交网络信息传播建模和预测的研究,同时,当前的社交网络信息传播模型,大都没有考虑信息传播过程中的记忆效应对信息传播的影响或者考虑不全面,导致预测结果与实际值之间存在较大误差。首先,利用朴素贝叶斯文本分类算法将采集到的微博文本划分为十五个领域,对用户发布微博数、微博平均被点赞数、用户注册时间等影响到用户影响力的指标,建立一套科学、合理的指标体系,利用专家打分法、层次分析法(Analytic Hierarchy Process)法等对各级指标赋予权重,量化分析用户各个领域影响力和综合影响力。接着,针对社交网络信息热度进行预测,考虑信息传播过程中用户记忆效应的兴趣累积和实效衰减两方面,利用遗传算法求出记忆曲线,分析用户的记忆效应对社交网络信息传播的影响。同时,获取社交网络主页或用户中的强弱连接用户,分析弱连接用户与信息传播的关系,进而得到弱连接用户对社交网络信息传播范围的影响。最后,对信息传播的范围、趋势和速度等进行定量分析,揭示用户特征、内容相关性等对社交网络用户行为的影响。从特定主贴、话题两个层次来分析,通过提取用户各个领域影响力、弱连接、记忆效应、主贴评论数、主贴点赞数、主贴转发数等多维特征,采用机器学习方法GBDT(Gradient Boosting Decision Tree)建立预测模型,对社交网络信息传播热度进行预测,得到信息传播的范围和热度变化趋势。在实验中,根据单一变量原则,比较了不同特征对社交网络信息热度预测的影响。实验结果表明,除了热度值低于10的主贴外,综合考虑用户影响力、弱连接、记忆效应、转发数、点赞数、评论数等特征,能够得到准确率较高的预测结果,平均绝对百分误差值MAPE(Mean Absolute Percent Error)远低于30。
其他文献
近些年来,论坛、博客和微博等相继出现在互联网应用中,并逐渐成为人们发布互联网信息的主要方式。其中,论坛已成为信息发布、共享和传播的重要平台。论坛的内容由普通用户创
随着科技的不断发展,无线通信已经成为通信技术未来的发展趋势。而作为无线通信的一个分支,移动自组网Ad Hoc因其无需基础设施便可迅速组网,具有搭建迅速、组网灵活、抗毁性
在软件系统的开发过程中通常会产生了大量结构复杂、语义丰富的数据,而建立个灵活的语义模型是对各类软件工程数据进行统一管理的基础。在管理大量软件工程数据的过程中,如何
随着信息技术和网络的普遍应用,如何更好地保障信息的安全已引起研究人员的广泛关注。信息的安全保密,通常采用的是加密的方式,而加密技术的核心是密钥的保密。秘密共享就是
面向方面编程范式通过引入方面实现横切关注点的分离和封装,很好的解决了代码纠结和代码分散等面向对象程序所面临的难题,使系统易于实现和扩展,同时提升了软件的模块性和可
近年来,随着城市化进程的迅速发展,“数字城市”的建设应运而生。在“数字城市”建设的过程中,是以“数字社区”的建设为基础的,而创建“数字社区”的关键是通过三维建模技术
近年来,计算机视觉技术在农产品检测方面得到了广泛的应用,使得现代农业更具规模性和专业化。本文所研究的内容是柑橘图像分割的具体算法设计。它是课题“柑橘表面破损自动检
在计算机图形学领域,人们逐渐利用计算机来再现周围的真实世界,自然现象的建模和渲染是近几十年来计算机虚拟现实与系统仿真的一个重要研究领域,基于物理模型的流体模拟近年
随着人工智能的迅速发展,理解人类语言并能够与人类对话,给出相应的信息反馈的机器人成为了大多数人的需求。在这样的背景下,智能聊天机器人慢慢走入人们的视野。在这股机器
随着社会的发展,经济的突飞猛进,为了促进社会和谐,地震灾变的预测也就越来越重要了。现代计算机技术的迅猛发展,包括地震灾变预测等越来越多的工程计算问题都依靠于大型高性