微博信息转发预测研究

来源 :山东财经大学 | 被引量 : 0次 | 上传用户:yxs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,基于Web2.0技术的社交网络发展迅猛,社交网络的应用已深深扎根于人们的生活,成为人们日常生活不可或缺的沟通平台和信息来源。而微博作为一种兼具分享和交流功能的新型社交网络平台,自一出现便以摧枯拉朽之势扫荡互联网。微博社会网络中信息传播采用典型的推送和转发机制,而微博转发功能可以使用户快速分享对其有价值的、重要的微博,实现信息在社交媒体上快速扩散,影响网络舆情,所以如何有效预测用户的转发行为对理解舆情在微博平台上的传播方式、舆情管控都有着重要意义。  当前在转发预测研究领域,大多数都是对转发量的预测和对博主粉丝的转发行为的预测,但是信息接收者对指向性博主的转发行为预测的研究极少,所以本文主要基于信息接收者的角度,通过分析影响转发行为的特征因素,使用机器学习中的二分类算法实现预测。主要研究内容如下:  首先,依据实际问题通过构建网络爬虫的方式获取微博真实数据集,包括用户的交互关系信息、微博文本信息和转发情况等。为了获得关系较完备,整体结构较完整的有价值的数据,对初始数据进行转换与有效性过滤。考虑到僵尸粉的影响,本文通过设定用户活跃度阈值的方式去除僵尸粉。  然后,构建影响微博转发特征体系,考虑到用户的固有属性和微博信息属性,选取了用户固有特征、用户历史特征、操作特征、粉丝转发倾向性特征和待预测文本与粉丝兴趣相似度特征。鉴于计算粉丝转发倾向性和兴趣相似度时需要对文本相似度进行度量,本文提出一种基于现代汉语分类词典的文本相似度算法。  最后,为了更加准确的预测信息转发情况,分别基于支持向量机和基于逻辑回归建立二分类模型,通过实验结果对比选出最适合预测真实微博社交网络转发行为的分类算法,实验结果显示,基于支持向量机的分类模型性能上优于逻辑回归模型。通过构建对比实验,验证了本文提出预测模型的有效性,使用错分率作为衡量指标,分析本文提出的影响因素对预测模型效果的贡献性。
其他文献
在经济全球化的今天,随着市场竞争的加剧,企业越来越重视由技术创新所带来的竞争力量的提升,并逐步形成以技术创新为核心的发展战略,以不断提升其社会和经济效益。作为技术创
小学语文是学生学习语文的基础性阶段.并且小学语文的学习可以影响学生的学习习惯,能力和兴趣的培养.小学语文的学习和其教学质量的提高这一课题在教育领域内被广泛的关注.所
课外阅读是小学语文教学中的重要环节,通过课外阅读,可以打破书本教材的限制,让学生接触到更多的文学作品.建构主义学习观认为在知识学习阶段,学习者应该基于主体,在有效情境
小学语文教学是素质教育的基础,也是培养学生学习习惯与语言能力的重要学科.在开展小学语文教学中,由于缺乏趣味性,学生参与课堂的积极性普遍不高,对于这种情况需要教师寻求
随着我国教育事业的发展,课程改革的不断深入,培养学生全面发展已经成为目前教学工作的重点.在小学阅读课堂的教学中,为了能够让学生进一步地得到发展,我们需要从提升学习兴
随着班班通工程逐渐推进,电子白板已经普及到我们学校每一个班级.这一汇集了尖端电子技术、高端软件技术的高科技产品,整合了现代多媒体教学优势,它走进课堂,奏响了小学语文
在小学语文学习过程中,作文对于学生而言是十分困难的一个环节,同时也是提高学生写作能力最为重要的方式,可是就现如今小学语文作文教学情况来看,还是存在一定的问题,而本文
在当前小学语文教学当中,阅读教学,是语文教学当中的重要内容.而当前语文教学方式方法日益多元化,在阅读教学当中,以往传统的教学方式,已经不能适用于当前语文教育与教学的发
微课是近几年随着互联网技术的发展而兴起的一种新型教学模式,它通过视频来讲解知识点.微课的出现改变了人们的学习方式.目前我国小学语文教师信息化教学能力参差不齐,本文就