微博舆情热点发现及趋势预测研究

被引量 : 0次 | 上传用户:hongtu200909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络设施的不断完善,移动应用等技术的快速发展,微博已经从最初满足公众社交需求的信息传播平台逐渐演变成大众化的舆论平台。微博舆情的突发性和裂变式信息传播的特性使其成为社会舆论快速的反映形式,并在一定程度上引导着舆论事件的走向。微博舆情对社会各领域的影响与日俱增,但由于其文本的特殊性以及受众多因素影响呈现出非线性复杂的变化。因此,如何高效、准确的从微博数据中发现并提取有意义的热点话题并对其发展趋势进行快速、准确的预测是一个很有价值的研究课题。本文对微博舆情的热点发现和话题发展趋势的预测问题进行研究,提出了一种基于词对主题模型(Biterm Topic Model,BTM)的微博舆情热点发现方法。首先,对微博文本采用BTM建模,改进TF-IDF(Term Frequency-Inverse Document Frequency)特征权重算法,以适应微博短文本的特征。并将BTM建模结果与改进的TF-IDF加权算法结合对微博文本进行向量表示,在考虑文档概率分布的同时融合了文档语义分布特征。有效解决了传统模型在文本建模中所面临的高维度和稀疏性问题,然后采用K-means聚类方法发现热点话题。在话题发展趋势预测方面,本文采用微博话题的博文总数作为衡量话题发展趋势的指标。考虑话题发展的复杂性和非线性的特点,采用模糊神经网络来预测微博话题的发展趋势。并以改进的粒子群优化算法(Particle Swarm Optimization,PSO)对模糊神经网络的参数进行优化。PSO算法在全局寻优和快速收敛方面具有良好的性能。模糊神经网络在处理非线性、模糊性等复杂问题上有很大的优越性,通过与改进的PSO算法的融合能够更好的发挥模糊神经网络的性能,有效解决微博舆情趋势预测中遇到的算法收敛速度慢、易陷入局部最优的问题。通过对新浪微博数据集的对比实验验证了本文所提方法在微博舆情热点发现和趋势预测中的有效性。本方法能够有效解决传统模型在文本建模中所面临的高维度和稀疏性问题,显著改善热点话题的发现质量。有效解决了微博舆情趋势预测中遇到的模型参数复杂、易陷入局部最优的问题,提高了微博舆情发展趋势预测的准确性。
其他文献
酶联免疫吸附试验(enzyme linked im-munosorbent asssy, ELISA)。自70年代中期问世以来,由于它具有特异性强,操作简便等优点,已被广泛地应用于医学检验与基础研究。因此,ELI
针对工作流软件在文档处理方面的柔性不足,提出一套灵活的文档工作流设计。系统从文档的分类、版本管理、存储结构等角度,规范了文档管理在工作流系统中的应用。给出了文档管理
随着计算机技术的发展,人们对计算机技术要求越来越高,为了满足当代人们生活、工作需求,以计算机为核心,集文本、图像、声音、视频、动画等多种功能于一体的多媒体技术逐渐取
在这信息时代下,中西方文化的交流愈发活跃,来自西方的街舞文化席卷了整个亚洲并快速在各地区发展起来。街舞成了年轻人的代名词,也被越来越多的人所知晓,如今街舞的演绎形式不再只是街头的battle,观众要求更高的审美性、可观性和创意性,衍生出齐舞的演绎形式。这更适合街舞与中国元素融合编创的发展。《Tai Ji》这部街舞作品与中国元素,太极、太极拳、民族调式、盘扣等结合。分别从作品的结构、动作语汇、音乐、
目的探讨对老年支气管哮喘患者采取护理干预的效果。方法选取66例接收的老年支气管哮喘患者,将其平分为对照组与实验组,两组分别给予常规内科护理及护理干预,观察护理效果。结果
通过化学镀法制备铜包钨复合粉末,研究不规则形状的钨粉以及经等离子球化处理的球形钨粉的化学镀铜。结果表明,对于颗粒形貌不规则棱角分明的破碎钨粉,经化学镀包覆后粉末没
本文首先阐述了“互联网+”时代立德树人的重要性。接着具体分析“互联网+”时代下,教育方式、思维、工具的变化,进而说明“互联网+”时代对高校立德树人的影响。该影响包括:
目的 分析与探讨还原型谷胱甘肽治疗病毒性肝炎的临床疗效。方法 选取60例在我院2014年10月~2015年10月接受治疗的病毒性肝炎患者。按照治疗方式区分为对照组(30例)和实验组(30
目的探讨综合针灸在腰椎间盘突出症治疗中的具体功效。方法从2011年3月到2014年7月我院收治的腰椎间盘突出患者中随机抽取70例。根据患者意愿将患者随机分别对照组、试验组均
绿色增长已成为未来经济发展的新模式,对于新兴的长江中游城市群而言同样如此。采用主成分分析法,从旅游资源禀赋、绿色投资要素、绿色产业规模、资源环境质量等四个方面选取