基于短文本的热点话题识别与热度趋势预测研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:wangjue419
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在科学技术快速发展的信息时代,人们越来越习惯于借助互联网进行对信息的获取、热议和传播等活动。网民们在充斥着海量数据的互联网上不断关注着各式各样的内容,并对它们发表看法、表达情感。微博作为以短文本为主的代表性社交网络平台,能产生反映丰富用户特征的数据,这些数据蕴藏着无限的社会价值和商业价值。因此如何基于文本特征以及从用户的角度出发,及时发现网民们真正且反复关注的话题,并对这些话题进行热度的趋势预测成为政府相关部门和企业的关注重点,也对整个和谐网络舆论环境的构建、搜索引擎服务的优化、个性化决策支持的改善以及信息服务的完善都有着至关重要的推动作用。本文旨在针对微博短文本进行因网络舆情事件产生的热点话题识别和热度预测研究,即实现基于文本特征和用户特征的热点话题检测和热度跟踪。本文研究内容主要可分为以下三个方面:(1)基于短文本的话题提取。本文采用基于动态嵌入模型BERT和基于改进K-means聚类算法的话题提取技术实现从文本特征的角度对微博短文本进行话题的提取,进而通过实证分析,从网络舆情事件中提取到该事件所产生的话题数与话题内容。这些话题反映了网民对该网络舆情事件真正关注的角度和内容,因而能准确及时地获取网民对该网络舆情事件的关注点。进一步实现了对网络舆情事件变化情况的更好把握以及后续对舆论的正确引导。(2)基于短文本的热点话题识别。首先介绍了热点话题相对于话题的区别以及研究热点话题识别的意义,然后从用户特征和用户行为的角度对热点话题进行量化分析,提出了影响话题热度变化的两个关注度:关键意见领袖关注度和基于用户行为的关注度。最后通过构建的热度公式计算出话题热度值并从中成功识别出了热点话题。(3)热点话题的热度趋势分析。本文采用LSTM模型对已识别到的热点话题进行基于数据的点赞量、转发数、评论数这三个维度的热点话题的热度趋势预测。通过模型的训练与效果的验证,成功获得了拟合度较好的预测模型。结合实证分析,并根据网络舆情生命周期理论和构建的热度衰退函数对预测结果进行了对比分析,从而对热点话题的热度趋势变化在不同阶段所产生的影响进行了具体的深度剖析,提出了针对不同对象在不同阶段针对热点话题热度变化的应对措施,同时也深层次地了解到信息的传播原理。
其他文献
随着我国经济的飞速发展以及股票市场的不断发展完善,股权质押以高效性和便利性,流动性强,权利性的优势,加之上市公司融资渠道较为有限,而资金需求较大,股权质押迅速发展成一种受欢迎的融资方式。控股股东通过股权质押获得了资金,存在利益侵占可能,同时高比例股权质押可能使公司面临平仓风险,这会对公司产生怎样的影响?本文选择以“建材化工+医药制造”双轮驱动为经营模式多元化发展的三圣股份作为研究对象,探讨三圣股份
现代汉语词典里“写生”的释义主要是以西方对于对景写生的理念而总结的术语,它的解释是“直接以实物或风景为对象绘画”。但中国传统的写生含义要更加广泛,这其中既包括绘画方式,还包括艺术家根据客观现实物像表达出自身内在的情感与思想,将所绘对象写活的意识形态,即得其心源。中国传统写意花鸟画的对景写生历来都是中国花鸟画创作中的一项重要组成部分,历代名家都有关于写生的论述以及相关的作品呈现。一个艺术家的创作能力
学位
伴随科学技术的更新迭代,理论创新、算法创新、实践创新都在不断突破原有技术瓶颈,在网络通信中多学科交叉融合的技术背景下,信息物理系统(CPS)也得到快速发展壮大。在控制理论中CPS系统通常被描述成离散化状态去分析,针对系统的网络安全可以从网络攻击类型和源头去规避风险,对于提高系统性能可以从降低信道时延和去除数据冗余两个角度整体优化,根据上述分析本课题从攻击型别、信道时延、数据冗余三个方面问题展开研究
绘画艺术源于生活,当代都市化的生活方式早已深入人心,越来越多的油画作品中运用了都市生活的元素表现,都市题材作品也随着时代发展逐渐多了起来,每个时代都有每个时代各自的时代风貌,每个时代的艺术家对他们所生活的社会的描写也各不相同,我们所生活的时代处于一个日新月异的发展过程,时代的进步也在一点点地改变了我们生活的方方面面,也影响了绘画艺术创作。文章从三个部分来进行论述,首先通过梳理美术史上城市题材的油画
近些年来,为了帮助企业走出融资约束的困境,政府推出了一系列的金融改革政策,调控市场助力企业发展,但是融资约束仍是限制企业发展的主要因素。在企业深陷筹资难、筹资贵困境的同时,互联网金融的发展鼎故革新。互联网金融的发展是金融市场的创新升级,它打破传统金融业不可撼动的垄断局面,翻开了世界金融新篇章,是金融界的革命。互联网金融依托于先进的互联网技术,针对企业在融资过程中出现的信息不对称,融资成本高且途径单
吴冠中是我国著名画家、美术教育家、散文家,在我国画坛具有极大影响力。吴冠中的绘画强调画面的形式感,他提倡在写生中要转移写生角度与地点,移花接木,移山倒海,运用各局部的真实感构建虚拟的整体效果。在中国的意象风景油画的发展过程中,吴冠中具有承上启下的作用,开辟了风景油画表现形式的新道路,他利用点、线、面来构成画面,使画面具有极强的抽象性与形式美感。同时把中国绘画里面"意境"的营造方法运用到油画创作中,
当今时代科学技术高速发展,网络技术是促进科技进步的强有力推手。遍布于日常生活和工作学习中的各种网络,引起了研究人员的极大关注。现有大多数复杂网络研究都是集中在单层网络,然而,现实中网络与网络之间通常存在相互作用关系,用单层网络模型难以刻画这种复杂的关系。因此,本文提出了更为一般的网络模型——多层网络模型。本文研究了几类多层复杂网络的同步问题,主要包括以下几个方面:随机多层同质网络的牵制自适应控制同
当今绘画艺术呈现出丰富多元的面貌,这是由每个创作个体的思维方式、内心情感、生活感悟和精神内涵通过自我个性化的转述所凝聚而成。当我们面对那些经典画作时,容易被出神入化的绘画技巧所吸引,一直停留在技法的研究上,会忘却探究其技法背后所蕴含的精神和意义。绘画不单单是对客观事物表象的描绘,而是探寻事物内部本质,追寻绘画内心和精神层面的探究,找到恰当的绘画语言对抽象的事物进行表达。绘画创作与个体紧密联系在一起
本文介绍了艺术家通过运用绘画语言从而形成了画面中的律动,并借由绘画来表达内心感受。以德国表现主义杰出画家埃米尔·诺尔德为例,简要介绍他的生平以及他受印象派、野兽派影响转变到表现性绘画风格的过程。笔者对他的农民肖像画、宗教神秘、城市生活、海洋花卉等作品进行了分析,并解读他画面中律动的表达。发现画家将大量的情感注入到绘画中,通过他强烈的主观认知,构建出了一幅幅具有强烈碰撞的色彩,自由奔放的笔触,浑厚质