面向网络舆情监控的热点话题发现技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:wuhaoxin1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国家、企业对网络舆情的日益重视,越来越多的网络舆情监控系统被开发出来帮助政府、部门或企业应对在网络上爆发的关于自己的舆论压力或群体性事件。在使用门槛很低、信息披露很容易、传播很快、影响很大的互联网环境下,监控系统实时采集相关信息,智能分析信息内容,及时发现舆情危情,为自动化解决监看、处理网络舆情提供了很好的支持,极大地方便了用户,有力地辅助用户及时正确地处理舆情危情。在大部分舆情监控的系统中,用户通过定制来源网站等信息让系统周期性地采集网站报道,经系统分析处理后将用户关心的报道呈现出来。在这个过程中,大量重复的或者描述同一事件的报道杂乱地出现在显示结果中,既不利于用户的查看、分析、总结,也不利于系统评价事件的报道详情、准确计算事件的热度,因而需要运用话题发现技术对这一问题进行改善。本文首先研究了话题发现的关键技术,在分析话题发现流程后得出聚类是其中的关键步骤的结论,因此,接下来阐述了各种聚类算法的原理并以此为基础分析对比了各算法的利弊,最终选取了在话题发现的评测中使用最多的single-pass算法,然后分析了该算法从评测走向实际应用遇到的困难和制约因素,本文中从算法响应速度、聚类精度和用户介入等角度着手改进single-pass聚类算法,最终取得了良好的实际应用效果,达成了话题发现的目标。接下来针对舆情监控的特定应用,研究热点发现的话题热度评价方法,在已有基于关注度的热度指标基础上,本文提出基于关注度和影响能力的综合热度指标,更加准确地契合舆情危情发现的目标,经过热度排序后的话题直观简洁地向用户推荐了舆情监控的急缓先后顺序,使用户可以更好地应对复杂多变的网络环境。通过在舆情监控系统中整合话题发现技术和热点发现技术形成有机统一的热点话题发现模型,具有较高的应用价值;同时,虽然话题发现技术和热点发现技术的研究比较成熟,但技术的实用化过程中遇到很多问题严重制约了技术的效果,所以在舆情监控系统中建立热点话题发现模型也具有较高的研究意义和研究价值。文章最后通过运行实例和对比分析验证了模型的可行性和有效性。
其他文献
低压配电柜的正常运行对配电网的稳定性和合理供电提供了保障,在实际运行期间,相关人员要针对其存在的问题为其提供合理的防范措施,并在日常工作中进行维护,从而保证其安全性
本文主要从沥青路面施工方面分析了路面产生不平整的原因,并提出了应采取的相应对策。
介绍了在辽宁省滨海公路防护中引入的一种新型景观防护-栅栏板的综合设计思路,并且介绍了其选型及在北方寒冷地区使用中需要考虑的重点问题。项目2008年建成后,成为当地一道
碘系消毒副产物是饮用水消毒过程中新发现的一类未受控消毒副产物。原水碘离子含量高和氯胺消毒是形成碘系消毒副产物的重要直接因素。上海市地处长江入海口,水源水质易受咸
船舶加装风帆后的操纵性能是风帆助推船设计的重要研究内容。本文针对76000吨散货船,通过加装风帆后的流体动力特性分析,建立了计及横摇在内的四自由度操纵运动数学模型;在此
在对水基钻井液废弃物处理的技术难点及传统水基钻井液废弃物处理进行分析的基础上,进行了水基钻井液废弃物无害化处理技术的设计,并以泰国曼谷LKU-L46(LBH)井为例进行了水基