高校网络舆情分析系统设计与实现

来源 :重庆大学 | 被引量 : 0次 | 上传用户:mqzhen1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅猛发展,网络生活已成为当代大学生的一种重要生活方式,网络舆情的引导也成为高校意识形态工作中的一个重要内容。而高校大学生群体正处于人生观、价值观、世界观形成和发展的重要时期,容易受到网上谣言的煽动,引起情绪过激行为而引发严重的群体事件。因此获取高校网络舆情数据,检测舆情热点话题,分析话题情感倾向性,对于及早发现舆论动向,及时进行舆情疏导,避免重大舆论安全事件爆发显得尤为重要。本文在传统舆情分析方法的基础上,研究了舆情数据获取和预处理、文本特征表示、主题聚类、热点话题度量、情感倾向性分析等关键技术,形成了一套功能较为完善的高校网络舆情分析系统,实现和展示了热点话题检测、话题情感倾向性分析、敏感词管理和统计、话题趋势变化、舆情信息检索、舆情信息统计、热点新闻聚焦展示、系统的相关配置和用户管理等功能,解决了目前的高校网络舆情分析系统存在的数据来源单一、处理方法简单、检测精度不高、功能不完善等问题。本文主要研究内容:通过主题网络爬虫获取了重庆大学校内论坛、贴吧、微博、新闻网等多源舆情数据。研究了一种基于Word2vec&LDA的文本特征提取方法,改进了传统基于VSM的文本表示存在的高维稀疏性、忽略潜在语义的问题,同时采用Word2vec和LDA结合的文本特征表示兼顾了LDA的文本-主题特征和Word2vec词语空间特征。本文在经典的Single-Pass聚类算法基础上研究了Single-Pass&HAC的聚类算法,在引入时间窗口和层次聚类的基础上减少了经典Single-Pass对文本输入顺序敏感的问题,兼顾了聚类质量和效率,利用该方法的文本聚类、话题检测的精度较传统的VSM&K-Means提升了约20%。同时本文结合高校舆情分析实际情况,定义了一种热点话题度量方式,可以较好的计算话题热度值,通过对热点话题的检测可以直观的展示学生所关心的话题。在文本情感倾向性分析方面,本文在传统基于规则和字典的方法基础上,通过Word2vce扩建情感词典,弥补了情感基础词典难以处理新词的问题,提升了情感分析的精度。
其他文献
本文利用国产家用微波炉,采用微波辅助衍生化技术,对9种激素类兽药进行快速衍生,用于气相色谱一质谱分析。该方法仅需60s的时间即可以达到比传统的70℃水浴45min衍生化反应更好
<正>当前我国经济进入换挡期,社会进入转型期,改革进入攻坚期,舆论宣传的环境、对象、方式都发生了很大变化。如何引领社会舆论,有效激发社会正能量,成为媒体需要承担的一项
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
会议
商标是企业重要的无形资产,是企业对于注册及未注册商标的控制、使用、维护的过程,具有显著性、独占性、排他性、竞争性、可交易性等方面的特征。因此,如何做好商标资产的管
目前脉冲激光能量测量的难度和需求急剧增加,能满足要求的脉冲能量计往往比较复杂、价格也很昂贵,因此提出了一种利用连续光功率计测量脉冲激光能量的简易方法。根据连续光功
<正>目前,村级领导班子换届工作已经启动,在此次村级领导班子换届工作中,真正把能力好、群众口碑好的人选出来,才能有力地促进和加强村级党组织建设。一、加强村级党组织带头
共享单车是现代社会的一个主要的出行方式,是在共享经济的基础上结合互联网大数据符合绿色出行理念的新型产品。本文主要探讨共享单车的盈利模式以及存在问题,并针对问题提出
1.本刊2008年10月份出版的第五期《现代科学仪器》第25页作者简介应为:“张锐(1977-)男,汉族,吉林省人,助教,黑龙江科技学院电气与信息工程学院,研究方向:基于PC机的测控系统研究”。
随着党的十八届五中全会将"绿色"发展理念首次上升至国家层面以来,"绿色消费""个性消费"理念逐渐深入人心,企业需要顺应时代潮流改变经营战略,而银行作为资金供给方,对企业及
以二甲酚橙—十六烷基三甲基溴化胺—无水乙醇络合显色体系测定了明胶中的钙。考查了测定条件。络合物最大吸收波长为560nm,摩尔吸光系数ε=1.0672&#215;10^5 L&#183;mol^-1,