论文部分内容阅读
结合当前大数据环境,面向各大高校贴吧网站提出基于Hadoop的高校舆情监测系统模型,能够对海量贴吧数据通过网络爬虫进行定时采集、Hadoop对文本数据进行分布式存储与并行计算、NLPIR对文本进行分词、Word2Vec对文本分词进行特征提取,从而发现舆情热点话题,并针对热点话题评论进行情感倾向分析,通过可视化呈现分析结果,达到高校舆情监控的目的.