论文部分内容阅读
网络舆情是网络上人们对某个问题或现象而发表言论的一种方式。可以通过对分析网络舆情提供给政府和企业的决策者以帮助。但随着网络信息的爆炸式增长,传统的数据处理方式已经难以胜任网络舆情分析的工作,需要通过如Ha⁃doop这样的大数据平台进行处理和分析。Mahout作为Hadoop中高维度、海量、复杂数据的处理算法集。可以有效地处理网络舆情的海量数据。因此,该文提出了利用TF-Gini提取文本特征和Mahout核心算法进行网络與情分析方法。