论文部分内容阅读
[目的]从网络舆情数据流中获取潜在热点主题,帮助政府与企业进行重点舆情监测与正确舆论引导.[方法]对微博实时数据流进行增量式舆情主题检测,选取并量化能够区分主题热门与非热门的特征项,选择逻辑回归(Logistic Regression)与支持向量机(SVM)两种机器学习模型作为潜在热点主题预测的候选模型,通过模型训练与效果对比确定最佳的潜在热点主题识别模型.[结果]Logistic Regression相比SVM更适合作为潜在热点主题识别模型,其召回率为0.89.[局限]方法缺少在多样化社交媒体平台的应用.[结论]本研究构建的模型能有效识别网络舆情潜在热点主题,为政府与企业的舆情监测与舆论引导提供帮助.