论文部分内容阅读
基于文本挖掘技术的智慧政务舆情分析研究
摘要:对智慧政务平台的群众舆情建立了文本聚类模型进行信息挖掘与分析。基于FastText原理利用Python语言进行数据预处理并实现文本数据的分类。使用TF-IDF算法将文本信息转换为权重向量并提取文本关键词,结合K-means聚类算法建立文本聚类模型,实现对群众舆情中高频热点问题的挖掘和排序。最后,对政府反馈意见以信息量、可解释性、相关性3个评价指标进行权重计算,构建了广义线性回归模型的评价指标体系。