面向“智慧政务”文本挖掘的研究

来源 :科技与创新 | 被引量 : 0次 | 上传用户:hellangel112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主要探讨智慧政务平台留言热点问题的挖掘及排名问题,为解决该问题,建立了文本聚类模型,并进行了主成分分析。通过对文本数据的预处理,由词汇-文本矩阵的奇异值分解对向量语义化,潜在语义分析对文本向量进行语义空间降维,再计算文本的余弦相似度,结合K-means聚类算法建立文本聚类模型,实现热点问题的挖掘,并按热点汇编。对已挖掘的热点进行主成分分析,以热点的留言数、留言时间密集度、点赞数、反对数为评价指标。以指标的信息贡献率为权重计算主成分综合得分,以此为热度指数,对热点问题进行排名。最后给出了实例分析。
其他文献
本文为提升中央企业内部控制有效性,结合国内外内部控制评价理论发展趋势,通过分析中央企业内控体系监督评价面临的形势要求,阐述了中央企业建立“以风险管理为导向、合规监