基于高权重词集的增量聚类算法研究

来源 :微计算机信息 | 被引量 : 0次 | 上传用户:lovesici
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本聚类作为一种无监督的机器学习方法,已经成为对文本信息进行有效地组织、摘要和导航的重要手段,为越来越多的研究人员所关注。本文以网络论坛的话题发现和追踪为背景,通过对论坛中的帖子进行聚类分析而获取话题。本文以层次聚类算法为基础,进行改进,提出高权重词集的概念,基于此设计并实现了增量聚类算法,通过实验验证了该算法适应动态数据以及时间、空间复杂性上的优越性,证明了系统在设计的时候采用的系统架构的合理性及必要性。
其他文献
冷气系统如保鲜库、冷库等具有较大的时变性、非线性和时滞性,经典控制理论和现代控制理论的最优控制难以达到精确的控制。本文以某厂冷库为控制对象,采用变斜率规则自调整的