一种基于自动阈值发现的文本聚类方法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:yangtianmei01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本聚类随着网上文本的激增以及实际应用中的需求,引起了人们越来越多的重视.通过分析文本的特征以及常用的文本聚类方法,提出了一种对文本进行细致划分获取细化簇、并在细化簇基础上进行聚类的文本聚类方法.在聚类过程中,采用曲线的多项式拟合技术提出了一种自动发现阈值的方法,并把该方法应用于细化簇的寻找步骤中.与凝聚的层次聚类方法的实验比较结果表明,使用自动阈值发现的方法在时间消耗、聚类效果、以及对孤立点的容忍性方面都具有更优的性能.
其他文献
得到Zakharov方程折一类精确周期解,周期解是从其Hirota双线性形式解出的,并用θ函数表示。
有限群的π-齐次性和π′-闭性的关系的问题是一个较古老的问题.文章运用同余的技巧,获得了一个较一般的结果,是前人工作的有意义的拓广及补充.
铁法热电厂2台130 t/h锅炉为无锡锅炉厂生产制造的固态排渣煤粉炉,由于锅炉结焦严重使其不能满负荷运行,文中对其结焦的原因进行全面分析后,提出了解决措施,使2台炉的结焦情