基于文本聚类的映射聚类算法研究

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:spaiwy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本聚类在信息过滤和网页分类等方面有着较好的应用,可是它面临数据维数很高的难点。由于维度很高,使得经典的聚类算法难以有效处理。针对这个问题给出了一种快速鲁棒的映射聚类算法,其中利用关联规则查询簇的相关维,然后使用相关维进行进一步的分析。实验结果说明了该算法具有速度快以及较好的鲁棒性等特点,可以应用在文本聚类中。
其他文献
昆山市陆家人民医院是1964年由联合诊所改制而来的全民所有制医疗机构,在编人员110人,担负着全镇35000常住人口、19000外来人口的医疗、预防和保健任务.作为经济相对发达地区
跨边界访问问题是现代计算机必须解决的一个基本问题。主要介绍了跨边界访问问题出现的原因和背景,以及主流的实现跨边界访问的技术,并从效率、软硬件开销、实现的复杂性等方
国务院办公厅转发<关于城镇医药卫生体制改革的指导意见>和<关于农村卫生改革发展的指导意见>以后,我们进行了认真学习和调研,结合实际情况,进行了积极的探索,做了一些有益工
结合Metropolis准则,对模拟退火算法进行了研究。阐述了模拟退火算法的基本原理及其实现过程,在Visual C++编译环境下实现了该算法。并将其运用到解决旅行商问题的优化之中。介绍
面对海量的信息如何挖掘出有用的知识是当前研究的热点问题,对Web文本进行分类预处理,可在一定程度上解决此问题。针对Web文档的多主题特性,采用了多分类器模型,根据Web文档具有
摘要:促进旅游需求能力的实现和消费能力的提高是全面建设小康社会的一个重要组成部分。从武陵山区的实际情况和全面建设小康社会的基本标准看,旅游业带动武陵山区实现全面小康具有可能性,为加快武陵山区旅游业的建设要制定相关的发展策略与措施。  关键词:武陵山区;全面小康社会;旅游业;措施  中图分类号:F592.7文献标识码:A
<中共中央、国务院关于卫生改革与发展的决定>明确指出:"卫生机构要通过改革和严格管理,建立起有责任、有激励、有约束、有竞争、有活力的运行机制."后勤保障体制改革是医院
目的分析河南省2000年孕产妇贫血率,城乡、孕期及贫血程度构成比情况.方法:根据孕产妇保健手册中血常规报告血红蛋白含量最低的一次分孕周、贫血程度,根据调查的医院分城乡进