基于密度的分布式聚类算法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:YU168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文介绍了JDM的三个核心组成部分及三者之间的关系,详细讨论了JDMAPI的部分接口、方法。 聚类分析是数据挖掘中的一个重要研究领域,目前聚类在销售、多媒体和生物学等方面的应用越来越广泛。在这些应用领域中,数据都分布在不同的站点上,如果使用传统的聚类算法从这些分布式数据中提取信息,就必须把这些数据合并到一个中心站点上。由于传输速度和安全因素的限制,把各个站点的数据都集中到中心站点上是十分困难的,在某些领域中把数据集中到一个站点几乎是不可能的,额外开销很大。 DBDC算法是一种基于密度的分布式聚类算法,针对DBDC算法在局部聚类和全局聚类上的不足进行了改进。改进后的算法能够有效地处理局部站点的噪声数据,在不明显降低效率的前提下有效地提高了分布式聚类的准确性。
其他文献
学位
报纸
学位
学位
学位
期刊
学位
数据仓库、OLAP和数据挖掘是计算机科学的一个技术热点.很多行业都将这些技术应用到自己的信息系统中,取得了明显的效果,但是医院信息系统中对于数据的处理还多限于"增"、"删"、"改"、"查"等操作,这些操作属于医学数据库的低层次应用,缺乏对数据的集成和深层分析,更谈不上对医学知识的自动获取.本文设计并实现了基于三层B/S模式的分布式体系架构的医院信息分析系统EssentrisAnalytics Sy
学位
报纸