【摘 要】
:
真实数据集通常密度分布不均,多数基于网格和密度的聚类算法采用的单调性搜索方法难以形成有效聚类.为此,文中提出了基于网格密度和距离信息特征的聚类算法(GDD).该算法将数
【机 构】
:
天津大学计算机科学与技术学院,天津大学软件学院
【基金项目】
:
国家自然科学基金资助项目(60603027);天津市科技计划项目(08ZCKFGX01800,08ZCKFGX01600)
论文部分内容阅读
真实数据集通常密度分布不均,多数基于网格和密度的聚类算法采用的单调性搜索方法难以形成有效聚类.为此,文中提出了基于网格密度和距离信息特征的聚类算法(GDD).该算法将数据空间划分成网格单元,并构建基于簇中心距离信息的跃迁函数,通过考察局域范围内网格单元的密度跃迁比,并比对计算出的当前网格单元的跃迁函数值,以决定是否继续扩展和增长聚类簇规模.具体的跃迁函数在真实和模拟集上的实验结果表明:GDD算法能够发现任意形状的簇,对噪音数据不敏感,且具有线性于网格数目的时间复杂性,适合对大规模真实数据集的聚类.
其他文献
医师注意义务的渊源既要考虑切实保护患者的利益,又要考虑将注意义务限定在合理的范围之内。医师注意义务的渊源应包括法律、法规、规章制度和具体操作规程,以及职务和业务上
在AODV协议对路由的维护这一过程中有一个非常重要的环节,就是对链路中断后的修复,传统的是用源点修复方法,但系统延时很大,如用本地修复可能会影响选择最段路由,因此,针对Ad
<正> 2000年12月BANDAI发售M的《机动战士高达》相信所有高达迷们仍然印象深刻吧?现在这部作品的续作《机动战士高达~相逢在宇宙》终于公布了!熟悉高达的朋友可能一眼就能看出
针对现有无人车轨迹跟踪研究中假设轮胎侧偏角始终处于线性区域的不足,提出了一种基于增量线性时变模型预测控制的轨迹跟踪方法。在每个控制周期内进行轮胎魔术公式的线性化
医疗过失问题,是医患纠纷的焦点。医师的过失行为本质是一种客观过失,是对医师注意义务的违反,因为任何医师在自己从事特定的医疗行为时都必须达到相应的医疗水准。医师的注
高频变压器作为隔离型开关电源的主要磁性元件之一,是制约功率变换器提高功率和减小体积的关键因素。为提高开关电源变压器环节的整体性能,对高频变压器的四种复合联接方式,
介绍了典型的CAN总线拓扑结构,针对导弹测发控系统的实时性要求,详细说明了本系统CAN网络负载率的计算方法,结合导弹测发控系统的报文预估表,分别计算三种网络拓扑结构的总线
古田会议奠定了思想政治工作在红军中的重要地位。从会议召开的指导思想、会议过程到会议通过的《决议》内容,古田会议蕴藏着丰富的开会艺术、宣传艺术、批评艺术、激励艺术
游梁式抽油机拖动系统一直存在几个主要问题:一是系统效率比较低;二是带有冲击的周期性交变载荷;三是能耗较大;四是半负荷或者轻负荷问题十分严重。针对上面游梁式抽油机拖动
“怀归”是苏轼诗词中相当醒目的主题之一。其词中的“怀归”意蕴,实际包含着三个层面的思想内涵:其中既寄寓着他缱绻的思乡情怀,又表现了他对朝廷的眷恋和对归隐江湖与渴望自由