【摘 要】
:
信息化的发展,信息量的增加,促进了数据挖掘的产生和发展。数据挖掘技术现在已经在网络搜索、银行业等行业有了非常广泛地应用。数据挖掘相关的算法有很多,其中聚类分析相关
论文部分内容阅读
信息化的发展,信息量的增加,促进了数据挖掘的产生和发展。数据挖掘技术现在已经在网络搜索、银行业等行业有了非常广泛地应用。数据挖掘相关的算法有很多,其中聚类分析相关的算法可以分为划分方法、层次方法、基于密度的方法、基于网格的方法和基于模型的方法。将基于网格的算法和基于密度的算法相结合,一方面可以满足聚类不同形状簇的要求,另一方面也能够减少聚类时间。GDD算法在这种思想基础上,将距离信息特征的思想加入到算法中,考虑簇与簇之间的关系,提高了算法的适应性,避免聚类陷入局部最优。本文在介绍数据挖掘基本理论与经典算法的基础上,基于GDD算法提出一种基于网格和密度的带有层次因子与距离因子的GDLD算法,GDLD算法不仅具有基于密度算法能够发现任意形状簇的特性,而且在基于网格的基础上能够有效提高算法效率。层次因子的加入使算法能够更好地体现每个簇内部的密度特点,同时加上优化的距离因子,增强了算法反映数据集密度波动性的能力,能够比较好的适应密度波动比较大的数据集。而且使得算法参数更容易确定,更方便于应用。本文用实例说明基于密度的聚类算法适用于根据学生成绩分组的情况,并将GDLD算法结合网络教育学院的学生信息进行了一定的探索性分析。为今后更深入的研究学生学习模式提供一定的启发。希望能够使教学管理者更好地了解学生的学习特点,从而有目的地引导教学。
其他文献
随着政府采购模式的广泛普及,政府采购流程也越来越规范,各级财政部门制定了相应的制度与管理办法,通过利用计算机和网络技术,来管理采购过程,是一项将采购工作标准化、服务化、信
高性能计算集群以及多核处理器在各应用领域的推广普及,使得并行计算技术的使用更加广泛了,但是并行程序设计的难度给并行技术的推广增加了难度。为了解决并行程序员频繁考虑
随着用户数量的不断增长以及应用要求的不断提高,建成一个基于IP协议的,融合各类无线网络的,公共的、灵活的、无缝的异构网络是未来无线通信的发展目标。为了让用户能够借助
与传统的C/S模型相比,P2P技术在网络资源利用率、消除服务器瓶颈等多方面有明显的优势。系统中的对等点兼有客户机和服务器的功能,各个节点之间可以直接进行数据通信,共享计算机
DNA测序是分子生物学进一步研究的基础,但测序是一项艰巨的工作,因为直接使用显微镜读取DNA序列是不可行的,而间接的测序方法即使非常严密也避免不了错误的产生。DNA杂交测序(Se
近年来,数据挖掘技术研究引起了国内外人工智能和数据库领域专家的广泛关注。关联规则的挖掘是其中一个重要的研究方向,并应用于各个领域。群体研讨是将人的智慧、经验等定性
目前,互联网用户逐渐增多,网络业务流量也越来越复杂,持续增长的网络需求对网络的负载能力提出了非常严峻的挑战,因此网络拥塞问题变得日益严峻。网络拥塞控制对于网络系统的稳定
随着并行计算技术的发展,并行计算成为当今计算机科学中一个重要的研究领域。为追求不同的高性能计算目标,众多并行计算模型和并行处理器架构不断涌现。不断适应在全新的处理
企业的信息化技术和应用水平是提升企业核心竞争力,参与国际竞争的重要因素,而人力资源管理的信息化是其中关键的环节。人力资源已成为企业核心竞争力的战略性资源,因此人力资源管理是企业管理中的重要一环,而对人力资源进行信息化管理也成为了企业的必然要求。企业通过梳理自身的人力资源管理流程,建立符合自身业务流程的人力资源管理系统,使企业的人力资源达到最优配置,推动企业可持续稳定的发展。然而,人力资源管理是随着
物流的信息化建设和物流企业的业务流程重组,大大提高了企业的反应速度,降低了物流成本,并为企业带来了可观的经济效益。然而纵观全局,我国物流信息化水平不高,数据共享不够