【摘 要】
:
考虑到传统大规模数据聚类分析算法收敛速度较慢的问题,提出一种基于云计算技术的大规模数据聚类分析算法。定义云空间内的数据变量,计算数据点密度,以计算出的密度数据为基
【机 构】
:
呼伦贝尔学院计算机学院,吉林大学计算机科学与技术学院
论文部分内容阅读
考虑到传统大规模数据聚类分析算法收敛速度较慢的问题,提出一种基于云计算技术的大规模数据聚类分析算法。定义云空间内的数据变量,计算数据点密度,以计算出的密度数据为基准,整合为两个不同的数据集合,不断循环删除集合内局部密度低于平均密度的离群点,得出聚类中心。筛选远离聚类中心的点,计算数据点与聚类中心的相似系数,将保留下来的数据点划分为聚类区域,采用层次分配方法将聚类数据点分配到聚类区域中,完成大规模数据的聚类分析。实验结果表明,与传统聚类分析方法相比,所提聚类分析算法的收敛速度最高可达10 mm/s,收敛速度
其他文献
2008年9月3日,可口可乐和汇源公司高调宣布双方实施要约并购。两个月后,商务部正式立案审查。2009年3月18日,商务部正式发出通报,依法作出禁止可口可乐并购汇源的决定。从并购意
随着全球互联网技术日新月异的发展,党的建设进入互联网和大数据时代。担负刑罚执行任务的监狱如何在新形势下加强基层党建工作,确保党和国家的监狱工作方针有效落实,是摆在
当前国内社会经济的快速发展,使得我国商贸流通水平有了很大提升,文章分析流通产业的优化发展对第三产业经济增长的溢出效应问题,揭示出流通产业的发展与第三产业经济的增长
近些年来,在PM2.5污染出现期间,幼儿园保教人员普遍组织幼儿开展室内运动。本研究以上海市563名幼儿园园长与教师作为研究对象,采用自编问卷调查幼儿园室内环境运动功能的利
随着广告传媒业的飞速发展,根据国家大力发展动画产业的政策,一个新媒体时代正浮现在国人面前,与此同时,在我国广告传媒产业的飞速发展的大前提下,我国动画产业正逐步成为国家经济
为了解决传统的三维动漫系统用户满意度低的问题,基于虚拟现实技术设计了一种新的三维动漫系统。设计了管理服务器、三维动画服务器、处理器、机柜、交换机和VR设备,在Visual C++环境下利用Open GL进行三维情景的建模和材质、灯光处理,并配合使用Open GL显示列表和双缓存技术,通过Windows提供的SetTimer()函数制定软件程序。为验证系统的有效性,与传统动漫系统进行对比,实验结果表
针对小波网络结构不稳定和容易陷入局部最小造成预测结果误差过大的问题,以辽宁省某高速公路为研究对象,利用遗传算法具有自适应随机优化搜索能力、收敛速度快的特点,提出一
"一带一路"战略构想以国家间的创新合作为主要模式。在该战略的推进过程中,资金流通是一个重要的方面,人民币国际化的推动是实现资金流通的重要进程,其中资本项目的开放是货
为了合成出更加清晰的人脸素描画像,文中提出一种基于稀疏表示的自适应图像建模方法。通过从训练数据中提取有效的训练集,降低学习的盲目性和难度,获取更加精确的字典结果。在精确字典结果的基础上,通过控制线性组合系数的非零元素个数,实现测试图像的自适应重构与优化,从而解决传统经典合成算法噪声较大的问题。仿真测试结果表明,文中所提出的方法提取了更多的图像块,能够滤除更多的高频分量,其合成图像的噪声更小,具有更
针对某双行星排式混合动力汽车进行构型分析,提出该混合动力系统基于动态规划法的能量管理控制策略。通过优化选取系统状态变量和控制变量,确定状态转移规则以及油电转化系数