【摘 要】
:
传统大数据挖掘技术应用过程中,需要采用多次迭代方式对大数据进行聚类分析,但该种分析方法限制大数据聚类挖掘效率。云计算条件下,大数据聚类挖掘算法得以优化,形成模糊C-均值聚类算法,该种算法以群体智能优化方式结合模糊C-均值聚类算法与混合蛙跳算法,从全局角度对大数据聚类挖掘中的参数进行调整优化。此次研究站在云计算角度,探究具备群体智能算法特征的大数据聚类挖掘优势。研究在概述聚类分析、模糊C-均值以及混
【基金项目】
:
湖南环境生物职业技术学院南岳学者项目(N2020-02);
论文部分内容阅读
传统大数据挖掘技术应用过程中,需要采用多次迭代方式对大数据进行聚类分析,但该种分析方法限制大数据聚类挖掘效率。云计算条件下,大数据聚类挖掘算法得以优化,形成模糊C-均值聚类算法,该种算法以群体智能优化方式结合模糊C-均值聚类算法与混合蛙跳算法,从全局角度对大数据聚类挖掘中的参数进行调整优化。此次研究站在云计算角度,探究具备群体智能算法特征的大数据聚类挖掘优势。研究在概述聚类分析、模糊C-均值以及混合蛙跳算法的情况下展开仿真实验,实验结果表明,基于云计算的大数据聚类挖掘技术具备群体智能算法特征,和其他聚类挖掘算法相比,规避算法中的局部陷阱,不仅聚类特征更加明显,数据的收敛速度和准确度都显著提高。
其他文献
目的 基于癌症基因组图谱(TCGA)数据库,分析线粒体天冬氨酰-tRNA合成酶2(DARS2基因在膀胱癌患者和正常组织中的表达差异,研究其与患者临床特征、预后相关性及参与膀胱癌的调节信号通路。方法 从TCGA数据库下载膀胱癌相关的表达资料和临床特征资料,使用R.4.0.3软件和Strawberry Perl 5.32.0.1提取膀胱癌组织和正常组织中DARS2的表达量数据,利用Mann-Whitn
本文围绕园林透水砖铺装组成和设计方法展开分析,讨论了园林透水砖铺装设计原则,包括以人为本原则、协调性原则、因地制宜原则、地域性原则等。通过研究选择铺装形式、路基开挖施工、路缘石施工、碎石垫层施工、粗砂垫层施工、透水砖铺装施工等技术应用要点,其目的在于积累园林透水砖铺装经验,提高园林透水砖铺装成果的美观性与稳固性。
慢性萎缩性胃炎是消化系统常见病之一,是以胃黏膜上皮及固有腺体数目减少或消失为特征的消化内科疾病。慢性萎缩性胃炎发病率较高,且具有癌变倾向,中医药治疗慢性萎缩性胃炎具有独特优势。该文从慢性萎缩性胃炎的病因病机、辨证论治、经验效方、中成药等方面,概述近年来中药治疗慢性萎缩性胃炎的研究进展。
舞蹈是一门历史悠久的艺术形式,作为一种人体表现的艺术,通过舞者的各种动作进行思想、情感的表达。在进行舞蹈动作的设计中,结合人体解剖学的研究,可以更好地解放舞者的身体,使舞者更协调、更灵活的作出各种动作,传情达意。本文结合膝盖的解剖学内容,进行相对应舞蹈动作的设计,更好地提升舞蹈训练的科学性。
<正>传说很久以前,荆山深处有一个安居乐业的部落,突然流行怪疾,族人头疼欲裂、四肢抽搐。为解救族人,部落首领历经艰险求得一种药材,治好了众人的顽疾。人们说这是神医所赐的天上之物,又专治麻痹瘫痪,故将这种药材称为“天麻”。天麻治风范围广,既能熄内风,又能定外风。《本经》言,天麻“可杀鬼精物蛊毒恶气者,以其能定风,镇八方之邪气也,久服益气力。”因此李时珍还给天麻取了另外一个名字叫“定风草”。
以黄牛毛肚和水牛毛肚为研究对象,探究在微冻(-3℃,0~10 d)和冷藏(4℃,0~10 d)条件下的品质变化情况,比较2种毛肚感官评分、菌落总数、pH、挥发性盐基氮(total volatile base nitrogen, TVB-N)、硫代巴比妥酸(thiobarbituric acid reactive substance, TBARS)、汁液流失率、水分含量等指标的变化,结合电子鼻技术对
本文利用沈阳桃仙机场1990~2020年共31年的夏季逐日降水数据,统计得到本场夏季暴雨分布特征及频次特征,利用Poisson分布函数,初步建立本场夏季暴雨概率分布模型。结果表明:本场8月出现暴雨的概率最大;有34.8%的暴雨天气影响能见度降至1 500 m以下;有一半暴雨与雷暴相伴出现;暴雨持续时间较长;降水量集中在55~84.5 mm;Poisson分布能较好地描述本场夏季暴雨频次的分布特征;
<正>诗化小说作为一种不同于传统小说的文体样式,在高考文学类文本阅读中屡见不鲜。作为一种渗透性文体,诗化小说兼具小说的叙事功能和诗歌的抒情功能;甚至抒情重于叙事,从这个意义上,也可以称之为“抒情小说”。杨义认为:“诗化小说是‘立意小说’。它拆除了传统小说中情节的堤坝,却把它引入诗意的清池,使人在诗情画意中流连忘返。”
针对现有特征选择方法难以从大量的SCADA参量中挑选出重要变量的问题,基于近邻元分析算法提出一种专门适用于风电机组状态监测的特征变量选择方法。所提方法根据每个待选变量对回归精度的贡献率为各变量赋予相应的重要度权值,从而挑选出最重要的特征变量。通过分析SCADA数据中冗余变量的特点,针对性地提出了基于相关系数矩阵的去除冗余方法。采用Pearson相关系数、互信息和随机森林三种方法作为对比,以门控循环