基于云计算及数据挖掘技术的海量数据处理研究

来源 :长春理工大学学报:自然科学版 | 被引量 : 0次 | 上传用户:xutianyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主要介绍了在HADOOP平台下使用优化的SPRINT算法进行海量数据处理。首先介绍了传统的数据挖掘算法SPRINT算法,然后结合云计算中的MapReduce编程模式对SPRINT算法进行改进和优化,将并行的sPRINT算法移植到HADOOP平台下,最后通过实验实现分布式数据处理。
其他文献
地处青藏高原东南缘的川滇地区是青藏高原现今地壳形变和地震活动最强烈的地区之一,对于解释青藏高原的隆升和演化机制扮演极为重要的角色,因此研究川滇地区的壳幔结构对于深入了解青藏高原的构造活动及动力学过程具有重要意义。本文选用了川滇渝地区共117个台站从2009年1月-2017年12月记录的远震数据,利用S波接收函数的方法,获得川滇渝地区的Moho面以及岩石圈与软流圈分界面(LAB)的埋深分布。整个研究
生活目标(life goals)是个体对自己未来生活的志向、价值和意义的期待水平。中学阶段是学生发展的关键时期,也是个体自我意识飞跃发展的重要时期,在这一阶段确立积极的生活目
塞式喷管发动机具有高度补偿特性,拥有比传统的钟型喷管高的性能,因此从结构形式、性能以及结构尺寸等方面讨论塞式喷管发动机应用在多级运载火箭上的可行性,并对运载能力进行了
由印度AMA公司发起,印、中、美、日、韩等6国相关企业组成专业委员会,即将于2016年8月在美国共同起草制定“植物染料AATCC标准”,历时两年完成。植物染料标准的出台将填补该领域
基于AMESim系统动力学仿真软件,建立压力信号器及其试验系统仿真模型,提出以阀门内部运动件与阀门壳体相对运动为考察目标,通过理论分析给出可行的振动环境与仿真模型的接口
病例:患者,女,62岁。因“乳腺癌术后,腹痛、腹泻伴恶心5天”于2012年5月14日入我院进行治疗。患者于1周前无明显诱因下出现咳嗽、咳白痰、伴头晕、心慌胸闷,家中口服抗生素及止咳
WI-FI指纹定位是最常用的室内定位算法之一,但是WI-FI指纹定位存在较大的定位误差。为了提高定位精度,提出了基于群组的定位算法。首先在WI—FI指纹定位的基础上,提出了群组的概
本文指出了高等学校进行学科建设的重要意义。在此基础上提出了学科建设的基本原则和内容。最后就我院的实际情况提出了加强学科建设的若干对策。
本文通过对影响固定资产价值的各种因素的分析 ,指出了成新率指标是影响固定资产价值的关键因素。探讨了运用模糊数学的二级综合评价法求出成新率 ,进而确定固定资产价值的方
细胞内粘度控制着所有的扩散过程,包括质量传递、信号转导、生物分子相互作用、代谢物的扩散和电子传递。线粒体是真核细胞的重要细胞器,具有特定的粘度。粘度在线粒体产生ATP起着至关重要的作用,异常粘度可反映功能失调状态,如异常的线粒体粘度与神经退行性疾病、糖尿病和细胞恶性肿瘤相关,因此,细胞内粘度是不同疾病的潜在生物标志物。由于细胞内粘度的异质性,开发针对不同生物过程(如细胞凋亡和线粒体吞噬)中粘度或其