【摘 要】
:
数据挖掘算法处理海量数据时,扩展性受到制约。在商业和科学研究的各个领域,知识发现的过程和需求差异较大,需要有效的机制来设计和运行各种类型的分布式数据挖掘应用。提出
【机 构】
:
南京大学计算机软件新技术国家重点实验室,南京邮电大学通达学院
【基金项目】
:
国家自然科学基金(61035003);科技部国际科技合作项目(2010DFA11030);江苏省自然科学基金(SBK201150103)~~
论文部分内容阅读
数据挖掘算法处理海量数据时,扩展性受到制约。在商业和科学研究的各个领域,知识发现的过程和需求差异较大,需要有效的机制来设计和运行各种类型的分布式数据挖掘应用。提出了一种面向服务的云数据挖掘引擎的框架CloudDM。不同于基于网格的分布式数据挖掘框架,CloudDM利用开源云计算平台Hadoop处理海量数据的能力,以面向服务的形式支持分布式数据挖掘应用的设计和运行,并描述面向服务的云数据挖掘引擎系统的关键部件和实现技术。依据面向服务的软件体系结构和基于云平台的数据挖掘引擎,可以有效解决海量数据挖掘中的海量数据存储、数据处理和数据挖掘算法互操作性等问题。
其他文献
<正>甲鱼温室养殖的生产成本主要是饲料、能源、苗种等,单项成本之间相互制约、相互影响,科学投喂减少饲料的浪费,水体污染小,换水周期延长;水体中充足的溶解氧提高饲料的转
随着集群企业,特别是高品质集群企业,外迁的增加,越来越多的学者开始研究集群企业迁移的内在机理。已有研究放松了集聚效应的潜在假设,提出了集群企业迁移理论,认为区域层面
论文以产业集聚的环境外部性为切入点,利用中国1999-2012年的省级面板数据实证分析了产业集聚水平、产业集聚与技术创新的关联效应对环境污染的影响,并进一步将样本分为沿海
新常态下,为适应经济增长多元化,创新也趋向于多元化。作为创新实践的成果,微创新在新常态下对创新实践及经济增长与转型具有重要作用。微创新是一种创新思维,更是一种创新方
简要评述了中心语驱动短语结构语法所采用的语言理论形式化方法。中心语驱动短语结构语法的形式化模型包含两个层面 :一个层面采用模块化的 ,陈叙性的 ,基于归一的语言理论对
随着现代社会的快速发展,无线通信在日常生活和工作中起到重要作用,通信容量大小和质量高低直接影响着用户体验。宽带技术作为可提升信道容量的重要手段受到广泛关注和深入研
<正>近年来,陕西省大荔县不断进行甲鱼养殖技术革新,近日,水产站组织投资30余万元,在大荔县水产良种场建成了一座1100米2钢构温室,安装鼓风机,布置充气管道,布设增氧气管、气
为使日光温室人参果栽培达到节水、节肥、高产、高效的目的,采用滴灌与农艺措施相结合的水肥一体化技术,提供适宜生长的水、肥、气、热等生长环境,可实现日光温室的高产高效
印制线路板微孔金属化的关键在于在高厚径比的微孔中形成无空洞、无接缝、均匀的铜沉积层。综述了目前微孔填充技术的发展现状,对电镀过程中采用的电流密度、搅拌因素和电流波
<正>黄缘盒龟俗称夹板龟,为半水栖龟类,是亚洲特有物种,该龟分布在我国的安徽、河南、浙江、台湾等省。2010年杭州萧山湘湖生态鳖养殖场从本省湖州一龟鳖养殖场引进平均体重