基于MapReduce和Spark的大数据主动学习比较研究

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户：qcxmh

【摘要】

：

在我们以前的工作中,提出了基于MapReduce的大数据主动学习算法。在本文中,将这一算法移植到Spark环境,提出了基于Spark的大数据主动学习算法,并对基于MapReduce和Spark的2种

【作者】

：

翟俊海齐家兴沈矗宋丹丹王谟瀚田石

【机构】

：

河北省机器学习与计算智能重点实验室,河北大学数学与信息科学学院

【出处】

：

计算机工程与科学

【发表日期】

：

2019年10期

【关键词】

：

大数据机器学习主动学习样例选择开源框架 big data machine learning active learning instance selec

【基金项目】

：

国家自然科学基金(71371063),河北省重点研发计划项目(19210310D),河北省自然科学基金(F2017201026),河北大学研究生创新资助项目(hbu2019ss077)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在我们以前的工作中,提出了基于MapReduce的大数据主动学习算法。在本文中,将这一算法移植到Spark环境,提出了基于Spark的大数据主动学习算法,并对基于MapReduce和Spark的2种大数据主动学习算法从运行时间、文件数目、同步数目和内存耗费4个方面进行了比较研究,得出了一些有价值的结论,这些结论将为相关研究人员提供很好的帮助。

其他文献

小檗碱对家兔颈动脉粥样硬化组织核因子κB、血管细胞粘附分子1及单核细胞趋化蛋白1表达的影响

目的探讨小檗碱预防家兔颈动脉粥样硬化形成的作用机制。方法将24只大白兔随机分为正常对照组、模型组和小檗碱组。正常对照组给予普通饮食，模型组和小檗碱组给予高脂饲料喂养

期刊

病理学与病理生理学颈动脉粥样硬化小檗碱核因子ΚB血管细胞粘附分子1单核细胞趋化蛋白1Carotid Artery Atherosclerosis

乌鲁木齐市维吾尔族居民胰岛素抵抗患病率及相关因素

目的了解新疆乌鲁木齐市维吾尔族居民胰岛素抵抗的患病率并分析其相关因素。方法采用整群抽样方法调查乌鲁木齐市居住5年以上的维吾尔族居民967人，测量身高、体重、腰围、臀围

期刊

胰岛素抵抗患病率维吾尔族糖调节异常糖尿病Insulin Resistance Prevalence Uighur Impared Glucose

通过部分Warp重组消除GPGPU控制流的不一致性

GPU已被广泛应用于当前的高性能计算系统中,但其性能却受到程序运行时不同控制流方向的严重制约。这一问题通常通过动态Warp重组技术来解决,即将一个或多个Warp内沿相同控制

期刊

GPGPU控制流不一致Warp重组框架GPGPUcontrol divergencewarp regroupingframework

刍议环保贷款风险管理的对策

期刊

环境保护贷款风险管理对策

老年糖尿病人餐后甘油三酯、血管活性物质变化对血管内皮功能的影响

目的通过研究餐后高甘油三酯血症与血管内皮依赖性舒张功能、血管活性物质一氧化氮和颈动脉内一中膜厚度之间的关系，探讨老年糖尿病人餐后脂代谢紊乱对血管内皮功能的影响。方

期刊

内科学2型糖尿病脂代谢紊乱内皮血管一氧化氮内皮素Diabetes MeUitus Hypertriglyceridemia Endothehu

厄贝沙坦对急性心肌梗死后晚期心室重构及心室功能的影响

目的观察厄贝沙坦对大鼠心肌梗死后晚期心室重构及心功能的影响。方法结扎大鼠左前降支建立急性心肌梗死模型，将17只术后24h仍存活的大鼠随机分为对照组（n=8）和厄贝沙坦组（n=9），

期刊

病理学病理生理学心肌梗死心室重构心室功能厄贝沙坦胶原容积分数大鼠Acute Myocardial Infarction Ventricular

异基因脾细胞诱导大鼠免疫耐受实验研究

目的：比较异基因脾细胞经受体门静脉和口服两种途径输注诱导免疫耐受的效果。方法将供体SD大鼠的脾细胞经门静脉或经口服途径输注给受体Wistar大鼠，1周后把SD大鼠的皮肤移植到

期刊

门静脉耐受口服耐受异基因脾细胞Portal venous tolerance Oral tolerance Allogeneic splenocyte

强化管理综合整治乡镇环境

<正> 地处长江之滨的浒浦镇是常熟市10大建制镇之一,也是常熟市最大的对外港口。多年来,浒浦镇在发展经济的同时,重视环境综合整治,实现了经济建设、城乡建设和环境建设同步

期刊

乡镇环境环境管理综合治理

丹参与小肠缺血再灌注损伤研究进展

缺血再灌注损伤（ischemia reperfusion injury，IRI）是组织器官发生缺血后血流再灌注加重存活的缺血组织功能障碍和结构损伤的现象，由Sewell在1955年结扎狗冠状动脉后首先发现，并在

期刊

肠缺血再灌注损伤inflammatory多器官功能不全综合征全身炎症反应综合征syndrome多脏器功能衰竭丹参injury心肺功能不全病理生

抵抗素基因420G/G基因型与高血压发病年龄相关

目的研究在中国北方汉族人群中抵抗素基因5’末端启动子区g-420 C〉G多态性与高血压发病年龄的相关性。方法选取高血压病组121例,其中年龄〈40岁的43例,年龄≥40岁的78例,对

期刊

高血压病抵抗素基因单核苷酸多态性年龄Hypertension Resistin Gene Single Nuclear Polymorphism

基于MapReduce和Spark的大数据主动学习比较研究

与本文相关的学术论文