【摘 要】
:
为了使得在数据分析领域广泛使用的R语言能够应用于大规模数据的分布式流处理计算,基于Spark Streaming框架,设计和实现了一个面向R语言的分布式流处理系统。系统提出了一套
【机 构】
:
中国科学院上海高等研究院,中国科学院大学
【基金项目】
:
国家自然科学基金(61100238);中科院先导(XDA06010301);中国科学院重点部署(KGZD-EW-103);上海市科委(14510722300,14511101505);中国科学院青年创新促进会资助
论文部分内容阅读
为了使得在数据分析领域广泛使用的R语言能够应用于大规模数据的分布式流处理计算,基于Spark Streaming框架,设计和实现了一个面向R语言的分布式流处理系统。系统提出了一套完备的R/Java跨语言交互模型,实现了R语言程序和Java程序的互相调用,从而使得R语言程序可以运行在Java平台上,改进了R语言在大规模数据处理和并发计算等方面的不足。系统也提供了Spark Streaming的R语言编程接口,提高了后者的易用性。通过实例验证了该系统的可行性和实用性。
其他文献
体育课中体能素质"课课练"教学模式(简称"课课练"下同)是提高学生身体素质的重要内容和手段,但学生的身体素质持续下降,提高学生身体素质迫在眉睫。以深圳为例,为了解深圳市
<正> 关于“作威作福”《曹植新探》(黄山书社一九八四年十二月版。以下简称《新探》)《曹植的经历》一节中,著者在论列了曹丕嗣位魏王及为皇帝期间打击拥植派的事实以后,有
<正>2018年12月18日,日本政府举行内阁会议,批准了新版《防卫计划大纲》以及《2019—2024年中期防卫力量整备计划》。其中,《防卫计划大纲》共分日本防卫政策演变、日本军事
为探讨开孔板连接件肋板间距合理的布置方法,通过模型试件抗剪推出试验和弹性地基梁理论,分析了肋板间距对开孔板连接件抗剪刚度的影响机理,提出了考虑肋板间距影响的开孔板
利用三维建模软件PRO/Engineer,建立枞树型轮槽铣刀模型。运用专业的塑性成形非线性有限元分析软件DEFORM-3D软件,对轮槽铣刀铣削加工汽轮机转子材料的过程进行了动态模拟仿真,并
我国医疗系统改革最大的难题就是“看病难、看病贵”,长期以来,这已经成了严重的民生问题。无锡市人民医院的创新举措。给我们提供了一个新的改革思路。这就是在医院信息化的过
随着全民健康信息化建设进程的不断加快,吉林省各类卫生计生统计数据容量的不断膨胀,依靠新型高效的卫生计生统计信息决策支持系统来进行省级区域的卫生计生信息统计与整理已
任何一个具有国际竞争力的企业,研发都是长期战略的核心。离开了未来公司的盈利模式和盈利产品,任何战略无从谈起。
<正>银行资管业务子公司化经营,是资管行业的一次根本性变革,是挑战也是机遇,必将带来市场的重新洗牌。在变革期,银行资管业务要实现弯道超车,必须提升内功,主动出击,统筹好
从经济环境、人的认识、待遇等方面对政工工作后继乏人所产生的原因进行分析、探讨,提出若干增强政工工作吸引力的建设性意见。