基于Spark Streaming的在线KMeans聚类模型研究

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户：luowzh

【摘要】

：

针对基于Map Reduce框架处理海量数据实时响应能力较差的问题,设计并实现了基于Spark Streaming的在线计算模型进行大规模的KMeans聚类分析。该模型将整个过程分为数据接入、

【作者】

：

侯敬儒吴晟李英娜

【机构】

：

昆明理工大学信息工程与自动化学院

【出处】

：

计算机与数字工程

【发表日期】

：

2018年04期

【关键词】

：

MapReduce Spark Streaming 在线计算低延迟

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对基于Map Reduce框架处理海量数据实时响应能力较差的问题,设计并实现了基于Spark Streaming的在线计算模型进行大规模的KMeans聚类分析。该模型将整个过程分为数据接入、在线训练等模块,各模块通过数据流连通形成任务实体,提交到Spark分布式集群运行完成。通过比对分析实验和性能检测,验证了该在线KMeans聚类模型具有高吞吐、低延迟的优势,且集群运行状况良好。

其他文献

中国农村灌溉治理影响因素

农村灌溉系统作为一项重要的公共事物,对于发展农村经济和保障粮食安全至关重要。在乡村公共治理危机和农田灌溉问题日益凸显的背景下,亟需对中国农村灌溉治理水平和影响因素

期刊

灌溉公共事物农村治理集体行动乡村振兴

寿县古城特色及保护利用规划

安徽寿县县城是具有2000余年历史的古城。本文介绍了该城的历史、文化、文物古迹的特点;阐述了保护利用规划的指导思想、规划内容及具体措施。

期刊

寿县古城文物古迹文物保护单位东西南北护城河保护利用规划

加压油箱的结构原理

期刊

吸油口液压泵加压油箱

高层建筑基础选型特征与过程

首先,通过对高层建筑地基基础方案优选问题的分析,提出了该问题的6个基本特征,为深入认识与研究高层建筑基础选型规律奠定了基础;然后,指出了基础选型设计属于整个设计过程中

期刊

高层建筑基础选型特征过程

推进投融资公私合作的突破点

根据现阶段我国经济社会发展阶段特点，在推进投融资公私合作过程中，可选择加强法律建设、明确监管主体，加大监管力度、加强技术政策指导，规范投融资公私合作行为，以及提高地方政府

期刊

公私合作民间资本投融资公私合作行为突破点

后嗅皮层及其向腹外侧眶额皮层的投射在视空间记忆中的作用

第一部分后嗅皮层在视空间记忆中的作用背景:阿兹海默症(Alzheimer’s disease,AD)是以认知功能全面衰退、日常生活能力最终丧失并伴发精神行为障碍为临床表现的神经退行性疾

学位

POR脑区视空间记忆谷氨酸能神经元GABA能神经元勾束POR-vlOFC投射

创造性因素的研究对艺术教育的启发

在当今社会中,创造力具有非常重要的意义,然而在教育领域中,创造力的意义有时比较模糊。创造力通常在艺术领域中被提及,同时创造力并不能轻易地被定义,因为它的词义根据不同

学位

创造性因素教育体系“三大组合”

海域天然气水合物赋存类型的识别研究

作为一种新型的清洁能源,天然气水合物主要以两种形态赋存在地下:孔隙充填型和裂隙充填型。识别水合物赋存类型对于水合物资源总量的估计、地层的稳定性,以及气候变化都至关

学位

水合物赋存类型岩石物理测井曲线AVO分析中国南海

Ag/TiO2、MS/TiO2和CsPbX3/TiO2复合材料的合成及性能研究

TiO2具有光电化学稳定、折射率高、无毒和价格低廉等优点,因此不同结构的TiO2被应用在光催化和发光调控等领域。在光催化领域,TiO2较大的禁带宽度限制了其对可见光的响应。将

学位

TiO2巯基乙酸光催化量子点

红色文化传承与发展路径研究——以黑龙江省鸡西市为例

"红色文化"既是一个特定的文化概念,也是一种具有丰富内涵的历史文化现象。红色文化形成于中国革命、建设和改革的历程之中,是中国共产党在革命年代领导中国人民创建的无产阶

期刊

红色文化鸡西市传承发展

基于Spark Streaming的在线KMeans聚类模型研究

与本文相关的学术论文