论文部分内容阅读
信息技术的快速发展以及互联网的广泛应用,引发世界各国先后实施“再工业化”战略。互联网在数据传输、软件管理、信息化应用等方面的强力保障为包括物联网在内的各项技术应用打开了大门。通过新兴技术提升工业智能化水平,提升企业的竞争力,以智能制造为主导的全球化工业革命已提上日程,工业智能化将成为构建未来工业体系的关键所在。以工业互联网为基础的工业大数据分析技术及应用将成为推动智能制造,提升制造业生产效率与竞争力的关键要素,是实施流程管理智能化、生产过程智能化、制造模式智能化的重要基础。随着企业生产的扩大化,最直观地是数据成指数级增长,更为重要的是,数据源越来越丰富,由原来单一地从数据库中获取生产历史数据扩展为生产管理日志、设备运行数据、以及声音、图像、视频等多维数据,传统的数据分析管理手段无法应对企业迫切想提高生产效率的需求。因此,设计并实现一个工业大数据分析平台来实现对企业数据的统一化管理,并挖掘这些数据潜藏的巨大价值,进而指导生产,提供决策支持,推动企业生产由大批量生产制造向个性化服务制造转型具有重要意义。本文基于Spark设计并实现了一个对工业大数据能统一存储,管理分析的大数据平台,主要研究内容如下:(1)研究工业大数据处理技术,从数据集成、数据存储、数据处理以及可视化分析等数据处理的重要流程出发,研究了基于Spark的数据处理框架,并且设计了基于HDFS、HBase以及Hive等存储引擎与Mysql、oracle等关系型数据库的多级数据存储系统,实现了对工业大数据的统一访问与管理;(2)在本文研究的工业大数据平台中,以乙烯生产过程能效分析管理为例,设计和开发了乙烯生产能效分析模块。通过平台算法库中的机器学习相关算法,结合乙烯生产大数据,对乙烯生产过程中的能效进行了分析;(3)采用开源Apache HUE工具实现大数据的可视化,实现支持Hive的类sql查询、Spark交互查询、Sqoop异构数据转换等功能,给用户提供一个良好的人机交互界面,方便用户有效地分析、管理工业大数据。