论文部分内容阅读
随着人工智能AI(Artificial intelligence)、大数据时代的到来,计算机科学和其他各行各业得到了高速发展,大型复杂物理科学装置在具体运行过程中,对故障诊断的需求也越来越高。为了实现更高效准确的故障诊断,就必须依靠新的理论方法和技术的持续不断发展。
在日常运行过程中,大型粒子加速器会产生大量的数据,例如各个系统产生的动态数据,以及从数以千万计的硬件设备、装置和元件采集到的相关数据等。这些数据关系复杂多变,数据量较多,耦合度很高,数据样本分布也比较稀疏,它对大型粒子加速器的稳定运行和调试维护起着至关重要的作用。对于大型粒子加速器系统来说,如何实现对这些数据的有效挖掘,从历史数据中分析有效信息,并应用到故障诊断、升级优化系统等方面,具有重要意义。
传统的故障诊断系统大多针对于某一系统或硬件装置,主要依靠有经验的加速器研究人员对系统进行诊断优化等操作,但对于大型粒子加速器来说,针对整个复杂系统结构关系,基于大数据平台和机器学习技术则是最优的解决方案。因此,研究基于加速器运行数据的数据查询、故障诊断和机器学习研究方法,建立恰当的故障诊断工具以及数据分析手段是十分必要的,有着重要的应用意义。
北京正负电子对撞机重大改造工程(Beijing Electron Positron ColliderⅡ,简称BEPCⅡ)是中国基础型大科学工程之一,由直线加速器(长202米)、输运线、环型加速器(周长为240米,又称储存环)、北京谱仪(高6米,重500吨)和储存环周围的同步辐射实验装置等几部分组成。毫无疑问,BEPCⅡ就是这样一个庞大而复杂的系统。作者调研了大量的相关资料,包括国内外有关文献,国内外众学者的相关论文、专著等,根据近6年共6轮BEPCⅡ的运行数据,主要应用Java、Python语言,开发Web应用程序,自行设计了BEPCⅡ故障诊断研究平台,完成了历史数据的获取,建立了MySQL历史数据库,设计了图形化界面,实现了网页数据查询功能;搭建Hadoop云平台,加入Kettle、HDFS、Elasticsearch等技术,建立数据统计系统,对历史数据进行清洗加工,形成数据运行状态的统计图表;采用模块化设计,建立数据分析系统,对BEPCⅡ子系统的统计数据进行数据预处理,针对不同状态,做成相应的样本数据集;应用数据挖掘和机器学习(主要是聚类)相关算法,实现故障类别统计,黄金参数模型和子系统故障诊断等功能,实现了直流电流传感器(DCCT)、束流位置测量器(BPM)和冗余电源系统(RPS)三个子系统的部分故障诊断,有效地发现和分析了4W1电源故障问题,并提供了有参考价值的解决方案,为后续故障诊断研究平台的更新升级和机器学习的相关应用打下了基础。
在日常运行过程中,大型粒子加速器会产生大量的数据,例如各个系统产生的动态数据,以及从数以千万计的硬件设备、装置和元件采集到的相关数据等。这些数据关系复杂多变,数据量较多,耦合度很高,数据样本分布也比较稀疏,它对大型粒子加速器的稳定运行和调试维护起着至关重要的作用。对于大型粒子加速器系统来说,如何实现对这些数据的有效挖掘,从历史数据中分析有效信息,并应用到故障诊断、升级优化系统等方面,具有重要意义。
传统的故障诊断系统大多针对于某一系统或硬件装置,主要依靠有经验的加速器研究人员对系统进行诊断优化等操作,但对于大型粒子加速器来说,针对整个复杂系统结构关系,基于大数据平台和机器学习技术则是最优的解决方案。因此,研究基于加速器运行数据的数据查询、故障诊断和机器学习研究方法,建立恰当的故障诊断工具以及数据分析手段是十分必要的,有着重要的应用意义。
北京正负电子对撞机重大改造工程(Beijing Electron Positron ColliderⅡ,简称BEPCⅡ)是中国基础型大科学工程之一,由直线加速器(长202米)、输运线、环型加速器(周长为240米,又称储存环)、北京谱仪(高6米,重500吨)和储存环周围的同步辐射实验装置等几部分组成。毫无疑问,BEPCⅡ就是这样一个庞大而复杂的系统。作者调研了大量的相关资料,包括国内外有关文献,国内外众学者的相关论文、专著等,根据近6年共6轮BEPCⅡ的运行数据,主要应用Java、Python语言,开发Web应用程序,自行设计了BEPCⅡ故障诊断研究平台,完成了历史数据的获取,建立了MySQL历史数据库,设计了图形化界面,实现了网页数据查询功能;搭建Hadoop云平台,加入Kettle、HDFS、Elasticsearch等技术,建立数据统计系统,对历史数据进行清洗加工,形成数据运行状态的统计图表;采用模块化设计,建立数据分析系统,对BEPCⅡ子系统的统计数据进行数据预处理,针对不同状态,做成相应的样本数据集;应用数据挖掘和机器学习(主要是聚类)相关算法,实现故障类别统计,黄金参数模型和子系统故障诊断等功能,实现了直流电流传感器(DCCT)、束流位置测量器(BPM)和冗余电源系统(RPS)三个子系统的部分故障诊断,有效地发现和分析了4W1电源故障问题,并提供了有参考价值的解决方案,为后续故障诊断研究平台的更新升级和机器学习的相关应用打下了基础。