论文部分内容阅读
智能能效管理是智能船舶六大功能模块之一,大数据分析、数值的分析与优化技术是实现智能能效管理的重要手段。恶劣、多变的实船环境使得部分采集的船舶能效数据失真或异常;能效数据间的关系对智能能效管理与评估至关重要。因此,对实船能效数据的预处理和数据挖掘技术的研究很有意义,并且船舶长期积累的海量数据为数据挖掘提供了可能。首先,本文通过查阅数据预处理与数据挖掘的相关文献,结合船舶能效的数据特点,确定使用Python作为研究的主要工具。对实船能效数据库中影响船舶能效的主机、气象等参数进行了分析,建立了各参数的相关关系。利用时间插值对能效数据的时间间隔进行统一,并对空缺值进行处理。然后,根据能效数据的特征,建立基于主成分分析的异常检测模型。对数据进行标准化处理后,将各参数转化为主成分,并利用拉伊达准则对大于检测阈值外的数据进行剔除。然后,以目标船某航次的能效数据作为输入,控制待检测数据集的参数个数,研究了主成分个数的选取方式对检测精度的影响。对目标船一年的数据(7个参数)进行验证,验证结果为:平均正确率P=93.95%,召回率 R = 86.68%,F=90.17%,检测效果较为理想。表明采用该方法可进行数据清洗,为接下来的数据挖掘提供保障。最后,选取目标船某航次数据,进行数据挖掘。采用高斯混合模型和EM算法对其各工况进行聚类,得到了各参数的聚类中心,该聚类中心代表每个工况的能效状态。分析了该船舶某工况的聚类中心在3年内逐年的变化规律,获得了该工况的能效状态变化情况。利用同一航次3个工况的能效数据及其相对应的海况信息,进行相关性分析,得到了 3组相关系数矩阵,获得了每两个参数之间相互关联的程度,得到了油耗指标与各能效参数之间的关系规律以及海况信息对船舶能效的影响程度。本文研究对船舶能效大数据的数据挖掘具有普适性,得到的各参数之间关系规律对智能能效管理与评估、提供辅助决策具有重要意义。