论文部分内容阅读
增量学习是一类模拟人脑学习逻辑的算法,由于其不需要全部历史样本,仅通过重要特征或个别代表性样本,有效实现新增数据的知识学习,适合解决线上系统的数据重复学习和模型参数动态更新问题。
城市供水是城市正常运转的保证,准确高效的供水量预测对于水务企业生产调度决策至关重要。作者以自主研发的智慧水务系统为基础,以实现高精度的供水量预测为目的,设计了基于机器学习的增量式供水量预测算法,完成了数据获取、建模分析和预测结果可视化设计。作者的工作和贡献主要体现在以下三方面:
①供水量预测模型中缺失异常数据的填补
供水量预测是水务企业提供高效供水服务的关键一环,作者通过分析自来水公司供水预测需求,明确了供水量短期预测任务。通过对相关水厂日供水量数据分析,发现存在20%左右的样本缺失异常值;通过引入外部环境数据包括温度、天气、节假日等辅助信息,实现了异常缺失值检测和填补,提高了网络预测精度。
②引入增量学习方法解决供水量预测中样本量不足的问题
供水量预测方法大致可以分为两类,即传统的批量离线模型和基于增量训练的在线学习方法。作者通过分析日供水量短期分布趋势并结合线上系统新增数据特点建立了供水量预测回归模型。考虑到供水量受外部环境因素影响,新增数据分布模式复杂,预测模型需及时学习新增数据知识,传统批量学习方式将不再适用,因此提出了应用增量学习作为模型参数更新算法进行数据训练,不断利用新增数据来改善相关的模型,从而有效地解决了水务系统中数据样本量少的问题。
③提出基于指数平滑修正的增量SVR算法提升预测准确率
日供水量预测属于回归预测模型,作者首先应用了供水量预测领域中的传统增量支持向量回归方法(SVR)。在分析传统模型优缺点的基础上,提出了基于指数平滑修正的增量SVR算法,学习增量间隔内新增数据局部趋势信息。该模型不仅具备传统增量SVR学习数据一般分布规律的优点,而且还综合了指数平滑法获取的数据局部趋势信息的能力,使预测精度得到进一步的提升。最后将该方法应用到实际水厂的日供水量预测,并使用增量Mondrian森林和BP增量回归算法进行了对比分析。实验结果表明:指数平滑修正的增量SVR方法充分学习了数据局部趋势信息,得到的预测准确率最佳。
城市供水是城市正常运转的保证,准确高效的供水量预测对于水务企业生产调度决策至关重要。作者以自主研发的智慧水务系统为基础,以实现高精度的供水量预测为目的,设计了基于机器学习的增量式供水量预测算法,完成了数据获取、建模分析和预测结果可视化设计。作者的工作和贡献主要体现在以下三方面:
①供水量预测模型中缺失异常数据的填补
供水量预测是水务企业提供高效供水服务的关键一环,作者通过分析自来水公司供水预测需求,明确了供水量短期预测任务。通过对相关水厂日供水量数据分析,发现存在20%左右的样本缺失异常值;通过引入外部环境数据包括温度、天气、节假日等辅助信息,实现了异常缺失值检测和填补,提高了网络预测精度。
②引入增量学习方法解决供水量预测中样本量不足的问题
供水量预测方法大致可以分为两类,即传统的批量离线模型和基于增量训练的在线学习方法。作者通过分析日供水量短期分布趋势并结合线上系统新增数据特点建立了供水量预测回归模型。考虑到供水量受外部环境因素影响,新增数据分布模式复杂,预测模型需及时学习新增数据知识,传统批量学习方式将不再适用,因此提出了应用增量学习作为模型参数更新算法进行数据训练,不断利用新增数据来改善相关的模型,从而有效地解决了水务系统中数据样本量少的问题。
③提出基于指数平滑修正的增量SVR算法提升预测准确率
日供水量预测属于回归预测模型,作者首先应用了供水量预测领域中的传统增量支持向量回归方法(SVR)。在分析传统模型优缺点的基础上,提出了基于指数平滑修正的增量SVR算法,学习增量间隔内新增数据局部趋势信息。该模型不仅具备传统增量SVR学习数据一般分布规律的优点,而且还综合了指数平滑法获取的数据局部趋势信息的能力,使预测精度得到进一步的提升。最后将该方法应用到实际水厂的日供水量预测,并使用增量Mondrian森林和BP增量回归算法进行了对比分析。实验结果表明:指数平滑修正的增量SVR方法充分学习了数据局部趋势信息,得到的预测准确率最佳。