基于随机森林的配网物资需求预测

来源 :企业技术开发·中旬刊 | 被引量 : 0次 | 上传用户:gengxuetao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:目前国网公司按照层层汇总物资需求的方式开展配网物资需求采购计划,需求计划生产周期较长,且采购准确度较低,对生产物资的购置、供应计划、物资领用等环节产生不利影响,并增加了配网物资采购成本。文章关联配网工程项目特征与物资品类需求,通过哑变量的形式构建训练样本,基于随机森林算法对配网物资采购需求进行预测,提升预测精度,有效指导工程建设及生产计划的合理安排,降低采购成本。
  关键词:随机森林;配网物资;需求预测
  中图分类号:TKl21 文献标识码:A 文章编号:1006-8937(2016)32-0136-02
  1 研究背景
  国网公司总部物资部自2013年以来开展配网项目物资集中框架招标采购,实现协议库存管控模式,目前每年在3月、9月开展两次农配网物资需求计划安排工作,采用由下至上的工作模式,从生产一线开始对采购需求进行统计、估算、上报,经由地市公司、省公司层层汇总形成总体采购需求,由总部物资部和物资公司共同实施采购,涉及大量的审核、汇总工作。
  因此,物资采购需求的产生周期较长,且省市公司物资部门普遍反映,根据预测结果框架招标采购的物资与配网工程建设实际需要的物资在数量上有较大的偏差。同时,公司配网建设所需的物资体量较大,对物资需求预测工作主要基于经验,缺乏农配网需求预测模型支持,导致项目建设所需物资不能按照工程要求准确到位,为了防止项目建设延期,往往过量上报物资需求,然而物资数量过多又会占用公司资金、造成库存物资积压的风险。因此,不准确的采购计划会对物资的采购、供应、暂存和领用等产生影响,导致配网物资整体管理效率降低。
  随着国网公司信息系统的完善和业务数据的不断积累,可以通过历史数据构建农配网项目属性及建设内容与所需物资之间的映射关系,并基于下一年度的项目建设计划,从总体角度,分品类预测需要采购的物资数量,提升配网物资需求预测准确率,为企业物资采购批次计划执行提供科学依据,有效指导物资供应计划的合理安排,降低采购和库存成本、提高生产建设的精益化水平。
  2 模型原理
  为了依据农配网项目的建设计划预测物资采购需求,首先要提取农配网工程项目的项目特征值,以标记各工程项目的建设属性和建设内容,随后需要在已投产的项目记录基础上,构建工程建设特征和建设内容与其领用物资品类、数量之间的映射关系,最后通过学习及模拟工程建设特征和建设内容与物资领用品类、数量之间的函数关系来构建随机森林预测模型。具体的模型构建原理,如图1所示。
  在提取項目特征值过程中,首先需要根据历史投产的配网工程项目名称创建配网专业词典,然后使用文本挖掘工具对项目名称中包含的重要特征值进行分词,随后根据各工程项目的物资领用信息归类合并具有相似性质的工程项目,固化成44个工程类型。具体词典创建原理和分词过程参见项目组前期研究成果(参见文章《配网工程项目词库创建及分词探索》)。在分词之后,将项目特征结合地市信息、项目类型、下达预算和历史项目中不同物料小类的物料领用总量共同作为随机森林预测模型的输入空间。
  采用2013、2014年领料记录完整的历史项目物料小类采购数据作为训练集,2015年领料记录完整的项目物料小类采购数据作为测试集。由于配网输入数据具有标签复杂,类型众多的特点,因此首先需要对数据进行数据预处理,排除不符合业务逻辑的异常值,将原始数据转换成为采取哑变量方法进行展示的形式并作为随机森林模型的输入,以便随机森林模型可以更好地学习历史项目的有效特征。
  3 预测模型构建
  配网项目具有样本数量多,项目类型、标签复杂的特征。因此,采用具备处理高维数据能力的随机森林算法构建配网物资需求预测模型,同时随机森林模型在训练速度和避免过拟合方面也具有明显的优势。简单地说,随机森林是利用多棵决策树对样本进行预测的模型,它的结构,如图2所示。给定决策树的数量,每棵决策树按既定方法选取输入信息的子集作为样例进行学习,不剪枝地生长,直到满足停止生长规则并给出结果,最终集合所有单棵决策树结果做出判断并把信息传递给外界。
  随机森林通过自助法重采样技术,从原始训练样本集N中有放回地重复随机抽取k个样本生成新的训练样本集合,然后根据自助样本集生成k个决策树组成随机森林。其实质是对决策树算法的一种改进,将多个决策树合并在一起,每棵树的建立依赖于一个独立抽取的样品,其输出将会是所有决策树输出的平均值。
  随机森林中每一棵决策树为二叉树,其生成遵循自顶向下的递归分裂原则,即从根节点开始对训练集进行划分。分裂过程中,按照最大信息增益率的原则选取特征,并不断分裂为左节点和右节点,直到满足分枝停止规则方才停止生长。为了精确地定义信息增益,先定义一个度量标准,称为熵(entropy),它表示任意样例的纯度(purity):
  构建预测模型时,首先将预处理过的历史数据作为输入空间放在随机森林预测模型中,模型会根据输入空间学习历史项目中不同项目工程特征的不同物料小类的领料特征,形成随机森林网络,直到获取最优的分裂信息和信息增益率时模型训练停止。随后根据下一年度新的建设计划,包括工程属性、电压等级、下达预算等变量作为新的输入空间,进行分品类的物资需求预测。以国网某省公司的实际数据计算结果为例,对于采购金额最高的12个物料小类的预测精准度都稳定保持在95%以上。见表1。
  4 研究结论
  通过研究发现可以对配网工程项目名称进行特征值提取,结合投资规模、所属单位、电压等级等项目属性信息,分物料小类构建项目特征与物料领用信息之间的规律,通过随机森林学习并模拟,训练得到相应的映射函数,以从物料小类汇总数量的层面上实现对物资采购需求的预测。
  对于后期的实际工作而言,只要规划配网建设计划,即可评估出下一年度各物料小类的总体采购需求,大幅提升配网物资采购需求安排的准确度及需求计划的编制效率。
  参考文献:
  [1] 王学斌,马士华. 库存需求灾变灰预测模型[J].工业工程与管理,2002
  (5):23-28.
  [2] 曾艳.需求确定的多级库存系统的库存策略[J].集美大学学报,2004(3),
  77-81.
  [3] 张旭梅.面向供应链的合作计划预测与补给[J].工业工程,2000(4):
  45-47.
  [4] 王晓萍.库存控制模型与算法[J].工业技术经济,2000(5): 25-28.
  [5] Yang P C,Wee H M. Economic ordering policy of deteriorated items
  for Vendor and buyer an integrated approach[J]. Production Planing
  and Conrtol, 2011, 11(5): 474-480.
其他文献
摘 要:文章以公路机械设备的管理与养护为题展开论述。首先分析了当前公路机械设备管护中存在的问题。然后,结合实际的工作经验,提出了加强公路机械设备管理与养护的办法和措施。希望可以提高相关部门的重视度,提高机械设备的管理与养护水平。  关键词:公路;机械设备;管理;养护分析  中图分类号:U418.32 文献标识码:A 文章编号:1006-8937(2016)32-0100-02  随着社会经济的快速
期刊
摘 要:我国对电力需求量急剧提升,對配电网的可靠、稳定运行具有更高要求。10 kV配电网作为电网的重要组成部分,一旦发生故障会对人们的生产、生活、生命及财产安全造成巨大的影响。文章对10 kV配电网存在的问题进行分析,并提出了针对10kV配电网的安全运行管理研究。  关键词:10 kV配电网;安全运行;管理  中图分类号:TM755 文献标识码:A 文章编号:1006-8937(2016)32-0
期刊
摘 要:信息化时代对供电安全和可靠性提出了更高的要求,变电站作为配电网的重要组成部分,对供电质量起着重要作用,因此要重视变电运维的安全管理工作。文章首先阐述了变电运维安全管理的重要意义,其次分析了变电运维安全隐患的主要来源,最后从变电运维的人员安全管理和设备安全管理提出了具体的管理策略,以期能为安全、可靠用电提供帮助。  关键词:变电运维;安全管理;策略  中图分类号:TM73 文献标识码:A 文
期刊
摘 要:随着电网的发展,各类用电负荷不断增长,尤其是在降温负荷突增时段,随之而来的低电压问题更为集中,文章分析了配电网产生低电压的主要原因,阐述了配电网台区低电压的危害,并从优化无功补偿、使用馈线调压器、完善电网结构、充分利用用电信息采集系统等方面,对配网台区低电压问题展开了详细的分析和探讨。  关键词:配电网;台区;低电压;无功补偿  中图分类号:U224.3 文献标识码:A 文章编号:1006
期刊
摘 要:我国在发展过程中,需要电能的支持。在社会主义经济体制不断改革和完善的背景下,对火电厂集控运行提出了更高的要求,进而促进发电效率有显著提升。因此,文章针对如何加强火电厂集控系统运行综合管理进行了分析,并提出具有针对性的措施,从而为火电厂集控系统运行提供有利保障,增强火电厂集控系统运行的稳定性,最大程度的提升发电效率。  关键词:加强;火电厂;集控系统;运行;综合管理  中图分类号:TM620
期刊
摘 要:传统的变电检修模式在实践过程中逐步暴露出越来越多的缺陷,严重影响到检修质量和工作效率,状态检修技术的出现,极大的弥补了传统检修模式存在的不足,得到了较为广泛的应用。内容首先阐述了状态检修技术的特点,其次探究了基于状态检修模式的关键检修技术,最后指出了基于状态检修模式的检修技术注意事项,希望能为同仁提供参考。  关键词:状态检修;变电设备;注意事项  中图分类号:TM755 文献标识码:A
期刊
摘 要:众所周知,人们日常生活所需电能都是由火电厂提供,为其正常用电提供保障。为此,火电厂需要重视电气设备检测与维修工作。其中,火电厂汽轮机在火电厂中占据重要位置,属于关键性电气设备,而汽轮机运行的正常性也同样与电能供应实际情况关系紧密。文章对火电厂汽轮机异常振动原因研究的重要性进行了阐述,并对火电厂汽轮机工作的原理予以分析,指出判断汽轮机异常振动的方法,探讨汽轮机异常振动的原因并采取相应的处理措
期刊
摘 要:生态文明建设是“五位一体”的重要内容,绿色发展已上升到国家“十三五”时期五大发展理念,文章从保护区独特自然资源禀赋入手,对保护区的经济功能进行详细论述,以正确分析江苏盐城国家级珍禽自然保护区在盐城经济发展中的重要作用,最终从能源、生态旅游、生态文明等不同视角,注重江苏盐城国家级珍禽自然保护区从滩涂资源的综合开发与海洋资源综合开发方面以实现与盐城“供给侧改革”的协同发展。最后从完善生态红线管
期刊
摘 要:文章首先提出校企合作运行机制的重要性,接着明确校企合作运行机制的内涵,然后分析国外校企合作运行机制的特点,国内校企合作运行机制的现状,最后进行总结并提出职业院校校企合作运行机制合理化建议。  关键词:校企合作;“三赢”;运行机制;保障  中图分类号:G710 文献标识碼:A 文章编号:1006-8937(2016)32-0126-02  校企合作是职业教育办学的一种形式,它是现阶段职业教育
期刊
摘 要:文章主要简析了雷电故障对电力系统中输电线路的危害性,并按照此类危害罗列出了国内外常规以及新的防雷措施。  关键词:运行维护;故障排除  中图分类号:TM755 文献标识码:A 文章编号:1006-8937(2016)32-0116-02  雷暴天气是自然现象中的一种天气现象,近一段时间以来雷电灾害发生非常多,发生频率逐年上升,雷害会对社会产生严重的破坏,同时产生巨额的经济损失,使人们非常的
期刊