【摘 要】
:
本文提出一种基于分布式框架改进随机森林算法的火电厂燃烧系统设备数据建模方法,即利用多元共线性检验改良逐步回归,筛选工业流程中的最优变量.将处理后的变量数据应用于Hadoop平台下,结合Mapreduce和Spark分布式框架,对传统随机森林算法进行并行式优化.研究结果表明基于Hadoop的分布式随机森林算法有效地提升了训练效率和数据处理速度,建立的模型具有较高准确度,泛化能力较强,具有较高的工业研究价值.
【机 构】
:
沈阳化工大学信息工程学院,辽宁沈阳110142
论文部分内容阅读
本文提出一种基于分布式框架改进随机森林算法的火电厂燃烧系统设备数据建模方法,即利用多元共线性检验改良逐步回归,筛选工业流程中的最优变量.将处理后的变量数据应用于Hadoop平台下,结合Mapreduce和Spark分布式框架,对传统随机森林算法进行并行式优化.研究结果表明基于Hadoop的分布式随机森林算法有效地提升了训练效率和数据处理速度,建立的模型具有较高准确度,泛化能力较强,具有较高的工业研究价值.
其他文献
针对半钢子午线轮胎不同位置的气泡产生原因进行具体分析,通过优化结构设计、加强工艺管理和严格执行技术标准等措施,有效避免半钢子午线轮胎气泡的产生,从而降低废品数量,降低生产成本,提高轮胎使用性能.
选用高饱和度低丙烯腈含量的氢化丁腈橡胶(HNBR),通过机械混炼的方法加入不同量的碳纳米管(CNTs),研究CNTs用量对HNBR的物理性能、高温拉伸性能、耐磨性能和低温性能的影响.结果 表明,加入CNTs使胶料拉伸强度和定伸应力有不同幅度的提高,对拉断伸长率有降低作用,可提高胶料的高温拉伸强度、耐磨性能和低温性能,使HNBR产品适应更严苛的工况.结合使用工况利用CNTs的取向性有助于提高产品性能.
分析浸胶帆布静态粘合力测试的影响因素.结果 表明,采用专用切刀一次成型试样、将备测试样放在黑色塑料袋中保存、按照帆布的型号选用合适的胶片厚度和模具、制样过程中减少油性物质的污染、采用耐高温隔离纸、规范试样冷却方式、采用适宜的拉伸角度和拉伸速率,可有效提高测试结果的准确性.
基于量子信息处理提出了一种量子音频的零水印算法.首先利用量子离散余弦变换在宿主量子音频频域内的低频区域提取一组量子序列,然后利用Henon映射对该序列执行加密算法,从而生成量子零水印.通过将Henon映射的量子线路作为零水印的量子秘钥,有效地提高了量子零水印算法的安全性.本文设计了量子Henon映射置乱和量子零水印生成及提取算法的线路图,对零水印算法的可行性进行了验证.仿真实验表明,与现有的量子音频水印算法相比,本文提出的量子零水印算法具有更好的不可感知性及鲁棒性.
针对未知模型非线性离散时间多智能体系统中的传感器饱和问题,本文提出了一种数据驱动控制策略,实现了多智能体系统的双向一致性跟踪.首先,利用伪偏导技术将未知动力学模型的非线性多智能体系统转化为含有时变参数的动态线性化数据模型,然后通过相应性能指标函数获得了时变参数的估计算法,并提出了一种基于饱和数据的数据驱动分布式双向一致性跟踪控制协议,同时对其收敛性进行了严格地证明.最后,进行了仿真实验,实验结果证明,虽然所提出的控制协议的收敛速度会随着传感器饱和程度的增加而降低,但最终能够使系统的双向一致性误差收敛到0.
随着4K视频、“智慧家居”、车载物联网和虚拟现实技术等大数据互联网业务的兴起和普及,网络数据流量飞速增长,根据思科发布的最新报告,2022年全球网络系统的IP数据流量将超过1995年至2016年的流量总和,用户对数据传输速率的需求飞速增长,而基于单模光纤的光通信传输系统的信息容量已逐步逼近香农容量极限。因此,长距离高速信息传输载体的光纤通信系统面临着巨大的容量增长压力。而通过增加芯数和模式两个空间
针对非平衡数据的再平衡问题,提出了一种基于时间序列模型的过采样算法.首先,提出了一种确定性数据转化为随机数据方法,把少数类数据转化为时间序列;其次,对经少数类数据转化而成的时间序列进行平稳性检验,并进行平稳化处理;再次,对平稳后的序列建立合适的时间序列模型并进行预报,从而使数据集达到平衡.最后,从UCI (University of Californialrvine)和KEEL (Knowledge Ex-traction based on Evolutionary Learning)数据库中选择6组数据
为一类含有输入延迟的线性切换系统构造切换预估器,预估系统未来状态,以消除输入延迟的影响.利用预估状态设计在任意情况切换信号的切换控制器,使闭环切换系统在任意切换下全局渐近稳定.根据系统初态和未来的切换信息推演预估器初值,在预估器超前系统切换时间等同于原系统输入延迟时间的情况下,能够准确预估系统未来状态,从而能够明确闭环子系统的动态,简化控制器设计和切换系统稳定性分析过程.通过仿真表明,设计的预测器能有效的提供超前状态信号,基于此设计的控制器实现了渐近镇定.
针对回声状态网络参数难以选择的问题,提出一种基于行为空间优化回声状态网络参数的方法.其实质是通过泛化等级、核心等级、记忆容量构建回声状态网络行为空间.优化算法采用新颖搜索遗传算法(NSGA),该算法结合K近邻个体距离和NMSE,通过建立行为空间最低配置筛选基因来限定遗传算法的遗传方向,提高优化效率,进而找到影响网络性能的因素.该方法克服了传统回声状态网络(ESN)参数选择困难、遗传算法优化时间长且无合适理论阐明储层性能对任务的影响等缺陷,提升了优化效率和网络学习性能.实验结果表明,本文所提NSGA-ESN
在实际工业过程中,故障数据通常具有较强的非线性特征,并且非线性特征的种类也较为多样.现有的基于核策略的过程监测方法中,通常只使用一种核函数进行故障的非线性特征提取,很难对非线性特征进行较为全面地刻画,因此单种核函数的过程监测方法对不同故障的分类效果十分有限.此外,常规核方法中的核参数通常由经验确定,难以取得最优的特征提取结果.为了解决此问题,本文提出一种优化的多核局部费舍尔判别分析(OMKLFDA)模型,首先,通过权重系数将多个核函数集成至局部费舍尔判别分析(LFDA)模型中,从而能够提取故障的多种非线性