基于自编码器的计数数据质量预测方法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:arenlin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计数数据是一种重要数据类型,广泛存在于众多学科与工程领域。计数数据的观测值以非负整数的形式表示,属离散变量。其非负整数和离散特征,决定了有必要建立离散计数数据回归模型,以探究影响事件发生率的关键因素和实时预报事件的发生次数。工业过程正朝着大规模、复杂化的方向发展,所产生的测量数据呈指数级增长,以过程变量预测质量变量的软测量技术应运而生。目前计数数据建模在工业领域的应用尚不成熟,将传统的软测量方法运用到工业计数数据建模时仍具有一些局限;同时工业过程数据往往具有高维、非线性、非高斯等特性,传统的计数数据建模与分析方法面临着信息挖掘不充分的缺陷。所以建立工业计数数据模型有较多待解决的问题。本文结合计数数据特性,借助深度学习具有强大的特征提取能力,基于自编码器对工业计数数据进行质量预测建模研究,主要研究内容如下:(1)针对常规计数数据模型特征提取能力弱的问题,提出了基于深度特征提取器的泊松回归模型。将计数数据泊松回归引入深度堆叠降噪自编码器,有效提取能反映原始输入数据的深度特征,提高了模型的特征挖掘能力,提升了计数数据回归模型的预测效果,实现更好的工业质量预测。(2)针对常规自编码器不能提取质量变量相关特征的问题,提出了基于监督泊松自编码器的计数数据回归模型。在预训练的解码阶段引入质量变量来指导特征提取,通过泊松网络层将质量变量计数数据集成到深度堆叠编码器结构中,使得模型学习到的特征表示与计数数据类型的质量变量高度相关,提升了特征提取效率,并且提升了计数质量数据的预测效果。(3)针对常规自编码器特征利用不充分的问题,在监督泊松自编码器的基础上提出了基于注意力堆叠监督泊松自编码器的计数数据回归模型。通过引入注意力机制来衡量各个隐层特征对于计数数据输出值的贡献,并用泊松网络层来集成隐层特征,运用蕴含在不同隐层特征中的信息共同预测计数数据质量变量,建立了输入到输出的多条连接通道,提升了隐层特征的有效利用率,且改善了模型的预测性能。
其他文献
先天性特发性眼球震颤(congenital idiopathic nystagmus,CIN)是临床上最常见的儿童眼球震颤类型,发病率约1/3700。其主要表现为眼球震颤引起的视功能障碍和患病儿童为减轻震颤而采用的异常观察头位。患儿固定的异常头位被称为代偿头位。临床上比较有效的治疗方法是通过眼外肌的断腱重缝将代偿头位下的观察中间带移至正视头位下。因此定量、准确地测量患儿代偿头位及眼球震颤强度对该疾
学位
具有环境顺服性的柔性机械臂的控制问题是目前人机协作领域中需要的解决的重要问题之一,近年来引起了众多国内外研究学者的关注。本文在此背景下,结合生物中小脑的自适应学习、预测控制的作用,研究了基于小脑模型的柔性机械臂控制方法。围绕多自由度柔性关节机械臂的仿生控制、软驱动器驱动的仿生机械臂系统建模与控制以及基于脉冲特性的仿小脑控制方法这三个方面进行了研究。主要研究内容如下:1.针对多自由度柔性关节机械臂的
学位
随着高校信息化建设的发展以及教育部对构建智能化教学支持环境的号召,传统多媒体教室渐渐不能适应教学改革的需求和教育信息化发展的方向,越来越多的高校开启创新之路,智慧教室作为信息技术与教育深度融合的产物应时而生。在此背景之下,国内众多高校纷纷开始建设智慧教室来探索教学模式和教学方法的变革,以此来满足信息时代背景下对智慧教育的迫切需求,北京作为我国的首都和教育中心更应走在前列。有研究表明,由于缺少指导性
学位
路面裂缝是道路病害的重要表示形式之一,也是许多其他病害的早期形式。中国每年在裂缝检测和维护上投入了大量的人力和物力,路面裂缝的自动检测可以极大地降低养护成本。目前使用激光、雷达等相关技术的检测方法已经相对成熟,但由于设备昂贵,仅适用于桥梁等特殊路面,难以规模化应用。而随着计算机视觉领域的快速发展,基于深度学习的路面裂缝检测也取得了一定的成果,但在实际应用时,检测性能仍有一定的提升空间。本文针对路面
学位
钢铁作为基础的原材料,是现代生活不可缺少的必需品,高炉炼铁作为大型炼铁系统中关键工序,其运行的稳定性决定了整个炼铁系统的运转效率和质量,因此快速准确地对高炉故障进行检测和识别对于高炉乃至整个炼铁系统稳定运行有着重要意义。高炉本身作为一个复杂的大型系统,其准确的机理模型难以建立。数据驱动的高炉故障诊断方法由于不需要准确的过程机理模型,而得到了广泛的使用。有别于高炉故障检测方法,有监督的高炉故障分类算
学位
随着国内港口集装箱吞吐量的不断增长,提升集装箱码头整体工作效率的需求日益迫切。集卡和场桥作为集装码头水平运输和堆场作业的主要设备,通过智能调度策略弥补人工调度策略存在的不足,提高作业设备的工作效率,对集装箱码头发展具有巨大的现实意义。本文以国内某大型集装箱码头集卡和场桥的调度情况为研究背景,对各个调度子系统和系统之间的耦合性进行详尽分析,设计了基于动态分杆的集卡与场桥联合调度方案,并通过仿真验证方
学位
火电机组因煤炭存储量大、技术要求低、基础设施完备等原因一直是我国电能产生的主体,煤炭燃烧不可避免地产生有害气体,其中,氮氧化物(NOx)是火电机组烟气中主要污染气体之一。近些年,随着环保意识的提升与排放政策的收紧,基于选择性催化还原(SCR)的脱硝技术被广泛使用于火力发电厂,SCR脱硝系统的控制优化也成为了研究热点。SCR系统入口氮氧化物浓度是脱硝控制的重要输入量,但是由于检测系统固有的分析时延,
学位
癫痫是由脑部神经元异常同步化放电所导致,以突发性、重复性和短暂性为临床特点,是一种常见的神经系统疾病。脑电图可以反映大脑内部的状态,利用脑电预测癫痫发作问题是癫痫检测的常用手段,另外随着计算机技术的发展,通过深度学习的癫痫发作自动检测研究越来越成为癫痫临床研究领域的热点问题。长短期记忆网络(Long Short-Term Memory,LSTM)是一种时间循环神经网络,它是为了解决循环神经网络(R
学位
带有目标追踪功能的移动机器人在未来的安防、军事等领域将会有着广泛的应用。球形机器人是一种外壳为球形的特殊机器人,在其内部封装有运动部件和部分传感器,通过重心偏移等原理,可以全密封、高速、稳定地运动,对复杂环境适应性强。球形机器人低视角,外壳遮挡,背光等原因会导致传感器数据质量不高,且计算资源存在限制,对感知算法的性能提出了更高的要求;其滚动的运动方式,需要适配专门的运动控制算法来进行轨迹规划与跟踪
学位
随着智能家居、智能安防、自动驾驶等领域的快速发展,工程上迫切需要将深度神经网络部署到各种嵌入式设备中,如冰箱、电视、摄像头、车载电脑等等。然而,目前嵌入式设备部署应用深度神经网络面临着模型参数量大、设备环境复杂等困难。因此,本文针对嵌入式设备部署应用深度神经网络所面临的问题展开了具体研究。首先,针对深度神经网络难以在资源受限的嵌入式设备上高效存储和运行的问题,本文以网络量化为基础,提出了基于标量量
学位