缺失数据处理方法的研究及其在软测量技术中的应用

来源 :东北大学 | 被引量 : 22次 | 上传用户:abcd55443388
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在各个领域的调查研究中,由于各种因素的影响,经常会导致缺失数据的存在。它不仅影响研究人员后续工作的有效展开,也会干扰估计精度。有关缺失数据的处理方法一直是应用统计界的一个研究热点。如何进行科学处理,以便充分利用已有资料,减少缺失数据带来的负面影响,已经成为信息社会各个科学实验领域研究的一个难点和热点话题。本文以工业过程中的缺失数据问题为背景,采用填补的方法对缺失数据问题进行处理,形成完整的数据集,然后再进行后续工作。主要研究内容为以下几个方面:(1)在深入了解工业过程数据特点的基础上,总结了工业过程中缺失数据产生的原因并对缺失数据进行分类。(2)针对缺失数据的各种类型,提出或总结了有效的缺失数据填补方法,包括单值填补和多重填补两大类。并给出了填补的原理和应用实例。实例表明在不同缺失类型下选择适当的填补方法可以得到较理想的结果。(3)以青霉素生物发酵软测量建模过程为背景,首先人为地任意构造具有一定缺失率的训练数据集,然后选择合适的填补方法对缺失数据集进行填补。最后针发酵过程中难以在线测量的菌体浓度、基质浓度、产物浓度,利用原始训练数据集、删除法所得到的数据集以及填补后的完整数据集建立预测模型,验证数据填补方法在软测量建模中的有效性。仿真结果表明,当建模数据集存在缺失数据时,对缺失数据进行填补可以大大提高软测量模型的预测精度。
其他文献
电力客户具有生命周期,电力客户生命周期是指电力客户关系水平随时间变化的发展轨迹,它描述了客户关系从一种状态(一个阶段)向另一种状态(另一阶段)运动的总体特征。本文的研
在《崩溃》这部小说中,阿切比通过对主人公奥孔克沃充满人性化的刻画以及对伊博文化的详尽描写,挑战了欧洲中心主义社会文明进化话语,解构了殖民话语所倡导的欧洲文明和非洲
文章首先通过采用1991-2010年间的数据,用回归分析法研究了江苏省城乡人均居民收入、商业规模、政府支出和常住人口对消费的影响,结果表明:对江苏省居民消费长期发展有显著影
快餐文化的盛行,使网上浏览日益成为多数人的阅读习惯.以往的手捧一卷悠然南山,已渐渐远去.购书对于广大读者而言,既是一种享受,也是对自己视力与智力的一场考验.书的装帧、
藏红花是一种临床应用十分广泛的中药材,其具有散瘀开结、活血化瘀之功效。藏红花的有效成分主要包括藏红花素、苦藏花素等,其主要被应用于心血管疾病防治,同时含有藏红花的
目的:通过问卷调查的方式,将湿疹患者中医体质、辨证分型、西医分期的年发病次数加以统计,得出不同中医体质、辨证分型及西医分期湿疹患者的年发病次数分布规律及特点,为湿疹
环境治理是城市群发展中面临的重要挑战,如何实现地方政府治理行动的有效整合与协调是关键议题。本文提供了地方政府网络的分析框架,并利用长三角30个城市的府际协议数据,研
实践教学是"毛泽东思想和中国特色社会主义理论体系概论"课教学的重要组成部分,也是提高教学效果的有效途径,防灾科技学院在教学实践中总结形成了"概论"课以生为本的实践教学
国内的不锈钢激光焊接技术在汽车制造行业推广使用速度很快,但在烟机行业尚处于萌芽状态。目前,本公司开发不锈钢激光焊接机器人系统用于烟机焊接,采用激光焊接技术对烟机顶
会议
青藏高原的自然地理环境十分独特却也非常脆弱,水土流失的潜在危害性大.在全球变化和西部大开发的背景下,研究青藏高原水土流失规律具有重要意义.从自然地理条件出发,总结了