【摘 要】
:
对于时间序列挖掘过程中的缺失值处理,目前有许多方法。在处理数据变量成一定的相关的数据集时,回归模型不失为较好的插补方法。利用均值插补、一元线性回归、多元线性回归、
【机 构】
:
厦门大学信息学院计算机系,兰州大学资源环境学院
【基金项目】
:
福建省自然科学基金资助项目(A031008)
论文部分内容阅读
对于时间序列挖掘过程中的缺失值处理,目前有许多方法。在处理数据变量成一定的相关的数据集时,回归模型不失为较好的插补方法。利用均值插补、一元线性回归、多元线性回归、迭代回归方法对水文时间序列数据集的缺失数据进行处理,比较不同的皮氏相关系数下各方法的优劣及适用性。文中研究表明当数据集中存在与缺值变量相关度较大的变量时,一元线性回归的插补简单直观,且有较高的精度,结果接近真实;当数据集中不存在与缺值变量显著相关的自变量时,一元线性回归的结果变差,多元线性回归与多元迭代回归具有较好的结果,但多元迭代回归迭代次数难以确定,插补代价较大,多元线性回归为最佳选择;当缺值变量与其他自变量相关系数均较小时,回归插补的结果不理想,此时可考虑其他插补方法。
其他文献
孔子、孟子、荀子礼的起源观分别是“天道说”、“本心说”、“制欲治乱说”,并由后世不同思想家继承和发扬。他们礼的起源观是各自所处时代和社会历史在思想理论上的反映,但
针对数字天顶仪,研究一种解算CCD坐标系x轴与北向之间夹角以实现定向的方法。通过对称位置两幅星图解算得到的天顶仪旋转轴的天文坐标,与已知测站点位置真值进行运算,得到相
本科教育的重点是发展学生的高阶认知能力,提高抽象思维能力,这就需要教师的教学方法转变,在'大学以教学为中心与教学以学生为中心'的基本理念指导下,形成集认知分析
当今社会发展经济水平逐渐提高,科学技术水平显著提升,智能化电力网络实现了极大的变化,并且其也有了良好的发展前景。尤其是近些年来,智能电网逐渐受到很多外国企业和政府的
特细钢微丝由不锈钢强力拉拔而成,既具有普通钢纤维的力学特性,又可克服有机纤维与混凝土之间的界面粘结问题,且其直径为微米级而具有高长径比,在低掺量下即可相互搭接形成连
传统教育的最大弊病在于它主要是一种补短的教育。在现实教育中,补短教育主要表现为标准化管理、同一性教学、单一性评价。补短教育的主要危害是封杀了学生的自尊心和自信心,
历时两年半之久,行程数万公里,采访100余个代表性中国村落,许多村落甚至反复采访与拍摄三到四次。纪录片人夏燕平及其团队继《西湖》与《南宋》之后的又一部大型人文纪录片力作
国家环保标准和人们环境意识日益提升,水泥厂常规大气污染物SO2排放受到重点关注,越来越多的水泥厂也暴露出SO2超标的问题.本公司围绕中低浓度SO2排放特点,选择了复合脱硫技
教育平等是人类追求社会平等之梦的一个重要组成部分,对于这个梦想,不同时代的人曾有过不同的阐释;即使在今天,人们对教育不平等性问题的理解仍然是莫衷一是。因此,在以科学
中国汽车产业现在发展迅速,技术水平较以前有较大提高,但是仍然与发达国家有一定差距。本文重点探讨了中国汽车制造企业如何在新形势下制订新的技术引进策略以及如何在引进技