对有关联数据缺失填补方法的改进

来源 :科技创新导报 | 被引量 : 0次 | 上传用户:beardengsha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文根据生物样本数据之间有关联性的特点,对一种最基本的缺失数据填补办法进行逐步优化。首先对数据进行预处理,摘取部分R统计软件中自带的iris鸢尾花数据,每一行代表一株花的记录,并人为随机挖空。其次,使用最基本的均值填补对缺失数据进行填补。然后,针对均值填补法的主要缺点,提出改进方法:对样本数据进行系统聚类,再对分类后的各组数据分别进行均值填补。考虑样本数据之间的关联性,对分类之后的填补方法再一次进行优化,采用回归填补法填补缺失数据。比较基本的均值填补、分类后的均值填补、分类后的回归填补,发现三者的误差率逐
其他文献
供应商的选择对JIT采购的成功与否并进而对实现企业战略目标至关重要。本文介绍了运用层次分析法构造供应商评估体系的具体做法,并分析了案例企业实施该评估体系后的效益。经
现代企业管理学认为,企业的领导力与职位高低无关,领导力存在于组织的各个层面,而决不仅仅是高层。组织成功的最根本要素通常是整个团队的领导能力,而不是某个"个人英雄"。领
利用渔获物统计法对我国鲟鱼主产区黑龙江、长江鲟类十几年的捕获物进行研究。研究发现:由于人为酷捕滥捞、环境污染,黑龙江鲟鱼种群结构严重失衡、资源急剧下降(452t,1987年
在地网接地阻抗测量时,电压和电压测量引线之间存在互感,从而影响接地阻抗测量结果的准确性,因此有必要开展消除测试引线互感对接地阻抗测量影响的研究。提出了一种电流极和
目的探讨神经内科康复护理对脑卒中患者的临床效果。方法选取2016年1—12月在舞阳县人民医院神经内科住院治疗的187例脑卒中患者进行分析,根据护理方式不同将其分为常规组(85例
通过对圆筒形零件拉伸挤边过程的分析,介绍了拉伸挤边的特点及适用范围。分析了模具结构各参数对零件的质量和模具寿命的影响,提出了模具结构各参数的确定原则,为其它圆筒形拉伸
基于阿伦尼乌斯原理和分子振动理论,分析了软性抛光粒子、石英玻璃和抛光垫之间的弹性与超弹性接触,研究了用软性粒子抛光石英玻璃的材料去除机理。基于理论研究进行了大量的
从分析产业链中的跨行业信息需求入手,探讨了通过跨行业、跨系统的信息资源整合来服务于产业链的协同信息服务体系的组建策略,并在此基础上构建了面向我国工业体系中各主要行业
<正>~~
平遥不大,名气不小 山西有个平遥,地方不大,名气不小。这里曾经是中国的金 融中心,1998年被联合国列入世界文化遗产。如果研究中国金 融史的人不知道平遥就好像学习西方金融