【摘 要】
:
在机器学习和数据挖掘过程中,数据缺失现象经常发生。对缺失值的有效补全是数据预处理的重要组成部分,也是后续分析挖掘工作的基础。最近邻填充算法(kNNI)因其易于实现、计算
【基金项目】
:
大学生创新计划(S201610022096)
论文部分内容阅读
在机器学习和数据挖掘过程中,数据缺失现象经常发生。对缺失值的有效补全是数据预处理的重要组成部分,也是后续分析挖掘工作的基础。最近邻填充算法(kNNI)因其易于实现、计算方便和局部填充效果好等特性而被广泛应用。但是,它并不涉及全局信息,因而当大段缺失值发生时,补全效果会有所降低,而对于具有周期成分的时序数据,其效果更是急剧下降。幸运的是,傅里叶变换能够解析出周期数据中的不同周期成分,并能在此基础上通过逆变换基本实现数据复原,只不过其局部复原能力较弱。因此,本文结合傅里叶变换对周期性数据的全局复原能力和kNNI对局部数据的补全能力,提出了基于傅里叶变换的kNNI缺失值补全算法(FkNNI)。通过对大量模拟数据的测试结果表明,该算法比单纯的kNNI算法的缺失值补全准确性有很大提升。
其他文献
少数民族题材电影是记录和传承我国民族文化、民族体征、民族精神的重要载体。改革开放以来,少数民族题材电影取得了长足的进步,形成跨时代、跨地域、跨文化的创作态势,充分
文学翻译 ,尤其是诗歌翻译 ,在翻译过程中一定要保持其美学风格特征 ,所以就离不开对语言美学功能的运用。本文主要从组成语言美学功能的三方面 :语音系统 ,结构系统和语义系
创业是世界技术发展到现行阶段的一个重要体现,随着经济社会的高速发展,国家提倡“大众创业万众创新”,这是应对市场化需求的有力举措。而供需矛盾如何解决?必然有待高校创新
<正>6月4日,由工业级3D打印领航企业华曙高科牵头,中机生产力促进中心等11家单位参与制定的《增材制造设计要求、指南和建议》(标准号GB/T 37698-2019)国家标准正式发布并开
当今社会,科学技术飞速发展经济全球化的日益深入到人们日常生活的方方面面,市场也因激烈的竞争不断出现断裂化。并且由于互联网的发展更进一步加剧了市场的分裂走势。而市场的
旅游地形象的研究一直是国内一个备受关注的领域,而有关古村落旅游形象的研究相对较少,且多属于文化性或景观性研究,没有引入反馈、修正机制和社区参与。基于此,笔者从社区参
两种不同拍摄态度和方式直接涉及了对纪实摄影本质的看法。中国纪实摄影发展具有本土特色和民族特点。在经济文化状况和政治环境的影响下,制式化的纪实摄影格局中"个性化"正
目的探讨肩矫正带治疗脑卒中偏瘫患者肩关节半脱位的疗效,通过使用肩矫正带与康复治疗结合的方法,对比单纯应用康复治疗,观察肩矫正带在改善上肢运动功能、减轻肩关节半脱位
p-中心问题与p-中位问题是两类基本的选址问题,在选址问题的研究中占有十分重要的地位.本文从问题的性质、算法设计思想与计算复杂性等方面总结了现有的研究成果,并指出了进
目的:骨折常并发骨不连,导致严重的功能障碍,给家庭和社会带来巨大负担。本实验应用大鼠萎缩性骨不连模型,探讨骨髓间充质干细胞、血小板凝胶和体外冲击波联合应用对骨不连治