基于粗糙集与LDA的不完备数据处理方法研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:jbue520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
进入21世纪后,互联网技术飞速发展,数据可以快速通过线上方式进行获取和存储,这为数据挖掘工作带来了机遇,但由于各种原因往往会获取到不完备数据,如何准确、有效的处理不完备数据是当前研究的热点,因此,本文首先通过优化的填补算法使不完备数据通过填补成为完备数据,接着针对完备数据的分类问题展开研究,本文主要研究工作如下:(1)针对利用相似样本进行填补的过程中,不能精确定位和填补时易受数据干扰,影响算法填补效果等问题。设计了基于粗糙集的样本缺失维度填补算法。该算法首先利用粗糙集进行属性约简,接着对约简后的决策表进行k均值聚类,并利用相似度进行待填补样本与聚簇结果的比较,从而精确定位较相似样本。最后以最小二乘法为核心思想,进行相应缺失维度上的数据拟合,减少了不相关数据的干扰。实验结果表明了本文算法的有效性。(2)针对利用近邻样本进行类别预测的过程中,训练集较大和样本特征数差异,影响算法分类效果等问题。设计了基于线性鉴别分析法的样本均值KNN改进算法。该算法首先利用线性鉴别分析法,降低样本特征数及其差异带来的不利影响。进而比较了待测样本和各类样本均值相似度,选择性筛选训练集,最后利用改进的距离公式计算K最近邻。实验结果表明了本文算法的有效性。(3)针对医学领域的甲状腺样本,分析了基于粗糙集的样本缺失维度填补算法和线性鉴别分析法的样本均值KNN改进算法的数据处理流程,运用本文设计的两种算法,对甲状腺样本进行相关实验设计,结果表明了本文算法的有效性。
其他文献
随着社会的进步,医疗保险制度逐步成为人民生活保障体系的重要组成部分。按服务项目收费的支付方式,容易带来医疗费用不合理增长,推行单病种付费的医疗保险支付方式,不仅可以
制导系统与控制系统是导弹最为核心的架构,其直接决定着导弹的性能。随着导弹技术的发展,对制导精度提出了更高的要求。制导控制一体化技术将导弹的制导系统与控制系统视为一
在信息技术高速发展的现代,随着纳米光子学的发展,人们希望在微纳量级上能可控制备出具有特定分子结构和功能的光子学元件,从而实现集成光路。与无机材料相比,有机材料具有优
在当今各国合作共建的时代背景下,中蒙两国作为睦邻友好的邻国,将新蒙文做一个有效的电脑录入以及字符识别,能有利于两国之间和地区之间的经济、社会、文化发展,也能促进两国
光学隐身斗篷是一种基于变换光学理论的新型人工超材料器件。人们通过改变材料的电磁参数,使光线在材料中绕开物体传播,从而实现对物体的隐身,这种材料也被称为变换介质。随
位姿估计是计算机视觉和摄像测量学中的基础性问题,常用于视觉伺服、SLAM等领域。针对舰载机刚体目标的位姿估计和跟踪问题,本文分别对使用几何测量和深度学习的方法进行探讨
作为智力密集型产品,软件开发过程中不可避免地会出现软件缺陷。为了定位、修复软件缺陷,维持系统正常运行,软件调试与维护活动几乎持续贯穿了软件的整个生命周期,但这付出了
体育运动作为一种伴随着人类历史发展的活动,对普通大众有着一种天然的吸引力。众多学者的研究表明,体育赛事的成功举办对当地的经济、文化、政治和社会影响等方面会产生积极
随着煤炭开采深度的增加和开采环境的恶化,每年都会发生各类煤炭开采安全事故。为了提高事故救援的效率和安全性,研究人员研制了救援机器人可进入巷道参与救援行动。由于矿井
钛酸铋钠(Na0.5Bi0.5TiO3,简称BNT)陶瓷是一类具有巨大发展前景的无铅压电陶瓷,但由于其矫顽场和电导率较高,致使陶瓷难极化,在实际生活中难于被应用。因此,对于BNT陶瓷存在