【摘 要】
:
近年来,人工智能和知识发现的发展迅速,计算机技术在各领域的应用日益增多。数据量剧增,并呈现高维度、多类别、结构复杂等特点,对这些数据进行处理和挖掘,从中获取有价值的知识具有重要的研究意义和应用价值。粗糙集理论作为一种有效处理和分析不完备和不确定性数据的数学工具,为数据挖掘的研究提供了良好的理论支撑。同时,代价敏感学习是数据挖掘领域中的十大具有挑战性问题之一,其主要目的是获得最小总代价的属性集合。因
论文部分内容阅读
近年来,人工智能和知识发现的发展迅速,计算机技术在各领域的应用日益增多。数据量剧增,并呈现高维度、多类别、结构复杂等特点,对这些数据进行处理和挖掘,从中获取有价值的知识具有重要的研究意义和应用价值。粗糙集理论作为一种有效处理和分析不完备和不确定性数据的数学工具,为数据挖掘的研究提供了良好的理论支撑。同时,代价敏感学习是数据挖掘领域中的十大具有挑战性问题之一,其主要目的是获得最小总代价的属性集合。因此,本文以代价敏感粗糙集为理论基础,针对应用领域中不同的数据类型,从测试代价和误分类代价的视角,提出了两种基于代价敏感学习的属性约简算法。第一、提出一种面向不完备邻域数据的代价敏感属性约简算法。由于代价敏感属性约简问题作为经典属性约简问题的自然扩展,其研究更具有现实应用意义。目前,代价敏感属性约简问题的研究主要是在完备决策表中处理名义型数据。但是实际应用中,由于信息的缺失和遗漏,导致数据呈现不完备性。为此,针对上述问题,本文基于特征的测试代价和决策的误分类代价,构造一种面向不完备邻域数据的属性约简算法。首先,算法计算不完备邻域数据的邻域粒度,根据新给出的基于测试代价和误分类代价的属性重要度的度量方法,然后,基于核属性的启发式策略求解出的属性约简结果;最后,通过理论分析和实例分析说明了算法的可行性和合理性。第二、提出了一种变精度下不完备混合数据的代价敏感属性约简算法。由于在实际应用领域中多种数据类型并存,同时获取数据需要付出一定的成本和代价。为此,在代价敏感学习下研究不完备混合数据的属性约简显得尤为重要,为了解决这个问题,引入了变精度粗糙集模型,提出一种基于代价敏感的变精度不完备混合数据属性约简算法,首先,根据阈值和可变精度求出全局下的邻域粒度和正域,并求出每个属性下的正域,然后根据新定义的基于测试代价和误分类代价属性度量方法,求解出属性的重要性,通过基于贪心搜索策略的属性约简算法计算出约简结果。最后通过实例分析和实验对比,相比没考虑代价的算法,该算法能获得低总代价的属性约简结果,进一步说明算法的有效性。最后,对本文的算法和理论知识作出了全面的总结和展望。
其他文献
无线中继通信技术能够扩大通信覆盖范围,提高信息传输的可靠性;多中继技术可以有效提高通信网络的分集增益,在提高系统可靠性的同时提高系统有效性;多天线技术可以提高系统容量和改善链路的传输可靠性。因此在提高通信网络系统性能的前提下,研究中继通信技术有着重要大意义,提高通信网络的可靠性和有效性是现今通信的追求,进一步讲,由于无线中继节点的电池容量受限,由此研究新型的无线携能传输技术非常必要。针对能量采集的
近年来对地理标志大米产地真伪性鉴别的研究主要集中在基于过程追溯的大米产地溯源系统技术与基于源头鉴别的大米产地确证技术两个方面,其中产地溯源系统中企业为整个溯源提供基础的数据来源,难以避免人为因素对溯源结果造成影响,可能出现“真条码,假溯源”的产地造假现象。而结合机器学习算法的大米产地确证技术虽然获得了较好的鉴别效果,但是在处理大规模数据时,传统的机器学习算法的时间复杂度较高,产地确证模型分类效率较
人体平衡能力是衡量身体健康程度的重要指标。平衡能力弱或平衡障碍通常表现为站立或行走不稳,容易造成跌倒。随着人口老龄化的加剧,我国每年有4000万老人因平衡障碍而发生跌
卷积神经网络(CNN)是由人工神经网络扩展而来的一种深度学习结构,近年来,已被广泛应用于视频监控、移动机器人视觉、图像搜索引擎等领域。CNN是一种计算密集型算法,通用处理
本文主要研究了三方网络博弈和战争博弈,对于研究实际中的竞争关系和模式有重要意义。文章从分析网络的有效性和纳什性入手,将在社会实际中的竞争博弈关系体现为实力不均等的
随着经济全球化的深入,企业面临的竞争压力越来越大。在这种背景下,企业希望通过提升产品一次检测合格率,来减少返修费用、增加效益等,因此越来越多的企业探索通过精益六西格玛管理来提升产品一次检测合格率。中国企业虽然也在不断探索使用精益六西格玛管理来解决类似的问题,然而真正成功实施的却并不多见。因为国内对精益六西格玛管理的研究还主要停留在理论层面,如何同中国企业的发展实际相结合,形成一套符合企业文化的精益
三棵树苗寨位于贵州省凯里市三棵树镇下属的开怀街道,当地的社会历史变迁经历了从无到有、合乡建镇、特色小镇三个发展阶段。1970年,周边村寨的苗族村民被有计划地迁居此地,形成了三棵树苗寨;1995年,省、市级单位将该地与周边乡镇合并,成立了三棵树镇政府;2007年-2016年,三棵树镇主动完成民族特色改造工程,被国家纳入“特色小镇”的建设规划。三棵树地区内的生计发展根据国家建设不同阶段的侧重而有所变化
随着信息时代的快速发展,视频逐渐成为数据存储的载体。因此视频理解作为人工智能中一个重要的研究领域,受到各方面学者的关注。人体动作识别作为其中的代表任务,可广泛应用
人口老龄化程度的加深以及“未富先老”特征的凸显,使“无钱养老”“无人养老”成为不少老年人以及整个养老行业需要面对的挑战,“智慧养老”便是应对这一挑战的利器。上海市从20世纪90年代开始,不断探索智慧养老发展路径,然而发展过程中相关问题也逐渐显露,其中服务供需矛盾问题突出,亟需找到原因和解决对策。诸多学者在研究智慧养老存在的问题时亦指出供需失衡是影响智慧养老服务的关键问题。因此从供给和需求两个方面来
图像的超分辨率技术是计算机视觉领域的热门研究课题,其优点在于成本低,重建效果好,现在已经被广泛应用到医学图像、天文图像、监控图像等领域。近几年,深层卷积神经网络在图