【摘 要】
:
随着信息技术的快速变革,各行业积累的数据资料呈爆炸式增长,数据内在的不确定性与模糊性也与日俱增,如何高效的从复杂数据中挖掘信息和发现知识成为受到诸如机器学习、数据挖掘、知识发现等多个领域的关注。经典粗糙集模型的属性约简方法以保持条件属性与决策属性的一致性原则为前提,可以实现对数据中冗余属性的约简,压缩了数据规模。然而,面对现实问题中的高维和连续型数据,经典粗糙集往往无法有效的进行属性约简。因此,基
论文部分内容阅读
随着信息技术的快速变革,各行业积累的数据资料呈爆炸式增长,数据内在的不确定性与模糊性也与日俱增,如何高效的从复杂数据中挖掘信息和发现知识成为受到诸如机器学习、数据挖掘、知识发现等多个领域的关注。经典粗糙集模型的属性约简方法以保持条件属性与决策属性的一致性原则为前提,可以实现对数据中冗余属性的约简,压缩了数据规模。然而,面对现实问题中的高维和连续型数据,经典粗糙集往往无法有效的进行属性约简。因此,基于邻域粗糙集模型(Neighborhood rough set,NRS)的属性约简方法逐渐兴起。本课题以邻域粗糙集的属性约简方法为基本出发点,开展相关研究。(1)现有基于邻域粗糙集的属性约简方法过于严格,难以灵活处理邻域类与目标集之间信息,制约其属性约简的效率。针对此,本课题提出一种基于属性重要度的三支近似约简方法。首先,引入代价损失函数分析邻域类与目标决策之间的相似关系,将所有属性划分到正域集合,负域集合和边界域集合;其次,通过收缩边界域构建基于三支近似的邻域粗糙集模型;最后,利用保持正域不变的度量准则获取三支近似约简集合,完成属性约简。实验结果验证了本约简方法的有效性和实用性。(2)现有属性约简中启发式搜索方法存在复杂度高和时间消耗大等问题,本课题通过引入序贯三支决策模型,开展对属性约简方法的加速策略研究,提出一种基于三支近似约简的序贯加速策略。首先,将属性作为划分策略的治略对象,依据属性重要度进行三支治略:发生正划分的属性集合被接受添加到决策属性集,负划分的属性集合被拒绝添加到决策属性集,对延迟决策的属性集合重复以上操作直至约简结果满足约束条件。最后,通过仿真实验在集成和全局两种条件下均能在保证分类精度的前提下,有效的降低时间消耗。
其他文献
随着计算机互联网的不断升级和发展,人们对于软件的需求日益提高,虽然软件在日常生活中能够为人们提供极大的便利,但是软件缺陷问题所产生的巨大代价使人们受到了沉重的打击。软件缺陷预测技术是解决软件缺陷问题的重要手段之一。随着机器学习在软件缺陷预测领域上的应用,在同项目软件缺陷预测取得了较好的成绩。然而与同项目相比跨项目的软件缺陷预测技术更具有实际的意义。在跨项目软件缺陷预测的研究过程中,人们发现直接使用
代码异味(Code Smell),又被称为代码坏味道,是指程序中结构不良的代码段,代码异味的存在给系统带来诸多隐患,不利于系统的维护与演化。随着移动通信技术的迅猛发展,移动应用程序已经成为软件行业的发展主体。而Android应用程序中不仅存在传统的面向对象代码异味,还存在Android特有代码异味。Android特有代码异味的存在对Android应用程序产生了诸多负面影响,比如能耗、安全性、稳定性
我国城市污水处理厂主要以CODCr、SS、氮等为主要去除对象,而最有效的措施就是做好尾水的处理净化工作,从而实现水资源的循环利用。这样既实际缓解了城市水资源短缺的困境,又获取了较佳的综合效益。在污水处理厂实际运行的过程中,最为显著的特征就是每天处理净化尾水的体量较大,且技术要求较高。在这种情况下,若选取原有的膜分离法等进行处理可操作性较低,而人工湿地水处理净化方式作为一类新兴的环保方式,具备经济性
本文在词汇学、方言学、语言描写、比较语言学等理论的指导下,采用田野调查法、文献法、比较分析法、义素分析法等来研究壮语南部方言天等壮语词汇。论文首先对天等壮语的语音作前提描述,然后对天等壮语词汇的类聚、构词、造词以及语义关系进行分析讨论,最后再选取地名、亲属称谓、农具名称、植物名称四个具有传统环境知识意义的词类做个案研究,以此揭示天等壮语词汇在语音、聚类、构词、造词和语义等方面的特点,旨在充实壮语词
明代白话短篇小说因口语性浓厚,语言通俗易懂,词汇量丰富等语言特点,成为探析近代汉语词汇的重要语料。以明代白话短篇小说词汇中的叠音词作为研究对象,整理形成明代白话短篇小说词汇语料库,在此基础上进行叠音词的分词实践和词频统计,总结得出明代白话短篇小说叠音词词种表与词频表,最后依据词表进行构词与构形等角度的描写,通过全样本、穷尽式的研究,完整揭示叠音词这一类语言现象在明代的真实面貌。论文共有六章,可分为
寻找具有高功率密度和能量密度的高效电极材料是当代金属离子电池发展的关键挑战之一。Nb2C MXene表面环境复杂,且实验中Nb2C MXene样品大多为片层结构。故其储能性能的好坏很大程度上由表面端基和纳米片层层厚所调控。本文,通过第一性原理的计算,我们证明了二维Nb2C MXene是一种很有前途的金属离子电池阳极材料。取得的进展分以下几个方面:1首先构建了Nb2C和Nb2CT2(T=O、F、OH
陈彦,陕西籍当代著名小说家之一,其文学作品在中国当代文学领域内占有重要位置。智者形象是陈彦小说作品中一种特殊的人物类型,他们拥有超乎常人的智慧,在社会上拥有一定程度的话语权,具有一定的社会公信力。本文采用文本分析的方法,以陈彦的四部长篇小说《西京故事》《装台》《主角》《喜剧》为对象,整理并分析陈彦小说中所塑造的各类智者形象及其所具有的文化意蕴,并深入探讨陈彦小说中塑造智者形象的价值与意义。本论文的
<正>在课堂教学中,结构化思维表现为教师要遵循文本逻辑,创设相同叙事基调的教学结构,让文本结构与教学结构形成一种具有力量感、节奏感的艺术张力。王崧舟老师在《母鸡》一课的教学中,关注文本的叙事结构,结合作者对母鸡的情感认知,创造相应的具有艺术气息的情境场,让整个课堂呈现出疏密有致、起伏错落的美学效果。
当代文学史对刘恒的定位是“新写实”作家,他的小说创作主要在上世纪八十年代至九十年代完成,以中短篇小说为主,他的作品采用平实的写作手法,还原底层人物最真实的生存境遇,表现人的欲望与现实生活之间的矛盾。刘恒密切地关注着底层人物的现实生存和面临的精神困境,表现他们强烈的生存意识,书写底层人物面临的非理性、困难和死亡等境况。刘恒笔下的底层人物主要分为两类:一类是农民,处在生存边缘的农民在基本生存欲望,如,
近年来,半导体-半导体异质结的应用越来越广泛,特别是在光电转换器件和光催化领域,如太阳能电池、光电探测器、发光二极管和高效光催化剂等。其中在太阳能电池和光催化剂上的应用能够有效改善能源危机与环境污染问题。由于异质结发挥的作用越来越重要,对于异质结的研究越来越深入。因此,设计出高效的异质结就显得尤为重要。本文基于密度泛函理论和格林函数方法,在采用改进的贝克-约翰逊(MBJ)半局域交换关联泛函得到半导