【摘 要】
:
随着社会的发展,科技的进步,数据挖掘、机器学习等新型技术已经融入人们的日常生活,使生活更加便利。但随着数据量的增大,数据类型更加复杂,使得这些技术受到一定的限制。因此,如何从数据中去除冗余信息,保证数据的精简,为后续研究人员在使用这些数据进行分析提供便利显得格外重要。粗糙集理论(Rough Set Theory,RST)作为一种数据挖掘技术,最大的特点在于无需任何先验信息就可以处理不精确、不完整、
论文部分内容阅读
随着社会的发展,科技的进步,数据挖掘、机器学习等新型技术已经融入人们的日常生活,使生活更加便利。但随着数据量的增大,数据类型更加复杂,使得这些技术受到一定的限制。因此,如何从数据中去除冗余信息,保证数据的精简,为后续研究人员在使用这些数据进行分析提供便利显得格外重要。粗糙集理论(Rough Set Theory,RST)作为一种数据挖掘技术,最大的特点在于无需任何先验信息就可以处理不精确、不完整、不确定数据。属性约简(Attribute Reducation,AR)是粗糙集理论重点研究内容之一,同时也是数据挖掘预处理步骤之一。可以在保证分类能力同时去除数据中不重要的属性。从所有约简中选择最小基数的约简也被称为最小属性约简(MAR)。如何获得最小属性约简一直是人们研究的重点,但求解最小属性约简已经被证明是NP-难的非线性组合优化问题。本文针对传统属性约简算法求解最小属性约简困难。智能优化算法可以很好的弥补传统属性约简算法的不足。因此,通过结合智能优化算法中的社会蜘蛛优化算法来求解最小属性约简。但在实际求解过程中,求得结果往往为包含冗余属性并且求解时间长。为此,提出多种改进策略进行改进,设计出两种算法。一种侧重较高求解质量的多策略改进社会蜘蛛优化属性约简算法(MISSOAR),另一种侧重较短运行时间的快速社会蜘蛛优化算法(QSSOAR)。本文的研究工作如下:针对社会蜘蛛优化在求解最小属性约简求解质量低的问题。首先,在种群初始阶段引入一种基于对立的初始化策略,改善初始种群中个体的表现。其次,将种群动态划分为精英群体和普通群体,设计一种改进雌性蜘蛛位置更新算子。接着,为了避免交配与替换操作失效问题,引入交叉变异策略进行弥补。最后,提出一种基于属性重要度的冗余检测机制,通过判断最优结果中属性的重要度,去除不重要属性使约简集合更加精简。实验结果表明,求得约简结果质量高。考虑到社会蜘蛛优化在求解最小属性约简耗时长的问题。首先,以一种相似度约束策略来约束初始种群,相比基于对立的初始化策略,模二加运算计算量更少。在迭代过程中设计一种自适应对立学习加快收敛速度,相比传统对立学习计算量更小。深入分析社会蜘蛛优化乃至其它智能优化算法在求解最小属性约简过程中产生庞大计算量的来源,考虑到最大计算开销来自于个体评估阶段,设计了一种快速提取策略,通过将数组与键值对进行结合,只需要简单比较就可以获得对应的值。通过实验验证算法求解质量高,运行时间短。
其他文献
司法领域的中文命名实体识别是对法律文书中的各类实体进行准确地识别,是人工智能领域后续应用的基础工作。由于司法标注语料资源的严重匮乏以及中文文本独特的行文特点限制,国内对于此方面的研究相对较少。本文对法律文书的行文特点进行分析,并结合深度学习对司法领域的中文命名实体识别任务展开研究。主要完成工作如下:(1)针对司法领域公开标注语料缺失的问题,人工构建司法标注语料。首先从中国裁判文书网和“法研杯”挑战
随着环保意识的深入人心,人们在注重生活品质的同时会关注到更多的环保议题。对于作为交通运输工具的车辆而言,人们对其除了性能方面的需求,也提出了更多环保方面的要求。其中,汽车扬尘已是一个不可避免的议题。有研究表明,机动车所引起的扬尘污染可以占到城区颗粒物总污染数量的百分之三十以上。作为承载主要运输工作的重型商用车,其行驶的路面情况更为复杂,在其作业区或者行驶活跃地带,所造成的扬尘颗粒物污染更加严重。当
电磁感应透明(Electromagnetically induced transparency,EIT)是一种三能级原子系统中的干涉效应,由于激发原子在不同跃迁途径产生量子干涉相消,导致光在共振频率处吸收减小甚至变成透明的现象。由于量子系统中的苛刻实验条件,基于量子系统的EIT现象难以实现。自然材料由于自身原子种类和结构的限制,对太赫兹波的调控能力十分有限,一些人工设计的结构并具备超常物理性质的超
GaN器件为高电子迁移率晶体管(HEMT)器件,它有AlGaN和GaN基器件,以其优异的电子迁移率、禁带宽度、高频、高温、大功率等特性,备受关注,在航空航天、计算机信号处理、雷达、电子通信等领域广泛应用。然而GaN器件的功率密度较大,发热源的温度较高,长期的高温会对器件的性能及可靠性造成影响。因此,对GaN器件的工作时的温升、热阻进行精确、快速检测分析成为科研和工业领域亟需解决的问题。随着GaN器
有机电致发光器件(OLED)和量子点电致发光器件(QLED)作为新型固态照明和平面显示技术,因具有低成本、自发光、色纯度高、制作简便、低功耗和可柔性等优点而备受关注,在照明和显示领域有着广泛的应用前景。然而常用作阳极的氧化铟锡(ITO)的功函数与有机功能层的HOMO能级之间存在较高的势垒,严重影响了空穴的注入。同时各功能层不同程度的老化也不利于器件寿命的提升。在当前低成本、大面积和精确可控量产等新
有机电致发光器件(OLED)由于其具有可弯曲折叠、节能环保、低功耗、低压驱动、自主发光等优势,在全彩显示照明领域具有极高的应用价值,被认为是21世纪的“显示之星”。其中具有短波发射的紫外(UV)OLED广泛应用于激发光源、高密度信息存储和生化传感等领域,同时极大的拓宽了光电器件的应用范围。然而,目前UV OLED技术还存在着许多问题亟待解决。如氧化铟锡(ITO,表面功函数为4.7e V)透明电极作
抗菌材料是一种帮助人们抵御疾病免受有害微生物侵害的功能性材料,但传统的抗菌材料抗菌成分单一,受环境因素影响较大,抗菌效果不理想。而复合抗菌材料因其具有化学稳定性,杀菌广谱性以及抗菌长效性等优势,是目前研究最为广泛的一类抗菌材料,现今已被广泛应用于食品安全、烧伤药物敷料、安全护肤品、仿生医疗、污水处理以及农牧业等领域。因此,本论文通过简便的合成方法,制备了多孔材料负载银基的复合抗菌材料,分析了其材料
随着国民经济的持续增长,我国城镇化进程迅速推进,居民的出行交通工具也呈现多样化。电动自行车因经济、节能、便捷的优点,逐渐成为我国居民出行重要的交通工具。电动自行车的发展有效弥补了我国短程出行的短板,但由于骑行者交通安全意识淡薄,缺乏专业的技能培训,诱发了系列安全问题,给城市交通管理和安全保障工作带来巨大压力。因此,需深入探究电动自行车风险骑行行为形成机理,从而制定针对性的改善对策。论文首先对影响风
日益严重的能源短缺和环境恶化促进了科研工作者对新能源的研究和利用。在当前能源危机的形势下,光伏技术和产业得到了迅速发展。到目前为止,传统的单p-n结太阳能电池由于其技术成熟和相对较高的功率转换效率(PCE),已经在太阳能电池行业占据了几十年的主导地位。然而,由于最大光电压受到带隙的限制,它们的PCE低于Shockley-Queisser极限(33.7%)。因此,新型光伏材料的开发备受关注。幸运的是
图像中的目标检测和自然语言描述依然是图像处理中热点研究课题。目前通用的目标检测方法对形变目标检测能力有所欠缺,小尺度目标检测精度稍差,图像目标检测结果摘要生成难度较大。此外,可视化图表本身也是一种人工合成图像,可视化图表摘要的自动生成也日益获得重视。因此,本文研究通过在Faster R-CNN中集成了Res Ne Xt网络、GN+WS算法、可变形卷积算法来提升自然图像目标检测精度,并应用图像的自然