【摘 要】
:
随着科技的发展和大数据时代的到来,数据量飞速增长,为人类带来丰富的数据资源,但是这些数据中也会存在大量的冗余信息,使得数据的分析与处理面临诸多挑战。为此,研究如何从
论文部分内容阅读
随着科技的发展和大数据时代的到来,数据量飞速增长,为人类带来丰富的数据资源,但是这些数据中也会存在大量的冗余信息,使得数据的分析与处理面临诸多挑战。为此,研究如何从数据中提取有效信息的数据挖掘技术成为一个具有重要研究方向。作为知识获取和数据挖掘的重要工具,粗糙集一直受到广泛的关注。属性约简是粗糙集理论的核心内容之一,它可以在保持信息系统分类能力不变的条件下去除冗余和不相关属性,提高分类精度。多粒度是粒计算领域的重要研究方向,它可以在多个不同的粒度下进行问题求解,得到更加满意、合理的结果。多粒度计算为复杂问题的求解提供一种新的范式。因此,本文从多粒度角度出发对属性约简算法开展研究,主要工作分为以下两个部分:(1)针对符号型数据构成的信息系统,在经典粗糙集背景下,研究基于区分矩阵的多粒度属性约简算法。首先利用属性关于决策的依赖度对属性进行粒化。然后基于区分矩阵定义了属性粒和属性粒中属性的重要度。属性粒的重要度用来衡量粒整体的重要程度,属性粒中属性重要度用来度量粒内属性的重要程度。最后,利用这两种重要度评价指标设计了一种多粒度属性约简算法,并通过实验验证了算法的有效性。(2)针对数值型数据构成的信息系统,在模糊邻域粗糙集背景下,研究基于区分矩阵的多粒度属性约简算法。首先通过斯皮尔曼公式计算属性之间的相关性,接着用谱聚类对属性进行聚类,实现了属性粒化。其次,面向模糊邻域粗糙集分别定义了属性意义下和正域意义下的区分矩阵,并以此为依据,定义了属性粒和属性粒中属性的重要度评价指标。然后,利用这两种评价指标设计了一种属性约简算法。实验结果表明多粒度属性约简算法的有效性。
其他文献
本论文是由长沙市科技项目资助下展开研究的,自2009年以来,我国成为世界上最大的汽车生产大国,而作为我国汽车发动机的关键零部件之一的凸轮轴磨削加工装备,一直制约着我国汽
无机发光材料因其发光效率高、稳定性好等优越的性能而被大量研究,其中稀土发光材料颜色多样、转化率高、性质稳定,在照明显示用白光LEDs和光学测温领域被广泛应用。发光材料
企业现金持有是企业财务管理的核心问题之一,为了在满足企业需求的同时保证现金持有水平,需要考虑复杂繁多的因素。本文考虑了投资者情绪和有限套利对企业现金持有影响,并以
模数转换器(ADC)作为连接模拟世界与数字世界的桥梁,一直以来都是数模混合集成电路的研究热点。其中逐次逼近型结构的模数转换器(SAR ADC)具有电路模块重复利用率高,所需模拟
中国的现代化发展,使得社会形态快速转型;传统社会彰显的是以“血缘”为纽带的家族群体;随着现代化社会的演进,社会群体的类型也在逐步丰富。其中就有以各种“兴趣爱好”为纽
背景:网球运动员有氧能力水平的高低将直接影响其专项运动表现,在多种有氧能力测试中实验室递增负荷跑台测试(TT)为金标准测试,专项递增负荷击球测试(ST)的生理负荷形式最具专项
近年来随着全球变暖的加剧,高寒地区每年正负温交替次数增多,岩体的冻融环境也在逐渐发生变化。在此情况下,研究不同冻融条件下岩体的物理力学性能显得尤为重要。本文以红砂
本论文研究1μm波段增强的超连续谱光源,它结合了脉冲激光器的大能量和超连续谱的宽谱优势,在激光加工及成像领域有潜在的应用前景。对1μm吸收较弱的材料,在激光加工时,利用
在同步辐射光源中,光束线性能稳定是提高线站运行效率、确保实验数据正确有效的基本前提。然而每年寒暑假维护后重新开机、机器运行中插入件调节、周围环境温度波动、地面振
人体尺寸在虚拟试衣系统、人体工程学、服装学等领域有着广泛的应用场景,同时也是衡量一个国家生产能力的基本技术依据。而服装作为与人体接触最紧密物品,人体尺寸数据显得更