【摘 要】
:
基于模糊相似关系的决策粗糙集是经典决策粗糙集的延伸与拓展,为当今的研究热点之一。在实际处理数据时,同一对象的同一属性可能具有不同层次,并且在不同层次上取得不同值。为此,该文针对多尺度决策系统,提出多尺度决策系统中基于模糊相似关系的决策粗糙集模型,给出相应的最优尺度选择及约简方法,并讨论了获得一个最优尺度约简的简便算法。利用5组UCI标准数据集对该文所提出的模型与算法进行实例验证,证明其有效性。该文提出的模型进一步拓展了基于模糊相似关系的决策粗糙集在多尺度决策系统下的应用。
【基金项目】
:
江苏省高校自然科学研究项目(20KJA520006),江苏省研究生科研与实践创新计划项目(KYCX20_1681)。
论文部分内容阅读
基于模糊相似关系的决策粗糙集是经典决策粗糙集的延伸与拓展,为当今的研究热点之一。在实际处理数据时,同一对象的同一属性可能具有不同层次,并且在不同层次上取得不同值。为此,该文针对多尺度决策系统,提出多尺度决策系统中基于模糊相似关系的决策粗糙集模型,给出相应的最优尺度选择及约简方法,并讨论了获得一个最优尺度约简的简便算法。利用5组UCI标准数据集对该文所提出的模型与算法进行实例验证,证明其有效性。该文提出的模型进一步拓展了基于模糊相似关系的决策粗糙集在多尺度决策系统下的应用。
其他文献
《电机学》课程实施方案紧紧围绕以学生为主体的方针制定,将过程考核贯穿整个授课过程.在教学中,针对不同知识点,采用多种教学模式,研讨和课堂参与大比例考核,提升学生学习兴
药品生产质量管理规范(GOOD MANUFACTURING PRACTICES,简称GMP)要求制药、食品等企业要有先进生产设备、科学生产过程和严格的检测系统以及完善的质量管理体系,以确保最终的
密度峰值聚类算法(Density peaks clustering,DPC)是一种基于密度的新型聚类算法。该算法的优点十分显著:所需参数较少,没有迭代过程,能自适应获得聚类数目并识别任意形状的簇类。该算法也有一些问题亟待解决:(1)在决策图上人工选择聚类中心,产生聚类误差;(2)在密度不同的流形数据集上聚类效果不佳。针对这些不足,该文提出一种基于电子分层模型和凝聚策略的密度峰值聚类算法(Density peaks clustering based on electronic shells model an
前向贪心搜索策略在约简求解的过程中,需要遍历所有的候选属性,从而确保在每轮迭代时能够选择出最优的属性。在属性数量急剧增加时,利用前向贪心搜索进行约简求解会显式地带来较大的时间消耗。鉴于此,在前向贪心搜索的基础上,依据属性约简过程和粒度的变化关系,提出了基于粒度的加速求解约简策略。该策略的核心思想是以粒度大小为标准,剔除对应着较粗粒化结果的属性,从而压缩候选属性的搜索空间,达到提升约简求解效率的目的。在12组UCI数据集上,采用3种不确定性度量,实验结果表明,相较于前向贪心搜索,基于粒度的加速求解约简策略不
传统邻域粗糙集需指定半径或通过搜索方式找出适用于问题求解的半径,这在数据预处理过程中会带来极大的时间消耗。而粒球粗糙集方法则能够依据数据分布,自适应地生成合适的粒结构。以粒球的纯度为度量准则,粒球粗糙集方法亦为属性约简问题的研究引入新的思路。利用前向贪心搜索求解约简时,需尝试计算每一个候选属性被加入约简池后所引起的粒球纯度的变化,这为算法的执行效率带来了严峻挑战。为解决这一问题,在前向贪心搜索进程中提出了属性划分策略,其本质是将所有属性划分成不同的组,从而能够压缩候选属性的搜索空间,以达到快速求解约简的目
传统邻域分类器因良好的分类性能在分类问题中得到广泛应用。但数据规模和维度的不断增加,提高了邻域分类器的处理难度。为解决这一问题,该文基于Spark实现邻域决策错误率并行属性约简算法,删除数据中的冗余属性,减少数据间的不确定性。该算法能减少分类过程中数据计算时间,提高分类计算效率。邻域分类器在分类决策过程中采用的多数投票机制没有考虑到邻域样本的空间差异性与标签不确定性,易导致错误分类。该文在Spark框架下将D-S证据理论引入邻域分类器,并行融合整个邻域空间的证据支持信息,提出基于Spark的邻域证据并行分
特征选择技术是数据降维的一种关键技术,由于采集到的数据样本标签信息缺失,无监督特征选择受到了更多人的关注。现有的无监督特征选择算法普适性及稳定性很低,受数据集结构的影响很大,因此很多研究者一直热衷于提高算法的稳定性。该文尝试从数据集的预处理出发,采用区间的方式来对数据集进行近似,得到与数据集相关联的几个数据集,通过实验验证新的区间数据集的优劣性,并思考从全局的角度对数据集进行处理,进一步提出了一种新的模型——基于邻域区间扰动融合的无监督特征选择算法框架(Unsupervised feature selec
针对目前的广告点击率预估模型未能充分学习低阶特征且忽略了不同高阶特征对模型准确率的影响不同的问题,提出了一种基于注意力机制和深度学习的点击率预估模型。该模型采用改进因子分解机(Factorization machine,FM)算法,将全息简化表示(Holographic reduced representation,HRR)的压缩外积用于FM中,从而更好地学习低阶特征,帮助模型获得更好地表示。采用深度神经网络(Deep neural network,DNN)对高阶特征建模学习。引入注意力神经网络区分不同高
钢轨表面区域提取方法存在需要预先设定轨面宽度的问题,且容易受到光照不均和噪声的干扰,因此,该文提出一种基于HSV色彩空间S分量的轨面区域提取方法。进行自适应加权中值滤波操作,消除杂乱而细小的噪声;将去噪后的RGB轨道图像转化为HSV色彩空间轨道图像,将S空间分量图像单独提取出来,减少光照不均带来的干扰;采用改进的线性函数对S空间分量图像进行增强,提高不同区域的对比度差异;通过绘制灰度投影曲线,搜索
为了更好地预处理未标记数据,大多数基于图正则的无监督特征选择算法通过构造样本的相似性矩阵来删除冗余信息并选择具有代表性的特征子集。这些方法中的大多数图都是用固定数量的近邻数来初始化,忽略了数据分布不均匀的问题。为了解决这个问题,提出了一种基于自适应邻域和自表示正则的无监督特征选择算法(Adaptive neighborhood regularized self-representation,ANRSR)来选择具有代表性和判别性的特征子集。为了保留局部内在结构,该算法将基于自适应邻域的流形正则化运用到自表示