【摘 要】
:
自信息的概念由香农提出,用来刻画信号输出的不确定性。将自信息应用于决策系统中可以用来刻画决策的不确定性,是决策能力评估的有效手段。本文基于邻域粗糙集模型和模糊粗糙集模型讨论了自信息测度理论。基于自信息测度,我们研究了两种模型的特征选择方法。1.基于邻域粗糙集模型的特征选择是数据挖掘的重要研究内容。在邻域粗糙集中,正域通常被用来反映特征子集的分类能力。然而,正域并不是分类精度的一个有效估计,因为它只
论文部分内容阅读
自信息的概念由香农提出,用来刻画信号输出的不确定性。将自信息应用于决策系统中可以用来刻画决策的不确定性,是决策能力评估的有效手段。本文基于邻域粗糙集模型和模糊粗糙集模型讨论了自信息测度理论。基于自信息测度,我们研究了两种模型的特征选择方法。1.基于邻域粗糙集模型的特征选择是数据挖掘的重要研究内容。在邻域粗糙集中,正域通常被用来反映特征子集的分类能力。然而,正域并不是分类精度的一个有效估计,因为它只考虑了包含一致性的决策邻域下近似信息而忽略了决策的边界邻域上近似信息。根据贝叶斯分类规则可知,边界样本也包含一定的分类信息。基于此,通过引入决策自信息测度的概念,利用邻域粗糙集理论中的上下近似概念构造了决策变量的四种自信息不确定性测度,并详细讨论了其相关性质。通过理论分析和实例比较,发现第四种决策邻域自信息测度—相对决策邻域自信息优于其它三种自信息测度。因为相对决策邻域自信息不仅考虑了决策的上近似和下近似分类信息,而且相对特征的变化具有更大的灵敏度,能够反应出由于特征组合细微变化引起的决策邻域自信息的量的变化。基于第四种邻域自信息测度模型,构造了反映分类能力的特征评价函数—依赖度函数,并设计特征选择算法。通过数值实验,对该算法和一些现有的算法进行了分析和比较。2.基于模糊自信息测度的特征选择方法。模糊粗糙集是处理分类不确定性的最有效方法之一。但是,经典粗糙集模型仅考虑由决策下近似提供的分类信息。实际上,决策的不确定性信息不仅与决策下近似有关,也与上近似有关。基于此,结合自信息的概念,运用模糊决策的上下近似,构建了四种不确定性度量。这些不确定性度量能够用于评估属性子集的分类能力。另外,详细讨论了这些测度之间的关系,从理论上分析并指出第四种度量更加有利于特征选择,因为它不仅考虑了决策的模糊上近似和模糊下近似分类信息,同时对特征的变化更加敏感。证明了这四种自信息测度都是模糊粗糙集的经典方法的推广。最后,基于第四种测度设计了一种贪婪的特征选择算法。通过实验结果与其他三种算法进行比较,验证了所提方法的有效性。
其他文献
青海省鄂拉山口银铅锌矿床位于青海省兴海县境内,大地构造位置地处颚拉山造山带南部,位于NNW向温泉-瓦洪山断裂构造带的东南端,在平面上处于EW向构造带、NNW构造带和NE向构造
切换系统作为重要的混杂系统,其在电力系统、交通控制、工程控制等方面都有着广泛的应用。随着科学技术的飞速发展,学者们对切换系统开展了更加深入的研究,同时也取得了丰硕的成果。然而在已有的切换系统的问题探讨中,都假设子系统的切换时刻与控制器的切换时刻相同,但是在实际中,系统是需要时间识别子系统以及选择相应控制器的,这导致控制器的切换产生了延迟,从而使子系统的切换与控制器的切换在某个阶段是不匹配的。本文旨
无线体域网(WBAN,Wireless Body Area Networks)是一种由分布在人体周围的传感器节点组成的小型智能网络。传感器采集人体的一些重要的数据信息,并将其传送到控制中心,实现对人体身体状况的诊断和监控,并被广泛应用于医疗、军事、娱乐、消费电子、智能家居和公共服务等领域,与人们的日常生活中息息相关,越来越受到人们的关注。随着中国人口老龄化现象加重,人民对健康的重视也日渐加深,社会
通化盆地属于吉林省东部盆地群,其盆地主要形成时期是下白垩统,而盆地性质属于断陷盆地。通化盆地的西北部分与柳河盆地接壤,而东南部邻近集安盆地。本文在基于前人研究成果
随着科学技术的不断进步,信息技术的发展已经超出了人们的想象,人类频繁的网络活动导致网络系统产生的数据量迅速地增加。面对海量的存储数据,传统的集中式网络存储已经难以满足日益增长的大规模存储空间的需求,而分布式存储系统因其海量的存储能力、高扩展性以及低成本的优势被广泛使用和开发。但是,分布式存储系统的存储节点存在可用性不高的问题,随着分布式存储系统的发展和普遍应用,这种隐患带来的数据可靠性问题就越来越
水平剪切波(Shear Horizontal Wave,简称SH波)作为横波偏振的一种,在横波及多波地震勘探中经常出现,和P波、SV波比较,SH波在平行于偏振方向的表面上反射时不会转化成其他类型
在量子计算和信息处理的研究中,诸如量子计量学中精确解的确定、物理系统计算极限的确定以及量子最优控制算法的发展等问题,量子初态以多快的速度演化到其目标态是至关重要的。为了描述量子态的最大演化速度,通常用量子速度极限时间来表征。所谓的量子速度极限时间就是量子初态演化到目标态所用的最小时间。量子系统演化得越快,量子信息处理得越快,反之越慢。近年来,如何实现量子态的演化加速问题越来越受到人们的青睐,并对其
自旋-轨道耦合(SOC)描述量子自旋与轨道运动之间的相互作用,对于许多凝聚物理现象至关重要。近年来,研究者通过外部激光场在冷原子系统中实现了SOC及其调控,特别是囚禁在光学晶格中的具有SOC的两分量玻色-爱因斯坦凝聚系统也已被广泛研究。在平均场理论中,作为一个多体系统,遵循Gross-Pitaevskii方程(GPE)的玻色-爱因斯坦凝聚体(BEC)为研究相应的物理性质提供了重要的基础。GPE的精
随着科技的迅速发展,控制系统变得日益复杂,现如今的控制系统已由简单的,易于描述的,计算成本低的线性系统变成了复杂的,高成本的非线性系统,给系统的分析带来了很大的困难。而Takagi-Sugeno(T-S)模糊模型就可以很好地处理非线性系统。T-S模型以IF-THEN规则形式将非线性系统表示成一系列局部线性子系统的线性组合,通过隶属度函数将线性子系统连接起来,从而借用线性系统理论对模糊系统进行分析与
随着经济水平的不断提高,航空作为城市间交通的重要方式得到了空前发展。庞大的航空网络影响着资源配置、疫情预测、交通优化等诸多方面,其中,与人们的生命健康息息相关的疾病传播问题尤为突出。现有研究是以通航城市为节点、以航班为连接(边),构造静态航空复杂网络,研究疾病在静态航空网络上的传播特性。然而,航空系统中航班的有无,对应于机场间相互影响的有无,使得静态网络模型无法准确反映疾病在航空网络上的传播过程。