基于FCA的概念学习研究

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户:michael047
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,人们获取数据的方式不再单一,如电视、报纸、互联网等,获取数据的周期也在不断减小。面对海量的结构化、非结构化、半结构化的数据,如何快速有效的从中挖掘出潜在的价值是当前的研究热点,同时也是机器学习面临的挑战和机遇。粗糙集理论是Pawlak于1982年提出,并广泛应用于数据挖掘、机器学习、决策分析等领域。形式概念分析(FCA)是由R.Wille于1982年提出的一种知识发现的数学工具,它被广泛应用于数据挖掘,聚类,分类等领域。粗糙集主要应用于不确定性的知识表达,FCA主要是挖掘同类事物与事物所具有的属性之间的内在关系,粗糙集和FCA结合可以挖掘事物与其所具有的属性之间的不确定性关系。在多途径获取信息的时代,从单一的信息源获取的信息往往是模糊或不完备的,因此将多个信息源获取的信息融合起来就显得非常有必要了,融合的目的是将多个信源的信息融合为一个信息量更大的信息体,使得融合有“1+1>2”的效果。本文正是基于FCA的主要特征概念学习和多源模糊概念学习,研究了主要特征和信息融合的数学性质,同时设计了融合算法和模糊概念学习算法,并通过数值实验验证本文所提方法的有效性,本文的主要创新点如下:1.在形式背景中定义a主要特征,并用数学语言阐述了必然特征与似然特征的差别,研究形式背景中基础比率对认知的影响,结合基础比率和a主要特征定义特征与概念之间的可信度,研究了可信度是如何表达拥有某一属性(特征)的对象在属于概念的可信程度,并讨论了可信度与主要特征之间的关系。最后通过案例的计算过程来展示可信度在度量对象的归属问题上比单一的主要特征好,并验证了模型的有效性和可行性。2.条件熵是信息的一种度量方式,基于条件熵的信息融合可以在减少冗余信息的同时提高分类的质量,使得相似类更细,即同一类别的对象之间的差别较小,不同类别之间的差别较大。在融合的基础之上进行模糊概念学习,并根据提出的条件熵融合方法设计了对应的条件熵融合算法,在此基础上设计了基于对象信息和属性信息的两种模糊概念学习算法,然后使用UCI数据集设计了一系列的数值实验,将本所提出的条件熵融合与传统的均值融合进行对比,验证条件熵融合在减少冗余信息的同时提高了分类的质量,而均值融合仅仅是运用统计方法将多源的信息进行均值压缩,不能提高分类的质量。
其他文献
DNA计算是近年来迅速发展起来的新型计算技术,以前我们只是单纯的把现实模型转换为数学模型来求解,但是现在DNA计算给我们的疑难数学问题又提供了一个便捷的解决方式,它把抽
在生物学和人口统计学中,建立基于年龄结构的种群模型是进行数学建模及控制的一种传统方法.深入研究生物种群的演变规律,对保护生物多样性、管理可再生资源、控制病虫害及预防
近年来,由于其明显的物理背景,人们对反应扩散方程进行了大量的研究。众所周知,自然界大量的渗流、相变理论、生物化学以及生物群体动力学数学模型都来自于反应扩散方程。在
这篇论文由五章组成.  第一章,我们简单介绍了相关的背景和一些预备知识.  第二章,首先,利用Morse指标建立线性椭圆方程指标理论.利用指标研究带有共振的渐近线性椭圆方程解
设G是简单无向图,V(G),E(G),n(G)和m(G)分别是G的顶点集,边集,顶点数和边数.A(G)=(aij)nxn是图G的邻接矩阵,当i和j相邻时aij=1,当i和j不相邻时aij=0.图G的邻接矩阵A(G)对应的特
随着科学技术的迅猛发展,在科学领域、经济领域及社会生活的方方面面都出现海量数据,这些数据具有信息量巨大、类型繁多、价值密度低、处理速度快等特点。如何快速、高效地从
线性混合微分代数系统(简称线性混合系统)有着很广泛的实际应用,能观性是线性系统的主要性质之一.由于线性系统状态变量导函数的系数矩阵(方阵)分为两种情况:可逆矩阵和奇异矩阵,线
高精度实时的两相/多相流参数检测一直是工业和科研领域的研究重点。在两相/多相流技术检测中,电阻层析成像(ERT)技术可以完成其内部参数可视化测量。  本文针对单电极激励
随着科技的进步、生活水平的提高,汽车已成为千家万户不可或缺的交通工具。然而这种情况改善了人们的生活质量同时也带来了越来越严重的城市交通拥堵问题。为了解决交通拥堵,各国开启了对优化交通情况的智能交通系统的研究工作。本文提出了基于数字信息素的智能交通系统,旨在将蚁群算法中蚁群觅食的信息素原理运用到城市交通中。将车辆作为智能体,车辆行驶时在道路上留下数字信息素。数字信息素与蚁群信息素类似,具有蒸发、聚集
学位