基于粒计算的信息系统知识发现研究

来源 :太原理工大学 | 被引量 : 3次 | 上传用户:Sunmin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息系统是数据的一种重要的表现形式,从信息系统中通过算法搜索隐藏信息的过程是知识发现的主要内容。真值表是一种特殊形式的信息系统,在数字电路的组合逻辑的应用中占有重要的地位。粒计算是近年发展起来的用来解决复杂问题、处理智能信息的一种新的计算方式。粗糙集是粒计算中重要的理论工具,可以对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律。规则提取是粗糙集中知识发现的重要研究内容之一,是一种获得信息系统隐含知识的理论方法。本文从研究粒计算和粗糙集理论出发,研究信息系统的知识发现,重点讨论了现有的规则提取算法及所存在的缺陷,基于粒计算提出了新的信息系统的规则提取算法,并针对真值表提出了新的并行约简算法。具体工作如下:首先,针对信息系统的主要形式——决策表,利用粒计算中粒化的思想,从多粒度角度出发,定义判别向量,在由粗到细的粒度空间下分别对决策表进行分析,根据得出的判别向量的元素值提取出信息系统中的规则;而针对不一致决策表,需要将不一致决策表转换为一致决策表,然后进行规则提取。本文通过定理证明和实例分析说明了新算法的有效性,并用UCI数据集与现有的规则提取算法进行了对比试验,实验结果显示了新算法的有效性和快速性。然后,针对信息系统的特殊形式——真值表,首先分析了传统约简算法所存在的缺陷,并基于粒计算知识定义了判别矩阵,在多粒度空间下,根据得出的判别矩阵的元素值提取每个输出的最简规则,实现了真值表的约简,并通过并行计算加快了算法的效率。本文以发光二极管的真值表为例,阐述了新算法计算的具体过程,并比较了公式法、卡诺图法、Q-M算法等传统的真值表约简算法,通过数据集的测试表明新算法具有准确性和快速性。最后,在本文的基础上设计了一个简易的信息系统知识发现系统,该系统集成了现有的一些决策表规则提取算法,并且针对真值表设计了一个对真值表进行约简的子系统,便于用户操作。本文提出的3种信息系统知识发现算法,克服了现有算法的一些弊端,通过算法得到的决策规则在准确性和简易性方面得到了提升,实现了数据的快速规则提取过程。
其他文献
本文推导出适于电算,精器求解任何距离二类大地主题的嵌套系数法用于正、反算的实用公式。其适用范围为1~2万公里,理论精度可达10-5秒和1毫米以上。在仅有10位有效数字的情况
作为第三代激光技术的代表,光纤激光器以其小巧质轻的结构、低廉的制造成本、较高的可靠性和稳定性等优点在激光医疗、光纤传感、光谱分析、机械加工等多个领域中发挥着至关重
本文在对Turbo码编译码原理进行简单介绍、性能进行理论分析的基础上,着重研究了Turbo码的译码算法与实现技术。针对传统SOVA译码器性能较差、所需存储空间较大、译码延迟较
频率是电力系统运行的一个重要质量指标。它反映了电力系统中有功功率供需平衡的基本状态。本文在对技巧离散傅立叶算法(SDFT)[18]进行了理论分析的基础上,对算法进行了改进:
随着信息与通迅技术的迅猛发展,互联网已进入到Web2.0移动互联"微时代",微课程支撑的翻转课堂成为教育界最热门的话题之一。通过分析翻转课堂现状,构建Moodle环境下"微课"支
随着我国国民经济的快速发展,水利水电事业的发展生机勃勃,水利水电工程建设与管理也有传统的二维技术向三维技术发展,建立在数字化、可视化、可量测基础上的三维地形已越来
建设工程相关职业责任保险是职业责任保险中的重要险种,它为工程勘察、设计、监理、咨询等专业服务机构及其从业人员提供了转移其职业责任风险的重要途径,消除了他们的顾虑,
本文认为初级汉语阅读课的教学目的具有双重性,一方面要重点培养学生的语言知识,另一方面要在前者基础上教授学生基本的阅读技能和阅读方法。初级汉语阅读课的教学内容主要包
AG基因属于MADS-box家族,在决定花分生组织特性和花器官发育中起着重要的作用。为阐明竹类植物AG基因的表达特性,本研究以绿竹开花试管苗花芽为植物材料,采用cDNA末端快速扩
目的 分析青海省手足口病的季节性分布规律,为制定有效的防控策略和措施提供科学依据。方法按月汇总收集2012-2016年中国疾病预防控制信息系统中报告的现住址为青海省的手足