基于Rough集的知识发现及其在汉语处理中的应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户：emslwh

【摘要】

：

Rough集理论是处理不确定、不精确和不完备信息的新型数学工具，在知识表示与推理、数据分析、数据挖掘和知识发现等领域得到了广泛的应用。基于Rough集的知识发现过程就是采用

【作者】

：

刘启和

【出处】

：

电子科技大学

【发表日期】

：

2005年01期

【关键词】

：

Rough集理论知识发现知识约简词类标注句法分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Rough集理论是处理不确定、不精确和不完备信息的新型数学工具，在知识表示与推理、数据分析、数据挖掘和知识发现等领域得到了广泛的应用。基于Rough集的知识发现过程就是采用Rough集技术从数据中发现新颖、有用的、非平凡的模式的过程，其应用遍及医疗、金融、工业、语言处理等领域。因此，基于Rough集的知识发现研究，在理论和实际应用上，都有十分重要的价值和意义。 Rough集理论着重研究信息系统，特别是决策表的知识约简问题，以获得更简洁的信息表示，或用于预测未知对象决策属性的有用的规则。本文从知识约简及其算法，应用等方面进行详细研究，并取得如下创新性成果：提出新的条件信息熵及其高效知识约简算法。基于现有条件信息熵的知识约简算法不仅其时间复杂度高，而且得到的核和约简可能并不是代数观点下的核和约简。为了从信息论的角度计算代数观点下的核和约简，分析了现有条件信息熵的不足，给出一个新的条件信息熵，它能够等价表示代数观点下的核和约简。使用新的条件信息熵，给出计算核、计算约简的算法。由于新的条件信息熵能够等价表示代数观点下的核和约简，因此采用这些算法计算的结果一定是代数观点下的核和约简。理论分析与实验结果说明，这些算法不仅是高效的，而且在搜索最小或次优约简方面，优于基于正区域和基于现有条件信息熵的知识约简算法。提出决策表转换算法。一些计算核和约简的高效算法只对一致决策表适用，而对不一致决策表并不适用。针对此问题，给出将不一致决策表转换为一致决策表的算法，并且保持转换前后的核和约简集合不变。证明了该算法的正确性，并分析了该算法时间复杂度及其对知识约简的影响，分析结果表明转换算法不会增加知识约简算法的时间复杂度，而且转换后进行知识约简更有可能获得最小约简。提出基于数据库系统的Rough模型中知识约简算法的扩展策略。基于数据库系统的Rough模型中的高效、可伸缩的知识约简算法只对一致决策表适用。将决策表转换后再使用此模型中的知识约简算法进行知识约简，这种策略可以

其他文献

数据流系统中负载管理技术应用研究

随着计算机和网络技术的不断发展以及相关技术的进步,信息系统在制造、运输、金融、IT等各行各业得到了广泛应用。待处理数据量的飞速增加,使得传统数据管理技术难以适应新形

学位

数据流负载管理负载平衡Load-shedding数据摘要

浅谈如何做好档案工作

本文从加强档案的保密、加强档案的宣传和加强档案工作人员队伍建设三个方面，就如何做好档案工作加以阐述。

期刊

档案保密档案宣传档案人员队伍建设

中药复脉强心汤治疗老年重症心力衰竭的临床体会

<正>近年来,老年重症心力衰竭的发病率呈逐年上升的趋势,成为了老年人死亡的重要原因之一~[1]。西医治疗重症心力衰竭主要使用强心药、血管扩张药物、降压、呼吸支持等,疗效

期刊

老年重症心力衰竭强心汤临床体会温心阳

从“对话李娜”浅析柴静的采访特点

柴静自我介绍时说过,“我叫柴静,火柴的柴,安静的静”。她既可以用理性的思考探究出新闻事件背后的真相,也能够用感性的关怀去关注采访者不为人知的弱点。李娜是中国体育的代

期刊

柴静李娜

首先应该是一个善良、正直、有教养的人

"成才"这个概念,时下的许多人已经明白.从世界范围看,对"才"的评价标准也逐渐统一."才"应该是智力因素与非智力因素的综合评价指标.当今社会,只学好数理化,恐怕走不遍天下.而

期刊

青少年教育品质教育价值观

基于Rough集的知识发现及其在汉语处理中的应用

其他学术论文