【摘 要】
:
粗糙集(RoughSet,RS)理论是波兰数学家Z.Pawlak在1982年提出的一种分析数据的数学理论,是一种新的处理模糊和不确定性知识的数学工具.它已经成功地应用于诸如机器学习、数据
【机 构】
:
兰州理工大学计算机与通信学院,兰州,730050
论文部分内容阅读
粗糙集(RoughSet,RS)理论是波兰数学家Z.Pawlak在1982年提出的一种分析数据的数学理论,是一种新的处理模糊和不确定性知识的数学工具.它已经成功地应用于诸如机器学习、数据挖掘、智能数据分析以及控制算法等领域.人们对粗糙集的研究主要是在求属性集合的"核"和"约简"的问题上.针对动态变化的数据库JanG.Bazan等人提出了动态约简的思想,针对有序信息表的概念,Yao.Y.Y.等人提出了有序信息表中的约简思想.而对于一般的信息表,人们通常采用分辨矩阵的方法求出决策表的核和约简,这种方法对于数据量比较少的决策表而言是高效可行的,但对于数据量较多的决策表,计算其分辨矩阵所消耗的时间也多,占有的存储空间也大,从而在此系统上进行挖掘所消耗的时间相当惊人,而且得出的结果往往是约简的超集.所以对信息系统的约简求解最小子集成为了粗糙集理论研究中的一个基本问题.在许多情况下,关系数据库系统中的关系可以通过数据预处理很容易地转化为一个决策表,而且其中的决策属性一般也可以根据实际问题来确定.因此本文提出了一个不需要构造分辨矩阵,不用先计算条件属性的核,而是直接从决策表中计算属性的约简得到约简表的算法,它比用构造分辨矩阵的方法所付出的代价要小.本文提出了一个基于粗糙集理论实现分类挖掘的完整计算步骤,并通过一个实例证明了算法的可行性.此外,随着数据的不断更新,属性的动态增长,记录数的增大,计算的时间复杂度会大大增加,这是需要我们深入研究的课题.
其他文献
双十一已经结束,可很多人还意犹未尽.一张马云在银泰门店购物,30秒钟刷掉39元的照片在网络间又被广泛传播.与双十一不同的是,这一次的主角其实不是马云,而是照片边上站在一旁
近年来,数据挖掘技术逐渐成为了计算机应用领域中的最为活跃的研究热点之一.与此同时,随着企业的市场竞争的日趋激烈和业务环境的不断变化,企业数据中的时间信息的管理问题成
关联规则具有多种类型,其中包括数值型关联规则,其基本思想是将数值型属性进行离散化,从而将问题转换为类别型关联规则挖掘问题.但是数值型属性离散化存在着锐利边界值问题,
CE:为什么要从外面找人来接替你在汇源果汁CEO的职位?朱新礼:一开始想内部培养,后来发现内部培养的人对你很忠诚,但也会很依赖你,这个跟我的需求之间还是有差距。汇源发展了20多
Space-time adaptive processing(STAP) has been proven to be one of the best techniques capable of detecting weak moving targets in strong clutter environment and
聚类分析是数据挖掘领域中的一项重要的研究课题,它既可以作为一个单独的工具以发现数据库中数据分布的一些深入的信息,也可以作为其他数据挖掘分析算法的一个预处理步骤.目
网格计算是分布式计算的一个新的阶段,网格需要解决在动态的虚拟组织中控制和协调对资源的共享.第一代网格的主要目的是将一些地理上分布的超级计算中心连接起来,共享这些超
2月17日凌晨,泰康人寿董事长兼CEO陈尔升站到了哈佛商学院的讲堂上,面射全球的MBA精英群体,充满激情地分享。一个来自东方的民族保险企业的成长故事。
本文以RF接口模块的后端物理设计与实现为例,使用0.18um工艺,阐述了在集成电路EDA设计工具的辅助下布局布线的具体实现方法,通过对设计结果的分析,解决了布线拥塞、时序收敛
光头、红衣、白裤,史玉柱以一成不变的装束出现。按照一贯的解读,史玉柱又要营销了。可惜不是,他脸上一直有着别样的兴奋和跃跃欲试。“我要退休!”在场所有人都愣了三五秒。