基于关系数据库的属性约简研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:zoulin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今时代伴随着网络的迅速发展,信息传递方式的增加,越来越多的信息能够更迅速的传递到人们面前。海量和多元化的信息在给人们生活带来便利的同时,也给人们带来了灾难——“数据炸弹”。面对铺天盖地蜂拥而至的信息,另人们苦恼和彷徨,不禁期待找到一种方式来简化数据,只保留中心数据供自己使用。在这种情况下,对数据进行挖掘的各种方式就应运而生,并在越来越广阔的领域获得应用和发展。属性约简正是这些挖掘方式中的一种很重要的形式,它是在保持数据分类或决策能力不变的前提下,对数据中的非决策属性进行约简,从而获得人们期望的与原数据具有相同分辨能力但是数量却少得多的精简数据。本文从阐述在信息时代信息约减的作用开始,首先阐述了在信息系统中核属性的重要作用以及利用区分矩阵的方式来求取属性核心的代价、求取正区域的代价等进行了细致的分析,对当前经典的属性约简算法进行了简介,并运用Rough集的理论给出了判定一个属性子集中是否包含属性核心的充要条件。然后,根据这些研究结论,结合当前大容量的数据都是存储在数据库中的基本现实,充分利用了数据库技术在大容量数据存储和查询的优越性,对当前的基于粗糙集的属性约简算法进行了改进,并在此基础上,结合求取核心属性的非必须性和正区域的补的概念,从一个新的途径提出了新的属性约简算法。通过对改进的经典算法和新提出的属性约简算法的实验结果的分析表明,对于较大数据集和大数据集,两种算法解决了目前属性约简算法应对大容量数据的窘境,并且效率远远高于现存的一些基于主存的算法。同时算法逻辑简单,易于实现和推广,对于数据挖掘、人工智能、机器学习等领域具有一定的促进作用。
其他文献
在当今世界,随着信息的急剧增加,国际交流的日趋频繁,机器翻译的潜在需求越来越大。机器翻译方法按照其使用理论不同可以分为基于规则的、基于语料库的和混合翻译方法三种。
随着时代的发展,以计算机技术、通信技术为核心的信息技术被广泛的应用到各个领域中。随着普适计算、通信与家用电器产业的不断融合,使得具有数字化、网络化和智能化的信息家电产品趋于成熟,一套完整的信息家电体系结构逐渐产生,智能家居的概念正在一步步的得到实现。在可预见的将来,信息家电产业将成为全世界的一大消费热点。信息家电的应用将极大的改善人们的居家体验和生活水平,使得家庭生活更加舒适与便利。伴随着信息家电
2001年,OMG(国际对象管理组织)提出了MDA(模型驱动构架)。MDA的关键之处就是软件开发过程是由对软件系统的建模行为驱动的。MDA的目标是把业务和应用逻辑与底层的平台技术分
随着医疗水平不断提高,对医疗器械的需求逐年增加,有必要对医疗器械的质量和安全进行追踪。建立医疗器械的可追踪性,不仅可以减少医疗事故,抑制假冒或不合格医疗器械的传播,
视频人数统计方法是能够准确地统计通道口出入人数、提供人群流动方向等信息的方法。随着社会的不断发展,其在车站、道路和超市等场所有着广泛的应用需求。本文主要研究了垂
数据挖掘中的关联规则挖掘是一个非常重要的研究课题,广泛的应用于各行各业,既能够验证行业内认可的规律模式,还可以发现隐藏在海量数据背后的规律模式,为各行业用户的决策提
现如今互联网上的学术论文、期刊文献、专利数据库、网络媒体、社交平台(微信、微博、博客、论坛)等载体上蕴藏着多个领域的潜藏知识,文中将这些载体涉及的专业领域称之为“
逆半调技术将半色调图像恢复成连续的灰度图像,是半色调技术的相反过程,其广泛应用于图像的锐化、大小调整、校色、压缩等图像处理。现有的逆半调技术分为通用逆半调和专用逆
Agent技术,尤其是多Agent技术在基于网络的分布式计算环境中,发挥着日益重要的作用。Agent之间的通信和协商是多Agent系统研究的核心问题。通信是协商的基础,通信为Agent之间的
在语义信息集成和知识发现的研究中,自动问答系统是研究的关键所在,被誉为下一代的搜索引擎。在自动问答系统中,用户使用日常生活中的句子提问,系统通过对问题分析和答案检索