【摘 要】
:
数据挖掘一般是指从海量数据中获取知识的过程,而自动化数据挖掘能够根据应用场景、使用条件自动选择挖掘模型和模型参数,从而达到简化用户挖掘操作的目的。然而数据挖掘中流程复杂、信息重用难度大和共享困难等问题给数据挖掘自动化带来了很大挑战。本文提出了一种自动化数据挖掘工作流框架,在此框架上构建基于SWRL的本体推理实现自动化数据挖掘,其中SWRL用于表示数据挖掘知识及关系从而为数据挖掘本体提供更强的逻辑表
论文部分内容阅读
数据挖掘一般是指从海量数据中获取知识的过程,而自动化数据挖掘能够根据应用场景、使用条件自动选择挖掘模型和模型参数,从而达到简化用户挖掘操作的目的。然而数据挖掘中流程复杂、信息重用难度大和共享困难等问题给数据挖掘自动化带来了很大挑战。本文提出了一种自动化数据挖掘工作流框架,在此框架上构建基于SWRL的本体推理实现自动化数据挖掘,其中SWRL用于表示数据挖掘知识及关系从而为数据挖掘本体提供更强的逻辑表达能力。本文工作如下:首先,通过标准化数据挖掘流程创建通用的数据挖掘工作流框架。在KDD(Knowledge Discovery in Database)过程的基础上,引入工作流思想创建标准化数据挖掘工作流,工作流严谨的逻辑关系能够在规范数据挖掘流程的同时也为自动化提供必要基础。其次,进行SWRL的数据挖掘工作流本体的表示与推理。在上述框架下引入本体,创建本体和规则来进行数据挖掘知识表示,使之能够基于SWRL推理出数据挖掘流程和它的最优模型及参数,从而实现数据挖掘自动化。最后,进行实验验证。在具体交通场景下,基于SWRL推理实现了的数据挖掘流程与模型的自动化构建及参数的自动化选择,得到了较好实验效果从而验证了本方法的有效性。同时补充了基于XML的数据挖掘工作流的实验。实验表明,基于SWRL的方法克服了XML不能显式表示语义的局限,能够获取到隐性的知识从而实现数据挖掘知识间的重用和共享。综上,本文从数据挖掘标准化流程的制定,到数据挖掘工作流框架的提出,最后基于此框架工作流的手动配置并自动执行、自动配置并自动执行,层层递进,一定程度上能够简化数据挖掘流程。同时通过本体和规则的方式实现数据挖掘模型及模型参数的自动化选择,也为数据挖掘自动化的全面实现提供了一个很好的解决思路。
其他文献
蝴蝶鱼科(Chaetodontidae)鱼类属于鲈形目(Perciformes)鲈亚目(Percoidei),是一类生活在热带到温带海洋的小型珊瑚礁鱼类。由于体型优雅别致,体色艳丽,有着五彩缤纷的图案,深
四氢喹啉作为关键的化学结构片段广泛存在于药物和天然产物中。在过去几十年,通过[1,5]-氢迁移/环化反应来合成一系列复杂的化合物,尤其是四氢喹啉类衍生物,已经成为一种高效快捷的方法之一。在[1,5]-氢迁移/环化的串联反应中,底物往往需要同时含有氢受体和氢供体两部分。氢供体通常是杂原子邻位惰性的C(sp3)-H键,活化的烯烃、醛、酮、亚胺作为氢受体是比较常见的,但是炔烃作为氢受体却很少有报道。目前
当前我国越来越多的柔性直流工程与规模庞大的交流电网互联运行。然而,关于含MMC-HVDC的交直流混合输电系统在故障特性分析和保护策略方面的研究并不全面,为了故障保护工作的展开,有必要对交直流混合系统的运行特性和保护策略展开研究。本文在研究模块化多电平换流器(Modular Multilevel Converter,MMC)的拓扑结构和工作原理后,推导出MMC的数学模型,提出采用最近电平逼近调制方式
超大孔晶胶介质连续床作为一种新型的层析用分离介质,因其具有选择性高、分离迅速、传质阻力小、分离工序少等优点,在生物纯化分离方面得到了广泛的应用。同时由于其具备多孔
线粒体是细胞进行呼吸活动、产生能量的重要场所。线粒体基因组(mitochondrial DNA, mtDNA)具有结构简单、进化速度快等特点,其平均进化速度是单拷贝核基因的5-10倍,广泛应用
建筑垃圾是建筑工业发展的副产物,对生态环境造成了严重的破坏。废弃混凝土占建筑垃圾的比重大,其经破碎、筛分得到再生骨料。建筑垃圾资源化利用的重要途径就是以再生骨料为原料制备再生混凝土。但是由于再生骨料存在压碎指标高、吸水率高、表观密度低等特点导致再生混凝土试件力学性能差,所以如何提高再生混凝土的性能成为解决问题的关键。为制备高性能再生混凝土产品,本文分别探索了秸秆纤维、氧化石墨烯等不同材料对再生混泥
陈英士是活跃于清末民初政坛的重要人物,以沪军都督之名蜚声沪上。他在生前饱受争议之苦,死后却安享殊荣,成为国民党推崇备至的革命元勋。民国时期的陈英士叙述由各种势力共
本文对中国园蛛科的新园蛛属Neoscona、艾蛛属Cyclosa和类岬蛛属Pronoides进行了分类研究。全文分为总论和各论两部分。总论部分简明扼要地介绍了上述3属的分类地位、分类系
MMP(matrixins),即基质金属蛋白酶,是一类降解细胞外基质及基底膜的内肽酶,其催化过程需要依赖金属离子Zn2+。根据最新的研究报道,该家族共有28个成员,MMP广泛地参与了人体的
为了开发高效的非均相催化材料以活化过一硫酸盐(PMS)用于高级氧化降解废水有机污染物,本论文制备了前驱体CoCuAl-LDHs并通过煅烧得到了催化剂CoCuAl-LDOs。以有机染料酸性橙7(AO7)为目标污染有机物,研究了催化剂制备条件和降解反应条件对CoCuAl-LDOs/PMS体系降解废水中AO7效率的影响,并且对CoCuAl-LDOs活化PMS的机理以及AO7在CoCuAl-LDOs/PM