基于粒度计算的动态挖掘技术研究

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:MKLIN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术、网络技术和通信技术的迅速发展,传统的动态数据挖掘方法很难适应动态数据库和实时数据库的不断更新,为了采取分而治之的思想来降低动态环境的复杂性,粒度计算方法被应用到动态数据挖掘中,其通过改变信息粒度的大小来隐藏或揭示挖掘对象的细节,从而达到发现不同层次信息的目的。在动态数据挖掘环境下构建基于粒度计算的数据挖掘模型,实现对动态数据的自适应处理具有重要的研究意义。论文针对数据流的频繁模式挖掘问题,从研究滑动窗口的频繁闭项集挖掘入手,探讨了基于粒度计算的数据流频繁模式挖掘技术。首先,构建了复合粒度,为自适应处理动态数据提供粒度计算的理论基础;论文在构建了信息窗口下的对象粒、属性粒和结构粒等复合粒度之后,提出了粒度计算和转换的方法,从而实现不同问题空间的粒度转换。然后,提出了频繁闭项集的生成方法;该方法通过混合进制映射生成模糊频繁闭项集的搜索空间,运用对象粒度计算产生模糊频繁闭项集,运用属性粒度计算发现频繁闭项集。接着,建立了嵌入式粒度计算模型;该模型能够根据不同数据特点自适应的构建不同层次的粒度,通过超级状态粒化成子状态的方法来降低挖掘环境的复杂性,即一方面,运用结构粒与对象粒的转换方法,实现用粒度计算思想来求解不同问题空间的模糊频繁闭项集;另一方面,运用对象粒向属性粒的转换方法求解问题空间的频繁闭项集。最后,论文研究了数据流上滑动窗口内的首次数据读入和数据更新技术,结合建立的嵌入式粒度计算模型,提出了基于嵌入式粒度计算的数据流频繁模式挖掘模型。该模型能够在首次读入数据阶段和数据更新阶段,运用嵌入式粒度计算来实时挖掘频繁闭项集。与典型的挖掘算法相比,实验证明该模型在不同特点的数据集上具有较好的挖掘效率,在动态挖掘过程中内存占用相对稳定,特别是在频繁项集数目较多时,内存占用比其它算法少。为了拓展这个挖掘模型,论文在时间衰减的界标窗口上,运用基于嵌入式粒度计算的数据流频繁模式挖掘模型来发现最大频繁项集。实验证明该模型也具有较好的挖掘效率和空间利用率,从而也体现了它在窗口模型上的挖掘通用性。
其他文献
学生核心素养主要指'学生应具备的,能够适应终身发展和社会发展需要的必备品格和关键能力'。《中国学生发展核心素养》报告对学生核心素养进行了明确的定位和合理的
摘要:目的:为了深化高校实践教育体系改革,加强生产实习基地建设,探索实习轮岗制度的利弊。方法:实习前调研了解学生对实习体系的看法及建议,改革现有实习模式,学生完成实习后,再次调研收集学生对实习改革的收获与建议。结果:调研反映出目前学生实习的相关情况:学校的实习安排与学生意向较为一致,学生参加生产实习主动性高,更期望去外企实习,同时更期望以灵活的轮岗方式参与其中,实习考核内容更加集中而有效。结论:生
目的探讨免辅助切口自制套管器在腹腔镜辅助降结肠癌根治术中的临床应用价值。方法选取2014年1月至2015年6月接受免辅助切口腹腔镜降结肠癌根治术治疗的6例患者进行总结分析,
为了落实"立德树人"的根本任务,构建"三全育人"的高校教学体系,高校"课程思政"教学改革势在必行。文章阐述了"课程思政"与专业课相结合的重要性,并以理工科基础专业课"物理化
文档融合是组织文本及整合信息的关键技术,也是自然语言生成的重要基础。该技术旨在整合跨多个文档的重要信息,生成简洁流畅的摘要,不同于传统意义上的文摘生成任务,该摘要既
炼钢连铸批量计划是钢铁生产计划与调度领域急需解决的重大关键问题之一,科学合理的批量计划方案可以提高生产效率并降低生产成本。目前对炼钢连铸批量计划的模型不够精确,算