仿真数据并行分布式挖掘算法研究

被引量 : 0次 | 上传用户:rkn7621278
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
仿真实验产生了大规模的仿真数据,为了从中提取有用的信息和知识,更好地认识和改进系统,帮助决策人员分析决策,可以用数据挖掘方法来进行仿真数据分析。由于仿真数据具有维度高、规模大的特点,需要采用并行挖掘算法来提高效率。又根据仿真数据分布式存储的特点,避免大规模数据集中所带来的开销以及安全性,需要研究分布式挖掘算法。本文主要的研究工作包括以下内容:根据仿真数据固有特点和分布式存储特点,提出了并行分布式挖掘的需求。根据数据挖掘的基本流程,总结了仿真数据挖掘的一般流程。寻规律和寻优是仿真中的两种重要需求,相应地研究了两种常用的挖掘方法:关联规则和决策树,来挖掘系统中的一些关联规律,以及对仿真系统的优化。对于仿真实验寻规律的需求,将关联规则挖掘方法应用其中。对基本的Apriori算法进行研究改进,采用了向量化的数据结构,减少了输入数据集的存储空间,可以将数据集放入内存,避免对数据库多次扫描带来的I/O开销,提高了算法的效率。用vector容器替代哈希树存储候选项集,减少了算法的空间复杂度。同时为了适应仿真数据大规模的特点,根据CD(Count Distribute)算法的思想对算法进行并行化,并且对算法的拓展性进行了实验设计分析。针对解决仿真实验寻优的需求,采用了决策树挖掘方法。由于仿真数据分布式存储的特点,研究了基于元学习的分布式分类器,以及决策树的两种并行化方法,同步树构建方法和分割树构建方法,实现基于ID3算法的同步树决策树挖掘算法,最后通过仿真测试验证了算法的有效性。
其他文献
《2013-2017年全国干部教育培训规划》指出,干部教育培训是建设高素质干部队伍的先导性、基础性、战略性工程,在推进中国特色社会主义伟大事业和党的建设新的伟大工程中具有不
报纸
随着计算机技术的飞速发展,计算机辅助设计和计算机辅助工程被广泛的运用到实际制造业中,尤其是仿真驱动的产品设计已经成为了一种主流的设计方案。随着仿真技术的广泛应用,
<正>长期的高负债率和债务重组问题压得英利难以前行。2 016年,英利开始寻求债务重组,两年多后的2018年8月,重组事宜有了实质性进展。据媒体报道,近期在英利主要债权人的重组
淫羊藿是药用历史悠久的传统中药,始载于《神农本草经》,味苦、辛,性温,归肝、肾经;具有补肾阳、强筋骨、祛风湿等功效,以淫羊藿为原料,采用常温浸提方法制作保健酒简单快捷工序少成
<正>~~
会议
海洋沉积物作为放射性核素的归宿,在全球不同海区均有沉积物放射性核素的研究报道,然而珊瑚礁区却极少报道.本研究选取南海的岸礁和环礁两种类型的珊瑚礁区,采样站位跨越1500
《互动学汉语》是北京语言大学出版社在2013年出版的一套对外汉语初级综合教材,教学对象为从零起点到学过400个左右词语和简单语法的汉语初学者,目前对该教材的研究并不多。
身为当下中国最“炙手可热”的时尚摄影师,陈漫说:“明星也是人,他们很多时候都在表演别人来娱乐大众,往往失去自我。而在拍摄这些时尚大片时,他(她)们更多在表现内心真实的自己。”
报纸
企业预算管理在企业整体的管理和运营当中都起着重要的作用,随着我国经济的发展,预算管理已经快速地占据了市场竞争的重要位置。但从我国目前的现状来看,大部分企业面临的竞
社会资本的回报机制关系到PPP项目的成败,尤其对于无收费机制的市政道路项目而言,回报机制更是地方政府在决策是否采用PPP模式进行项目建设时应考虑的重要因素。然而,国内市