基于MapReduce的序列模式挖掘算法

来源 :计算机应用研究 | 被引量 : 2次 | 上传用户:zgymm2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统GSP算法需要多次扫描数据库、I/O开销巨大的缺点,提出了一种基于MapReduce编程框架的序列模式挖掘算法MR-GSP(GSP algorithm based on MapReduce)。MR-GSP算法将原序列数据库划分为多个子序列数据库并分发到多个Map节点,Map函数扫描存放在Map节点内存中的子序列数据库,产生局部序列模式,Reduce函数对所有局部序列模式合并,扫描原序列数据库,计算局部序列模式的支持度,得到最终的序列模式。相比于传统GSP算法,MR-GSP算法只需扫描两次原始
其他文献
网络扩容策略是近年来复杂网络的研究热点,目前针对网络删边扩容研究已经颇为成熟,但加边扩容的研究还较为匮乏。根据网络容量与网络节点介数的最大值成反比的结论,提出了一种复杂网络加边扩容的策略,并与最低度添加边和最长最短路径添加边策略进行分析比较。实验表明:在添加边数目相同的条件下,提出的添加边策略不仅能有效减少网络平均最短路径,还可以最大化提高网络的容量。
针对以往文献中高斯变异差分进化算法变异方式的导向性过于单一,不利于算法种群结构多样性保持,种群进化信息吸取过于单调的弱点,设计了一种差异化高斯双导向差分进化算法。采用向量图分析方法设计了一种新的高斯双导向变异方式,该变异方式能够兼顾全局进化、局部进化及个体进化信息,以当前全局最优值和个体历史最优值作为个体进化的两个不同导向,从而使变异后的个体能够吸收更多的种群进化有利信息并加以利用,并且根据种群个
机会网络是一种新型的网络,具有频繁的网络断开、高误码率、随机的拓扑变化等特点,该网络中的消息传播是依靠节点间的合作来完成存储—携带—转发的模式。由于能量、缓存以及处理能力的限制,一些节点表现出自私(拒绝帮助其他节点转发消息),甚至恶意(高报价)的特性,所以会给网络性能带来巨大的损失(低交付率、长延迟等)。为了解决上面的问题,现存的基于虚拟货币的激励机制,如Credit,它依靠一个固定的中心来管理源
由于没有具体的运行环境,面向嵌入式软件的逆向解析缺少有效的动态信息提取方法。针对这种情况,基于硬件平台和系统平台的透明化处理,设计了基于QEMU中间代码扩展的插桩,定义了基于中间代码层的多粒度插桩接口及回调函数,实现了平台无关的多粒度抽象状态提取和系统无关的内存数据读取,并通过系统语义自省机制实现了系统语义视图的提取。测试结果表明,基本块级和函数级提取信息的速度比语句级快10~20倍,占用的空间少
在布尔函数的设计中,总是希望得到满足多个密码特性的密码函数,但是这些密码特性之间存在着一定的制约关系。利用爬山算法对一阶相关免疫函数进行了优化,得到了大量高非线性度的布尔函数并通过MATLAB实验对八元、九元一阶相关免疫函数进行了优化。实验结果表明,该算法可进一步优化相关免疫函数的非线性度。