基于迭代式MapReduce并行虚拟筛选的研究

来源 :佳木斯大学学报:自然科学版 | 被引量 : 0次 | 上传用户:billcde
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于传统的SVM的应用最常用的是MPI(Message Passing Interface)技术,但是MPI对大数据集显得繁杂、不实用,并且基于并行向量机(Support Vector Machine)的虚拟筛选不仅要面对巨大数据集,还要进行O(n2).这样复杂庞大的计算.针对以上问题,在集群方面采用MapReduce对超大数据集进行数据分析.本文采用Spark一种迭代式MapReduce编程模型,提出一种基于SVM虚拟筛选的MapReduce执行方案,分析了HDFS和Spark结合使用才能实现对数据的并
其他文献
层次线性模型中的多重共线性问题有时是客观存在的。针对该问题,尝试通过对层次线性模型中参数估计的方差进行分解,并使用赖因施形式和奇异值分解的方法对设计阵与转换阵之间
一直以来我国政府会计制度都选择预算会计制度,随着市场经济体制的进一步完善,政府会计制度还需要进一步的改革。本文从新政府会计制度的要点入手,分析新政府会计制度的实施
针对解释变量带有测量误差的部分函数型线性回归模型,引入一个合适辅助向量,构造出未知参数的经验对数似然比函数,给出了未知参数和未知系数的极大经验似然估计。进一步证明