数字标准平台中海量时空小文件合并策略研究

来源 :计算机应用研究 | 被引量 : 5次 | 上传用户:carpplolo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对HDFS处理时空小文件效率不高的问题,从用户的访问规律和访问数据自身属性这两者之间的相关性上出发,将用户访问流看成对数据文件的请求序列,然后根据数据的时空属性参数化表示,并利用特征提取构建一个新的特征序列,最后通过序列模式挖掘PrefixSpan算法找到用户在不同访问模式下的特征模板,合并相关文件。实验结果表明,该合并策略有效地降低了NameNode内存占用率和响应时间,提高了读取效率。
其他文献
针对Wi-Fi定位技术中基本三边定位算法的测距模型参数不确定和定位计算误差大等问题,提出基于权值的参数实时更新定位算法。该算法首先按照基于区分度能力的信息增益方法选择三个最能反映待定位点信息的访问接入点AP,然后对测距模型进行实时获取参数的改进,最后对三边定位计算中的距离进行加权处理。实验表明,该定位算法能减小由环境因素和信号强度测量值引起的误差,与基本的三边定位算法相比,算法具有更高的定位精度。
对传统的工作流合理性验证方法进行了阐述,并分析了这些方法的优缺点,着重针对国内外学者用Pe-tri网对工作流合理性验证方法进行综述,分析其特点,并指出了工作流的合理性验证的发展方向。
协作频谱感知可以有效提高认知无线电系统的感知性能,但信噪比较低的认知节点参与协作会影响整体的感知性能。为解决这种低信噪比节点降低系统感知性能的问题,提出了一种基于信噪比对参与协作的认知节点进行筛选优化的方法,通过筛选避免低信噪比的节点参与协作。理论分析和仿真实验结果表明,所提出的方法可以消除低信噪比节点的影响,提高系统的感知性能,同时具有较低的计算复杂度。
针对标准粒子群算法收敛速度较慢、收敛精度较低、容易陷入局部最优等方面的缺点,提出一种融合细菌觅食算法和鲶鱼效应的混合粒子群算法。通过四个经典测试函数仿真实验,验证了该算法具有较其他改进方法更强的全局搜索能力、收敛速度和收敛精度。并针对一类可描述成Wiener模型的工业过程进行了参数辨识,通过数值仿真验证了混合粒子群算法的实用性以及较其他算法更强的非线性辨识能力。