基于HDFS的海量日志数据冗余点过滤算法仿真

来源 :计算机仿真 | 被引量 : 0次 | 上传用户:dark_zj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用当前算法滤除数据冗余点时,缺少对数据冗余点特征的提取、分类处理过程,导致滤除效率差、准确率低、存储开销过大.于是设计了基于HDFS的海量日志数据冗余点过滤算法.引入HDFS体系架构,利用数据采样时间序列获取数据冗余点的特征,并进行分类处理,提升冗余点的滤除效率;计算滤除前含有冗余特征的数据字节数与普通字节数之比的缩减率、误判率,减少存储开销量;为提高准确率、消除性能,采用相似度概念,根据冗余点的突出特征计算整体相似度,再通过均值漂移传递函数实现对数据冗余点的滤除.实验结果表明:上述算法滤出效率更好、准确率更高、存储开销量更小.
其他文献
在城市采用钻爆法修建隧道时不可避免下穿城市建筑群,爆破对建筑物的影响越来越受到人们的重视。为保证隧道修建过程中建筑物的安全,对钻爆过程中爆破地震波的传播机理、衰减规律,以及建筑物动力响应特性进行研究并采取有效的控制措施降低爆破振动损伤是至关重要的。本文以福州湖东东路城市隧道下穿建筑群为工程背景,采用ANSYS/LS-DYNA有限元软件结合爆破现场监测对建筑物的振动特性进行了研究。主要结论如下:(1
学位
不良地质条件对工程建设带来诸多危害,因此工程实践中必须对其所在地段的承载条件进行处理改善。灌浆加固是工程中常用的地基土加固处理方法,水玻璃又是其常用的固砂灌浆材料。因此,有必要开展水玻璃固砂效果试验,不断优化参数,提升固砂效果。论文基于水玻璃的性质,在分析总结水玻璃浆液影响因素、影响特征的基础上,通过土工试验、模拟试验,分析研究了水玻璃固砂土的物理力学特征及其渗透扩散特征,并取得以下主要认识成果。
针对多段支持度数据加密后存在数据安全指标较低,加密所用的时间较长的问题,提出高速网络多段支持度数据自动加密算法.首先通过DHA去噪方法去除多段支持度数据中存在的噪声,消除噪声对加密过程造成的干扰,去噪后测试节点密度,减少多段支持度数据加密所用的时间.然后结合椭圆曲线数据签名算法和椭圆曲线加密算法对多段支持度数据进行加密,提高加密后数据的安全性.最后设置仿真,结果表明,所提方法加密后的数据安全性高、加密效率高,在短时间内可有效完成多段支持度数据的自动加密.