面向大规模批量日志数据存储方法的研究

被引量 : 0次 | 上传用户:davidcao2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
防火墙、IPS/IDS、WEB服务器等大的网络系统实时产生大量日志数据,能高效地存储、处理这些数据是挖掘日志数据的前提。关系数据库因为要进行类型检查、语句分析等操作大大影响了其效率,越来越不适用于处理实时和海量日志数据。而无类型约束、易扩展的键值数据库无疑将大大提高对日志数据的处理效率。随着互联网的发展键值数据库的应用越来越广泛,百度,谷歌,雅虎,阿里巴巴等大的互联网公司都采用键值数据库存取,现在热门的云存储,云计算其数据也用键值技术。本文详细介绍了键值数据库的原理和主要技术,并设计和实现了一个高效的、专门处理网络日志数据的键值数据库,能够支持多维索引和事务处理,并保证进程和线程安全。最后给出完成的键值数据库的测试结果以及和BerkeleyDB数据库的对比情况,指出实现键值数据库的优势与不足,并给出下一步的优化改进措施。本课题主要内容是设计一个实时处理海量网络日志数据的数据库。其主要实现功能包括以下几点:(1)基于键值数据库技术,开发一个网络日志存储系统;(2)保证较高的读写效率,写日志到数据库和从数据库中读日志的速率都达到每秒10万条记录的数量级;(3)实现多维索引,实现从多个域查询日志记录,并支持等值查找,范围查找,遍历操作等;(4)线程安全,读,写进程的同步与互斥,保证数据的完整性;(5)实现C/S分布式存储,利用libevent库来实现主从存储器间的通信。本课题将采用一种从整体到局部的设计思路实现日志存储系统。首先分析日志记录的特点和日志系统需要提供的功能来总体设计键值数据库。然后研究实现数据库的各项技术并进行分析对比,接着从整体到各个模块进行分别设计和优化,最终完整地实现日志存储数据库。所要达到的目标为能实时的存储日志记录到数据库中,同时也能实时的从数据库读日志出来。
其他文献
<正>业内专家认为,国际矿业巨头希望通过降价、扩产将中国铁矿石产业链扼杀。铁矿石价格正加速下跌。普氏62%铁矿石指数已从年初的134.5美元/吨下滑至7月7日的95.25美元/吨,
2013年11月14日,国际糖尿病联盟(IDF)公布第六版"IDF糖尿病地图",数据显示中国2013年糖尿病的患病人数为9840万,居全球首位。糖尿病足重在预防,对糖尿病足危险因素(性别、患病时程
投资者的非理性行为在市场渐进有效的进程中扮演了怎样的角色-现有文献并没有给出直接的研究和明确的结论。本文对上证50指数所代表的子市场的噪声交易情况进行了度量,同时构
从科技创新协同视角对粤港澳大湾区科技创新发展现状进行梳理,分析构建粤港澳大湾区科技创新共同体中存在的问题,探讨建设粤港澳大湾区科技创新共同体的对策建议,提出粤港澳
从上世纪末起,中国帮助苏丹建立起来完整的石油工业体系,并逐步成为苏丹石油工业的主要投资国之一。在巨大的石油利益和地缘政治的双重因素干扰下,西方大国借机意欲重返苏丹,
对传统侵权责任及其构成要件的相关概念和理论问题,学界一直存在分歧和模糊之处,对其进行反思和澄清,便于更加准确地理解其含义,也便于网络侵权责任的顺利界定与运用。以侵权
本文通过运用比较法对中国打击乐器—大堂鼓与西方交响乐团打击乐器—小军鼓的演奏技法进行研究分析,就小军鼓和中国大堂鼓在演奏上的共性与个性进行对比。同时,通过对小军鼓
经过40多年漫长诉讼的光华寮案,不仅是一起民事诉讼案件,更是涉及中日关系的国际法问题。作为在处理国际事务中所发挥作用的特殊法律部门,国际法学也随着国家间交往的日益密
随着全球经济一体化步伐的加快和科学技术的进步,互联网的应用和电子支付技术在中国也越来越普及。根据中商产业研究院研究显示:2016年,我国电子商务交易额已突破5万亿元大关
定向遗忘强调遗忘的有意性和指向性,研究的是无价值信息是如何影响新近信息的记忆的。近年来,情绪性记忆的定向遗忘研究逐渐成为热点。研究者通过赋予实验材料情绪性或者诱发