支持多集合成员查询的噪声布隆过滤器

来源 :南京大学 | 被引量 : 0次 | 上传用户:liqund7h
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文的目标是设计一个用于多集合成员快速查询的紧凑型数据结构。多集合成员查询是计算机系统和网络应用的基本操作。例如,二层交换机会把MAC地址映射到某个端口,能够根据MAC地址快速定位到相关联的端口对二层交换机进行帧转发至关重要。在这里,每个端口相当于一个集合,MAC地址相当于集合的成员。目前大部分多集合成员查询机制都是基于布隆过滤器的,但这些机制不是存储空间太大就是查询速度较低。一方面,一些现有技术把整个存储空间划分成多个均匀的单元,然后用一个或多个单元来存储成员的集合标识。这种粗粒度存储集合标识的方法导致存储空间利用率较为低下。另一方面,其他现有技术内存访问开销较高,成员查询速度较慢。这一类技术相关的机制大部分都使用多个布隆过滤器,使用布隆过滤器的个数根据不同机制的性质确定。因为这些机制的内存读取开销是标准布隆过滤器的好几倍(取决于使用布隆过滤器的数量),所以成员查询的效率不高。为了解决这个问题,本文设计了噪声编码布隆过滤器(Noisy Coding Bloom Filter,NBF)和纠错噪声编码布隆过滤器(Error Corrected Noisy Coding Bloom Filter,NBF-E)来实现多集合成员查询。本文在理论上优化了 NBF和NBF-E的分类失败率和假阳性比率并给出了选择NBF和NBF-E的标准。NBF和NBF-E的关键创新点在于把集合标识信息用一种紧凑的方法来进行存储,从而可以使用较少的存储空间完成多集合成员的快速查询。由于存储集合标识信息时会引入噪声,本文在进行成员查询的时候会对结果进行去噪处理。此外,NBF-E在NBF的基础上使用了非对称纠错编码的技术,可以利用查询结果的非对称错误特性来提高查询结果对噪声的容错性。本文使用真实的网络流量来进行NBF/NBF-E和现有多集合成员查询机制的比较实验,实验结果显示NBF和NBF-E要优于现有的多集合成员查询机制。此外,本文揭露的布隆过滤器的非对称出错性质和使用非对称纠错编码的提议不但可以用于NBF-E的后续研究,还可以应用到其他基于布隆过滤器的机制。
其他文献
以VoIP为代表的互联网通信作为一种典型的宽带应用正面临着前所未有的发展机遇。VoIP为语音、视频、数据业务的融合提供了一个综合的开放平台。在这个平台上,IP电话、视频播
本文对面向中文专著的汉韩机器辅助翻译进行了研究。主要成果可以归结为以下六个方面: 第一,深入地分析了中文专著的语言特点。中文专著在编写格式、语言运用上除了一般文章
自2007年苹果公司发布了iPhone,短短的几年间,智能手机应用(MobileApplication,App)数量的爆发式增长,虽然极大方便了用户的生活、工作,同时也带来了如何从海量应用中寻找、选择合
车牌识别系统(LPR)是智能交通管理系统中的重要组成部分,从车牌图像中迅速、准确的分割出车牌区域的定位问题是实现车牌识别的一个关键环节。本论文针对车牌定位算法的研究,提
在现代信息化社会里,专利信息是一种具有极高价值的一种知识库,包含了很高的人类智慧,不仅有很高的实用价值,而且对于人们继续进行新的创新具有极大的启发作用。本课题从专利的文
DoBuilder是国家九五重点科技攻关项目“石化应用软件集成平台及公共服务软件”的组成部分,原名DapBuilder,开发于2000年,目前最新的版本是2005年1月发布的DoBuilder V3.0。  
度量在软件工程中有着举足轻重的地位。作为软件组织中度量工作的一项重要内容,对开发人员进行效率评价有利于开发人员的个人能力改进,有利于管理人员进行项目管理,有助于形成软
不可分离二维小波(滤波器)由于有设计上的更多自由度和更好的频率可选择性,成为当前小波理论及应用领域的热点。尽管目前已有了一些二维不可分离小波滤波器构造的方法,但在实际
JSP是目前主流的Web数据库访问技术,具有访问效率高,开发方便,独立于平台等渚多优点,是未来最有发展前景的Web数据库访问技术。Struts是目前非常流行的Web应用框架,Hiberante是目
随着面向服务计算技术的发展和应用,服务的非功能属性(即服务质量,QoS)保障能力成为Web服务能否在企业应用中获得成功的关键因素。基于策略的方式是当前Web服务质量保障的主流