论文部分内容阅读
冗余数据滤重是射频识别(RFID)技术中非常重要的一环,其目的是去除RFID环境下产生的大量冗余数据,为上层应用提供准确有效的数据。由于RFID系统的特性,一个标签通常会在一个范围内静止不动或者缓慢移动,在阅读器不断探测过程中就会产生大量重复数据。这些重复数据不仅不会给上层应用传递任何有价值的信息,而且还会占用系统资源和影响系统运行效率。因此,在将RFID数据发送给应用程序之前,如何利用有限的内存空间在有限的时间内去除这些冗余数据是RFID数据流亟待解决的关键问题之一。本文首先介绍了RFID系统模型,并对RFID数据流的特点进行了概述,指出RFID冗余数据去重与传统数据、数据流去重在处理方式上的不同。然后,对相关技术包括传统数据去重、布隆过滤器去重、数据流窗口模型及数据流去重技术等方面进行了详细介绍,并指出它们的优点和存在的问题。针对阅读器探测范围分别独立的情形,为了使RFID系统能及时识别标签位置变化并能对时间冗余数据进行有效过滤,本文提出了基于滑动窗口模型的时空布隆过滤器(TSBF)。该过滤器通过改进标准布隆过滤器,将一维数组改成二维数组,分别存储阅读器ID和时间戳,在算法中加入对阅读器ID的判断,以实时识别标签位置发生移动的情形,为上层应用提供实时准确的信息。同时,为保证过滤器不会因为存储过满而导致假阳性率增高,本文提出了过期元素衰减删除算法,通过引入较低水平的假阴性率,保证了过滤器的假阳性率不会因为数据量太大而直线上升。通过实验对比分析,TSBF算法能较好地过滤时问冗余数据,在处理标签位置发生移动时具有较好的性能。针对大型RFID环境中阅读器探测范围可能交叉,海量数据会对网络传输负载带来严重影响,本文提出了本地过滤和全局过滤相结合的两阶段滤重算法。在阅读器端的本地过滤,使用最大计数布隆过滤器(MCBF)去除阅读器中产生的时间冗余数据。在服务器端的全局过滤,本文提出了TSBF-S算法去除空间冗余数据。该算法简化了TSBF的判断条件使其能处理空间冗余数据,在保证准确率的前提下提高了算法的运行效率。通过实验比较与分析,在错误率基本相同的情况下,两阶段过滤算法的运行效率远远高于TSBF算法。