论文部分内容阅读
RFID技术作为物联网的核心技术在众多行业中广泛的使用,信息技术不断深入,数据成为整个信息系统中最关键的元素之一,RFID数据是目前许多大型系统中重要的数据来源,面对庞大的来自物理世界的弱语义数据,如何有效的提取原始数据至关重要。管桩生产信息溯源过程中会产生巨大的原始标签数据,这些数据如果直接导入上层决策系统,将给上层应用带来巨大的计算量甚至根本无法得到准确的决策结果,给企业带来重大的损失,对RFID原始数据的清洗工作显得尤为重要。RFID脏数据来源主要有数据漏读、数据多读、数据冗余等方面,在稀疏拓扑结构中数据漏读为主要的脏数据来源,在密集型拓扑中数据冗余为最主要的脏数据来源。针对此,本文从RFID数据漏读和数据冗余两方面分别进行阐述在管桩生产信息溯源过程中不同算法的效率问题。本文研究优化的RFID数据漏读与冗余算法,主要工作有:(1)综合分析了RFID系统组成与数据流的特点,分析了常用RFID网络数据清洗策略并着重介绍了几个经典的RFID数据清洗算法。(2)为满足RFID网络中数据的完整性,提高漏读数据的填补正确率,在研究SMURF算法的基础上,提出一种自适应窗口大小调节的ADCLM算法。该算法结合统计抽样理论,根据数据完整性和动态性检测条件进行决策,在满足动态窗口调节的同时针对标签边缘化处理、大窗口污点效应以及小窗口抖动效应等问题上做了更为深入的处理。(3)为最大限度的减少RFID网络中数据的冗余数据,在研究RRE和LEO算法基础上,提出一种不依赖于特定拓扑与特定阅读顺序的基于中间件的混合去冗余阅读器的算法。该算法保证了在满足对数据完整性的要求上对整个RFID应用系统中的激活阅读器最少。最后在管桩RFID溯源管理系统中测试,实验结果表明,提出的漏读平滑算法和去冗余算法能满足海量数据的实时数据流的处理,得到完整的可供上层应用使用的语义数据。