论文部分内容阅读
随着无线通信技术、无线数据库技术与集成电子技术的显著提高和广泛应用,具有监测能力、计算存储能力和数据传输能力的无线传感网络被国内外研究者应用到军事、交通运输、环境监测和农业生产等领域,在国防建设和国家经济建设方面,起着很重要的作用。然而无线传感器网络的应用发展仍受诸多因素的制约,无线网络不稳定、安全性较差、网络延时、传感器能量较小、周围复杂环境等因素都会影响到原始数据的准确度,致使感知的数据具有不确定性,不确定性数据的问题已成学术界研究的热点之一。当前不确定性数据的处理算法主要从经典的确定数据算法演化而来,其中比较经典的不确定数据算法为Skyline查询、U-AHC、基于频繁集的数据挖掘和基于聚类的算法。其中基于聚类的算法由于其查找簇的优越性,应用最为广泛。聚类分析可以更好的发现数据之间的相似度,形成簇类,传统的聚类算法无法将相似度高的不确定性数据数据对象划分为一个簇,数据挖掘过程中就无法完全体现数据对象的准确状态。为了解决无线传感器网络中的不确定数据,作者根据不确定性数据的概率密度分布进行概率聚类,并利用Hilbetr编码技术将多维数据映射到一维数据空间,通过改进Hilbert编码技术,并在此基础上改进了基于Hilbetr-R树索引的HPDBSCAN算法对不确定性数据进行聚类。通过编程仿真反复实验和验证实验结果表明HPDBSCAN算法预处理效果较好,比PDBSCAN和FOPTICS等聚类算法更适合不确定性数据的聚类。本论文的主要工作如下:(1)在经典的DBSCAN算法基础上,提出Hilbetr-R树来提高空间利用率以及索引效率。利用Hilbert曲线具有其良好的聚簇性,同一叶子结点内的Hilbetr编码值接近的数据点,其空间位置接近。对数据预处理,缩短了聚类时间。(2)改进Hilbetr编码值计算公式,使空间位置接近的数据点其Hilbetr编码值接近,保证数据聚类在效率提高的同时,准确性有所保证。(3)将数据点的Hilbert编码值差值引入概率阈值PTI中,将多维复杂积分运算转变为一维积分运算,缩小计算代价。最后,总结了本论文的主要工作,展望了HPDBSCAN算法在无线传感器网络中的应用