面向RFID海量数据的图挖掘技术研究

来源 :扬州大学 | 被引量 : 0次 | 上传用户:chenlianggui888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的进步,射频识别技术(Radio Frequency Identification,RFID)技术已应用于诸如仓储管理与物流、邮件/快运包裹处理、图书管理、医疗保健等领域。RFID技术与互联网、通信技术相结合,可实现全球范围内物品的编号、识别、编目、跟踪和信息共享。将射频识别技术引入供应链管理,可以跟踪物流网络中移动物品的运动轨迹,为用户决策提供有力支持。商品流动会产生的大量的结构数据,针对此类RFID路径数据挖掘,主要存在如下几方面问题:(1)缺乏对RFID应用中各种信息进行有效表示的模型;(2)原始RFID数据量庞大、抽象层次最低,不利于数据分析;(3)对移动物体的轨迹进行聚类可以有效的预测物体的运动趋势,传统的轨迹聚类方法都是把整个物体的运动轨迹作为研究对象,会丢失相似的子轨迹。RFID数据中最重要的部分是物品的移动数据,又称路径数据或者痕迹数据,RFID数据挖掘主要工作就是路径数据挖掘。我们对路径数据挖掘技术作了深入的研究,挖掘出现频率较高的路径,为用户了解物品的移动规律和趋势,优化供应链。本文在国内外研究的基础上,设计高效的RFID数据仓库图建模方法,提出了基于图型数据集的频繁路径挖掘算法、RFID数据压缩方法、RFID跟踪系统中的移动对象轨迹的划分—聚类方法等。论文主要创新点如下:1)传统数据仓库技术没有考虑不同元组间的关系,而RFID的数据元组包含路径等结构信息。针对这些结构数据,本文提出图建模方法,将基于图的OLAP框架应用到RFID物流管理中,对物品的运输路径建立图模型。即将物流信息用图来表示,用户根据自己的兴趣,对图集进行相关的OLAP操作,获得有用的图信息,从而提高查询效率。2)针对基于RFID物流数据的图集,本文提出Rmine算法,将频繁路径挖掘问题转换为频繁图的挖掘,当产生的物流图数目很大时,而用户只对其中的一部分图感兴趣,那么我们可以先从图集中找出满足用户需求的图集,然后利用DFS(深度优先搜索)法生成频繁子图,降低了子图同构枚举的开销,加快频繁图的挖掘速度。3)阅读器采集的原始RFID数据量庞大、抽象层次最低,不利于数据分析,利用图构建RFID数据仓库,本文提出了图概化的方法,根据用户所选择的属性和关系,将图中的节点分组,并且由用户控制概化的层次,即通过分组的数目k来决定概化图的大小,根据当前分组的大小,选择divide操作来对原始分组进行更精确的划分,或者选择merge操作来合并原始分组,得到粗糙的聚集层次。通过剪枝,来压缩图集,减小数据集,使得频繁图挖掘算法在收缩图上进行,提高频繁图挖掘算法的效率。4)传统的轨迹聚类方法都是把整个物体的运动轨迹作为研究对象,会丢失相似的子轨迹。而在实际的应用中,用户侧重的也许只是某些特定的地区,这就要求在轨迹的部分区域上寻找相似段。本文提出了PT-CLUS算法,首先根据coarse-fine层次分段方法,将轨迹分段并进行剪枝,加快聚类阶段的速度。然后,在子轨迹集合上通过检查分段的邻域来搜索簇,采用层次聚类方法完成子轨迹的聚类。
其他文献
基于图像的建模技术多年以来一直是计算机视觉领域研究的一个热点问题。它是利用计算机视觉和计算机图形学的相关知识,仅仅根据物体在不同角度的一系列图像中记录的相关信息来
序列模式挖掘是数据挖掘领域中一个活跃的研究分支,有着广泛的应用前景,如顾客购买行为分析、Web点击流分析以及生物序列分析等,目前已经得到了广泛地研究,提出了许多经典的
在数据流测试技术中,覆盖程序中所有变量的定义-使用路径是衡量数据流测试好坏的重要标准之一。但是,由于变量的定义-使用路径中存在测试用例无法覆盖的路径,而且路径的插桩点过
RootKit是能够持久、可靠地存在于计算机上,而难以被检测的一组程序或代码,它使得攻击者可以隐藏自己的踪迹,并且拥有超级用户的权限。近年来,攻击者通过将RootKit与恶意程序相结
最小生成树问题是一个经典的网络优化问题,而实际应用中往往要对生成树加上某种限制,形成了一类有约束的最小生成树问题,如在有n个顶点的图G中求至少带有L片叶子的最小生成树,即
本文以基于小波变换的静态图像压缩算法的原理为基础,主要研究了静态图像压缩算法的实现,为其在嵌入式体系结构下的实现奠定基础。   论文研究了小波分析,多分辨率分析,Mallat
随着语义Web的发展,在线的语义数据越来越丰富。面对庞大的由语义对象和它们之间的语义关联构成的数据之网,帮助用户挖掘到数据之网中的语义关联模式进而能够快速有效地构建用
本文主要实现了基于混合预处理方法的嵌入式零树块编码算法,其目的是为了让该算法能够在以后的嵌入式体系结构中更好地应用。   首先,研究了小波变换以及多尺度几何分析方法
在计算机网络化迅猛发展的时代,如何有效、快速地从大量数据中获取人们需要的知识成为许多学者以及研究人员关注的焦点。数据供给能力和数据分析能力间的矛盾日益突出,使得人们
文档协同编辑是计算机支持的协同工作的重要应用之一,主要是为了实现多人异地同步编辑共享文档。随着分布式技术的不断发展,文档协同编辑工作模式产生了组织分工逐渐细化、人们