论文部分内容阅读
随着科技的进步,射频识别技术(Radio Frequency Identification,RFID)技术已应用于诸如仓储管理与物流、邮件/快运包裹处理、图书管理、医疗保健等领域。RFID技术与互联网、通信技术相结合,可实现全球范围内物品的编号、识别、编目、跟踪和信息共享。将射频识别技术引入供应链管理,可以跟踪物流网络中移动物品的运动轨迹,为用户决策提供有力支持。商品流动会产生的大量的结构数据,针对此类RFID路径数据挖掘,主要存在如下几方面问题:(1)缺乏对RFID应用中各种信息进行有效表示的模型;(2)原始RFID数据量庞大、抽象层次最低,不利于数据分析;(3)对移动物体的轨迹进行聚类可以有效的预测物体的运动趋势,传统的轨迹聚类方法都是把整个物体的运动轨迹作为研究对象,会丢失相似的子轨迹。RFID数据中最重要的部分是物品的移动数据,又称路径数据或者痕迹数据,RFID数据挖掘主要工作就是路径数据挖掘。我们对路径数据挖掘技术作了深入的研究,挖掘出现频率较高的路径,为用户了解物品的移动规律和趋势,优化供应链。本文在国内外研究的基础上,设计高效的RFID数据仓库图建模方法,提出了基于图型数据集的频繁路径挖掘算法、RFID数据压缩方法、RFID跟踪系统中的移动对象轨迹的划分—聚类方法等。论文主要创新点如下:1)传统数据仓库技术没有考虑不同元组间的关系,而RFID的数据元组包含路径等结构信息。针对这些结构数据,本文提出图建模方法,将基于图的OLAP框架应用到RFID物流管理中,对物品的运输路径建立图模型。即将物流信息用图来表示,用户根据自己的兴趣,对图集进行相关的OLAP操作,获得有用的图信息,从而提高查询效率。2)针对基于RFID物流数据的图集,本文提出Rmine算法,将频繁路径挖掘问题转换为频繁图的挖掘,当产生的物流图数目很大时,而用户只对其中的一部分图感兴趣,那么我们可以先从图集中找出满足用户需求的图集,然后利用DFS(深度优先搜索)法生成频繁子图,降低了子图同构枚举的开销,加快频繁图的挖掘速度。3)阅读器采集的原始RFID数据量庞大、抽象层次最低,不利于数据分析,利用图构建RFID数据仓库,本文提出了图概化的方法,根据用户所选择的属性和关系,将图中的节点分组,并且由用户控制概化的层次,即通过分组的数目k来决定概化图的大小,根据当前分组的大小,选择divide操作来对原始分组进行更精确的划分,或者选择merge操作来合并原始分组,得到粗糙的聚集层次。通过剪枝,来压缩图集,减小数据集,使得频繁图挖掘算法在收缩图上进行,提高频繁图挖掘算法的效率。4)传统的轨迹聚类方法都是把整个物体的运动轨迹作为研究对象,会丢失相似的子轨迹。而在实际的应用中,用户侧重的也许只是某些特定的地区,这就要求在轨迹的部分区域上寻找相似段。本文提出了PT-CLUS算法,首先根据coarse-fine层次分段方法,将轨迹分段并进行剪枝,加快聚类阶段的速度。然后,在子轨迹集合上通过检查分段的邻域来搜索簇,采用层次聚类方法完成子轨迹的聚类。