论文部分内容阅读
随着个人计算机上数据的海量增长,用户管理和使用这些数据变得越来越复杂。个人数据空间系统为用户数据管理提供了新的思路。如何方便快捷地获取用户所求信息,是当前数据空间研究的重点。与传统数据管理系统不同,个人数据空间包含大量异构数据,并且这些数据的模式信息量大、结构复杂。如何为个人数据空间提供简洁的、突出重点的模式摘要,成为目前研究的关键所在。基于此,本文提出在数据空间中构建基于主体兴趣的模式摘要。模式摘要可以使用户清楚地了解数据空间大致的结构,以便构建和细化查询。本文的主要工作如下:1.提出数据空间模式摘要的评价标准。构建模式摘要的目的是让用户快速了解系统大致的结构,好的模式摘要应该既能反映系统的概貌又能满足简洁的要求,同时考虑到数据空间是一种面向主体的数据管理技术,模式摘要的构建也应该关注主体的需要。因此,对于数据空间系统的模式摘要而言,在选择具有代表性的结点时,既要考虑模式图和数据图,还要考虑用户的兴趣和访问频率。2.构建用户兴趣模型,并利用该模型提出动态维护模式摘要。考虑到数据空间系统的特点,使用查询信息作为用户兴趣信息来源。改进了个性化推荐系统中计算兴趣度的方法,提出了适用于数据空间的模式节点兴趣度计算模型。基于此模型及数据图节点和模式图节点的对应关系,提出用户兴趣建模的方法,即基于查询的用户兴趣模式点提取方法。3.提出基于主体兴趣的模式摘要构建。提取主要分为两大步骤:初始模式摘要节点提取,用户兴趣动态维护。创造性地应用社团结构检测的方法,实现模式图的自动分块并确定初始摘要尺寸,通过从分块中挑选代表性的节点,得到初始摘要节点集合。利用数据空间中构建的用户兴趣模型,获得用户感兴趣的模式点,通过在摘要中添加这些兴趣点,实现对模式摘要的动态维护,从而构建基于主体兴趣的模式摘要。结果表明,基于主体的模式摘要在满足数据空间面向用户要求的方面优势明显。和传统模式摘要相比,基于主体的模式摘要有效降低了查询发现代价。由此证明基于主体兴趣的模式摘要在用户需求及查询发现代价上更具优势,为个人数据空间中数据便利查询提供了快捷高效的媒介。