论文部分内容阅读
个性化服务是一个自动获取用户对信息资源或借助信息形态表征的实物资源的使用信息,分析这些信息得到用户的特定兴趣和需求,然后根据分析结果在合适的时间向每一位访问者发送正确信息的过程,具有针对性、自动性特点。本文就个性化服务中的关键技术,用户与资源的描述、用户兴趣的获取与学习、推荐算法进行了研究。在研究中,针对传统个性化技术中资源、用户描述能力的不足,本文引进了领域本体模型和XML来描述资源深层的语义关系,并利用半结构化数据学习和挖掘算法从用户使用数据获取用户的模型来进行资源的推荐。具体的内容如下:(1)基于本体和XML的个性化服务系统模型传统个性化服务系统中,资源一般采用关键词向量表示,这种表示方式只考虑了资源内容,无法区分资源在层次化结构中体现出来的特征差异,在个性化推荐中无法根据资源的深层属性和特征进行推荐。本文中,我们提出了基于本体-XML的个性化服务系统模型,主要思想是利用本体对领域进行建模,描述资源的深层属性及属性间的相互关系。针对个性化服务系统中资源描述的特定需求,给出了资源描述的基本框架和该框架下利用XML对资源进行描述的方法。(2)基于本体的用户需求的描述、获取与推荐提出了基于本体的用户兴趣模型,把用户兴趣定义为领域本体中资源类的虚拟实例,描述用户结构化的兴趣特征和特征之间的相互关系;我们把用户对资源的兴趣的计算框架表示为对资源属性兴趣的加权和。借鉴前馈神经网络,通过定义泛化的delta函数,给出了用户模型的学习方法。本模型表示方法与基于关键词的表示方法相比,更易被用户理解,在表示能力和推荐精确度上有明显的提高。(3)基于半结构化规则的用户兴趣表示与推荐XML数据与表格数据不同在于XML数据具有路径并且路径之间存在结构。XML数据的约简不仅是属性的约简,而且包括路径之间关系的约简。我们定义XML数据的约简包括路径的剪枝和路径的泛化,并定义了约简结果表示。利用XML数据约简的思想,给出了半结构规则的定义。然后利用无序树范式的性质,给出一种半结构规则挖掘的算法。基于半结构化规则的用户兴趣表示反映了资源的属性及属性之间的泛化关系,表示直观,易于理解,同时具有较高的推荐精度。(4)基于语义相似度计算改进的协同过滤。协同过滤是个性化推荐系统中经常用到的方法,但是协同过滤一般存在新用户、新项目和用户评分矩阵的稀疏问题。本文在对各个问题产生的原因进行分析的基础上,提出了三个改进算法:利用语义知识、XML数据的相似度计算和用户模型的相似度计算改进传统的协同过滤算法。实验证明,这三个算法都取得了较好的效果。