论文部分内容阅读
互联网的发展正由Web2.0过渡到Web3.0时代,快速发展的互联网为人们提供了大量信息的同时,也使人们受到大量无关信息的干扰。面对海量的信息资源,单纯依靠人工筛选对自己有价值的信息已不现实。如今的网络强调以用户为中心,为用户提供个性化的服务。用户都有自己特定的浏览习惯和兴趣,Web网站如果能根据用户喜好动态地改进站点的信息组织方式,那么用户将方便和有效地获取自己想得到的信息。从数量巨大的信息中快速、准确的选取出用户感兴趣的信息,为用户提供个性化推荐是亟需解决的问题,但是传统的信息过滤很难满足该要求。学者们开始重视用户兴趣建模技术,目前面向个性化推荐的用户兴趣建模是重要的研究课题。在网站和网络社区的研究中,这也是热点。用户兴趣建模技术作为个性化推荐的基础和核心,用户模型的准确性决定了个性化推荐服务的有效性。本文研究了用户兴趣建模过程中的关键问题,主要完成了以下工作:(1)基于本体构建用户兴趣模型本体技术作为一种新兴的语义技术,能够很好的解决知识的重用和共享的问题。传统的用户兴趣模型存在弱语义、无法重用和共享的问题。本文引入本体,使建立的用户模型具备语义理解能力,在了解用户兴趣的同时,挖掘用户潜在兴趣,向用户进行推荐。本文直接基于ODP构建领域本体并利用中文维基百科对特征词进行扩充,ODP是目前互联网上最大的、最广泛的人工目录,这样基本涵盖了用户兴趣领域的所有概念。该方法可以实现没有领域专家的帮助,直接构建领域本体。(2)提出一种新的用户兴趣建模方式提出一种新的基于领域本体的用户兴趣建模方式。用户兴趣建模过程分为获取用户兴趣、兴趣模型的表示、兴趣模型的学习更新。用户兴趣获取:通过用户的浏览行为获取用户对页面的兴趣度。兴趣模型的表示:本文提出一种新的基于领域本体的“用户兴趣概念树”的构建方式。兴趣模型的学习更新:依据获取的用户兴趣采用算法来更新用户兴趣模型,考虑到用户对页面的兴趣度。文中建立了一个长短期复合兴趣模型,能够同时反映出用户的长期兴趣和短期兴趣的变化,同时能将用户的短期兴趣和偶然性的浏览行为相区分,提高了系统性能,增加了用户体验。(3)模拟实验验证本文所建用户模型的有效性基于本文所建用户兴趣模型建立个性化信息推荐系统,通过查全率和查准率两项评价指标,说明本文所建用户模型具有准确性和有效性。本文所建的用户兴趣模型主要是实现对文本信息进行个性化推荐。各种新闻门户网站、微博等各种在线社会网络的内容大多都是文本信息,通过本文所建模型能使网络用户更加快捷高效地获取自己感兴趣的信息,对于手机上网用户来说,更是提供了极大的方便。基于本体的用户兴趣模型由于本体自身的优势,能够一定程度实现用户兴趣模型的共享,大大减少了个性化推荐系统中用户兴趣建模的工作量,为更加广泛地实现个性化推荐打下了基础。