论文部分内容阅读
如何在浩如烟海的网络中找到用户需要的信息,已经成为信息检索服务面临的挑战性课题。未来的搜索服务应该能够给用户提供个性化信息服务。而作为个性化服务的核心技术,个性化建模也逐渐受到重视,个性化模型的好坏直接影响到个性化服务的质量,只有系统很好地理解了用户的兴趣、偏好和访问模式等信息,才有可能实现理想的个性化服务。本文围绕个性化建模技术进行了研究,设计并实现了个性化元搜索引擎PMSE系统。系统设计目标是:挖掘用户兴趣,建立合理的模型来表示用户兴趣,并通过不断地更新与维护,优化模型,使其能够准确反映用户的兴趣,并在此基础上为用户提供个性化服务。论文的主要研究工作:(1)通过参考ODP的分类层次,构建用户兴趣树来动态存储用户兴趣,用短期兴趣和长期兴趣相结合的方法描述用户兴趣特征。(2)研究了用户兴趣挖掘算法,结合显式和隐式挖掘技术,能够更好地反映用户兴趣。(3)在隐式挖掘中,从用户的访问历史页面中提取用户的兴趣主题特征,提出了针对网页的特征提取算法,而且还提出了基于个性化模型的页面归类算法。(4)对用户查询的意图进行分析,缩小用户查询的范围,提炼查询结果,提高查询准确度。文中提出了用户查询到用户兴趣类的映射算法。它通过结合用户兴趣模型来推测用户的查询意图,分析出用户搜索的潜在意图,并扩展用户查询词。(5)研究了元搜索引擎的调度策略。对现有的相关研究进行比较分析,提出基于兴趣分类采样的成员引擎特征表示和基于用户兴趣的成员引擎个性化调度算法。在PMSE系统中,用户兴趣模型是很重要的一个模块,只有有了准确的模型,个性化元搜索引擎才能更好的为用户提供信息检索。而在用户兴趣模型的构建过程中,挖掘算法又占有很大的比例,只有有了高质量的用户兴趣挖掘算法,才能很好的进行用户模型构建,才能实现个性化服务,更好地满足用户的需要。本文提出了一种基于ODP的多层次用户兴趣模型构建的算法,准确度高,符合用户期望。