论文部分内容阅读
随着Internet和网络信息技术的迅猛发展,网络资源呈指数急剧增长,传统的通用搜索引擎的查询结果只依赖于查询关键词,而实际上,即便相同的查询词,不同的用户查询目的可能不同,所希望的返回结果也会因人而异。针对这种情况,人们迫切需要一种针对个人特点提供更加精确查询结果的搜索工具,以用户为中心的个性化搜索引擎便应运而生。本文首先全面了解了实现个性化搜索引擎的基本理论和研究现状,并对现有各种个性化推荐技术进行性能对比分析,为以后的研究提供了理论基础。接着,本文研究了推荐领域最重要的协同过滤算法,基于用户推荐的协同过滤可以为用户发现新的潜在感兴趣的资源,但是具有稀疏性等缺点;基于项目推荐的协同过滤在某种程度上可以解决稀疏性,而且简单有效,但是只能发现和用户已有兴趣相似的信息。针对这些问题,本文提出了一种基于单值分解的集影响协作过滤推荐算法,利用单值分解和增大影响集来提高协同过滤的推荐质量,解决稀疏性问题,改善推荐系统的性能。然而在应用了改进的协同过滤推荐算法的推荐系统中,除了已经解决的稀疏性问题,还存在着冷开始新项目问题、扩展性问题以及用户潜在兴趣难以挖掘等,本文在前面研究的基础上,提出了一种个性化推荐融合算法,在优秀的基于用户协同过滤推荐思想基础上,结合现有矩阵技术,扩展影响集,利用基于项目协同过滤以及基于内容过滤,解决了稀疏问题、扩展性问题、冷开始和用户潜在兴趣难以挖掘等问题,提高了推荐系统的推荐质量。并在此基础上,提出了一种策略预测用户评分,解决了由于用户对资源苛刻程度不同,而导致评分相差较大的问题。最后,分析研究了开源全文检索工具Lucene,并在该平台上加入了个性化搜索模块,分别对改进的协作过滤推荐算法和个性化推荐融合算法进行了仿真实验。实验结果表明:改进的协作过滤推荐算法比传统的协同过滤算法的推荐质量高,而在冷开始状况下,个性化推荐融合算法比改进的协作过滤推荐算法推荐质量高,预测评分更加与实际评分相接近,搜索结果更加符合用户需求,提高了个性化搜索引擎的服务质量。