论文部分内容阅读
随着互联网的广泛应用,人们获取信息的途径更加多样。搜索引擎使人们在检索信息时更加方便快捷,但面对海量信息,当前主流搜索引擎产生了更新信息速度慢,搜索结果雷同,对行业搜索、专业搜索的支持性不强等诸多问题,个性化搜索引擎应运而生。当前的个性化搜索引擎能够在查准率、个性化内容及专业搜索等功能上有所提高,但更新周期仍然以日甚至星期计算,无法明显提升更新速度。本文探讨了基于用户兴趣的搜索引擎,即搜索引擎能够通过多种学习手段对用户感兴趣的信息进行识别。同时,通过维护和更新用户模型,搜索引擎能够对用户兴趣进行动态描述,使用户兴趣模型更加接近用户的真实兴趣。搜索引擎依据更新后的用户模型作为信息查询的依据,可以实现高效的个性化搜索。作为资源共享模式的延伸,RSS通过联合、聚合等方式,使用户获取信息的时间代价大幅降低,同时也表征了用户的个性化信息需求。RSS用户面对的新闻信息是时效性很强的一种信息形式,所以其内容的丰富性、时效性等特点使RSS用户的兴趣模型中包含了对用户兴趣内容以及与之相对应的用户兴趣度的反映。本文将RSS用户兴趣分为主兴趣与潜在兴趣这一概念组,提出了改进的RSS用户兴趣模型,探讨了用户兴趣度权重和用户兴趣度衰减因子的改进算法,并由此设计和实现了一种基于RSS用户兴趣的个性化搜索系统。本文设计并在浏览器中植入了RSS Plug-in这一插件,使系统能够根据用户订阅的RSS信息,从中快速分析用户的兴趣,并根据信息聚类得到用户兴趣类别,进一步通过与用户实时地进行交互、学习与反馈,可以及时更新用户的兴趣模型,使用户兴趣模型能够快速拟合用户的兴趣变化。同时,该系统针对用户兴趣模型中相关兴趣类别的兴趣向量进行更新,计算速度快,准确性高,前瞻性强,可以有效地避免一般个性化搜索引擎在初始阶段和用户兴趣波动阶段的低查准率,改善了用户体验,实现了一种高效快捷的个性化信息服务。