论文部分内容阅读
互联网信息技术的快速发展为人们提供了大量的有用信息,但同时也使人们陷入“信息过载”困境。个性化推荐系统能够根据用户的兴趣模型向用户推荐符合其兴趣的网络资讯,帮助用户摆脱“信息过载”带来的困扰。本文设计和实现了一个基于用户隐式反馈的个性化推荐系统,并针对系统的两个关键技术——信息过滤技术和用户反馈机制——展开研究。本文的具体研究工作如下:首先,本文介绍了个性化推荐系统的研究现状,总结了当前个性化推荐系统所采用的信息过滤技术和用户反馈获取机制。在信息过滤技术方面,当前个性化推荐系统倾向于对传统分类算法进行改进,并将改进后的算法应用于信息过滤。在用户反馈机制方面,当前个性化推荐系统大多采用显示的方式获取用户反馈,这种方式打扰用户正常阅读,因而取得的效果并不理想。通过对前人研究成果的总结,本文设计了一个基于用户隐式反馈的个性化资讯推荐系统框架。其次,本文对个性化推荐的关键技术之一信息过滤技术进行深入研究。与当前大多数个性化推荐系统类似,本文将改进后的朴素贝叶斯算法应用于系统的信息过滤模块。目前,对朴素贝叶斯算法的改进主要从结构扩展、特征选择、属性加权三个方面进行,但是这些方法会造成算法复杂度增加等问题。本文通过对特征选择和属性加权这两种改进方法进行公式推导,提出了一种基于尾项加权的改进朴素贝叶斯分类算法。该算法的核心思想是对朴素贝叶斯分类算法的输出结果添加尾项值,通过尾项值的变化影响分类结果。尾项值的调整由用户的反馈确定。本文在多个文本测试语料库上进行测试,结果显示,与朴素贝叶斯分类算法相比本文提出的算法分类准确率更高。最后,本文讨论研究了个性化推荐系统的用户反馈机制。由于显示获取用户反馈的方式会打断用户的正常阅读,取得的效果并不理想。相关研究表明用户的阅读行为与用户兴趣之间存在一定关系,在此研究基础上,本文提出一种通过用户阅读行为序列分析隐式获取用户兴趣作为反馈信息的方法。该方法首先为用户阅读行为建立隐马尔可夫模型,然后利用该模型分析用户阅读过程中产生的行为序列,将获得的用户对资讯的兴趣作为反馈信息,最后利用用户的行为序列更新模型。为收集实验数据,本文开发一个RSS阅读软件,并邀请志愿者参与实验。RSS阅读软件能记录用户阅读时产生的行为和用户的显式反馈。本文在收集到的数据集上进行实验,结果显示,通过用户的行为分析可以获取用户对资讯的兴趣。