基于用户偏好和用户意见的协同过滤系统

来源 :山东大学 | 被引量 : 0次 | 上传用户:sjt111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0的出现和发展,越来越多的人开始在网上表达他们对一些产品和服务的意见。用户的意见通常包括对该产品的整体评分以及一些文本评论。这些信息对于生产者和消费者来说都是非常有价值的。对于生产者来说,他们可以通过查看用户的评论来获取令用户满意的特征以及不满意的特征,进而对产品进行改进以提高商品的销售量和获取最大化的利润。对于消费者来说,在他们购买产品时,查看其他用户对该产品的评价可以帮助他们做出明智的选择。这些文本评论和评分也是形成推荐系统的基础,而推荐系统的目的在于尽可能准确的从上亿个产品中找出用户最感兴趣的产品。协同过滤是推荐系统中一种经常用到的技术。协同过滤分析用户兴趣,在用户群中找到与某用户有着相同兴趣爱好的用户,综合这些相似用户对某一信息的评价,系统能够形成对该指定用户在该信息上的兴趣爱好进行预测。目前,已经出现了很多的协同过滤算法,这些协同过滤算法大多是只利用用户对该产品的整体评分进行预测。然而,用户对产品的整体评分并不能够给我们提供足够多的详细的信息。例如,一个用户对一个产品给予了很高的评分,这预示着他对这个产品非常的喜欢和满意,但这并不代表他喜欢该产品的所有特征。同时,当用户对一个产品做出整体评价的时候,他对于该产品的不同的特征有着不同的偏好,这种偏好信息决定了用户对该产品的整体评价,并且用户在这些特征上的偏爱程度在不同的产品之间也是不一样的。为了解决这些问题,在这篇文章中,我们提出了一个整体的框架。在这个框架中,为了预测用户对一个产品的满意度,我们集成了用户在产品的各个特征上的意见信息和偏好信息。这个框架总共分为三部分,他们分别是基于特征的意见挖掘部分、基于特征的权重计算部分和评分推断部分。在意见挖掘部分中,我们利用意见挖掘技术来从用户的文本评论中提取产品的特征以及用户在各个特征上的意见,从而计算出用户在产品的各个特征上的评分。在特征权重计算部分中,我们利用用户在产品上的整体评分通过张量分解方法自动的推断出用户在不同的特征上的偏好。评分推断部分是基于用户在各个特征上的评分以及权重推断出用户在产品上的未知的评分。我们利用两个数据集对我们的方法进行评估。同时,我们也将我们的方法与几个基准方法进行了比较,实验结果显示出我们的方法要比基准方法好。这篇论文的主要贡献如下:(?) 我们提出了一个新的预测用户整体评分的协同过滤模型,该模型集成了用户在产品的特征上的偏好信息和意见信息。(?) 我们利用张量分解的方法来获取用户的特征权重,这一过程缓解了数据的稀疏性问题以及减少了模型的参数的个数。(?) 我们再次利用张量分解的方法来预测用户的整体评分,该张量是由用户的加权的特征评分以及整体评分组成的。利用这种方法的主要优势在于它获取了用户、项以及特征之间的内在联系。(?) 我们在数据集上进行实验证实了我们的方法的有效性。
其他文献
服务器作为网络游戏的核心支撑系统,其设计和制作成为游戏开发的关键组成部分。本文提出了一个可行的解决方案,目的是提供一个稳定可靠的游戏服务器平台,降低后续网络游戏的
本文针对于现在的分布式系统或网络中的错误检测和诊断问题,提出了将依赖关系矩阵演化为依赖关系树,并且充分利用依赖关系树的特性,研究出基于此依赖关系树的适应性探测算法,
本项目的研究内容是面向大型机械设备——双进双出磨煤机的智能化嵌入式状态监测系统。双进双出磨煤机主要用于火力发电厂,为直吹式锅炉磨制煤粉。由于双侧输入原煤、输出煤
概念层次(Concept Hierarchy)是指将大量的概念用层次化的方法组织起来,使得子概念所包含的意义比它的父亲更加特殊,可以被其父概念所概括。层次化的概念模型与普通的平面概
电子投票允许人们通过网络就某一议题进行投票来表达自己的看法或是意愿。电子投票以其方便、高效、低廉的成本,自提出之日其就引起了人们极大的兴趣。随着今天网络的发展与
随着Internet上Web服务数量的日益增多,如何从众多的服务中准确地找到符合要求的服务成为服务发现的难点和关键。基于UDDI(Universal Description,Discovery and Integration,
XML作为一种标记语言,具有有效的表达各种信息、数据和使各种应用协同工作能力,有望成为下一代互联网信息交换的标准。XML数据的存储、查询和绑定的理论和技术是当前XML的研
文本分类是机器学习与信息挖掘中的一个传统问题。不同于类别较少且均处在同一层面的传统分类任务,本文所谓“层次型分类”是指类别间存在一个树状的层次结构;并且本文所谓“大
随着Internet中各种技术的迅速发展,网络应用不再局限于文件传输、电子邮件等传统应用,一些新型的移动业务正在不断地出现,因此下一代互联网NGI(Next Generation Internet)应
近几年来,互联网技术蓬勃发展,信息爆炸使得人们对于信息和资源的检索提出了更高的要求。随着网络技术的不断发展,信息检索的各项技术以及搜索引擎的性能都得到了很大的提升。