基于评论挖掘的协同过滤推荐算法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:YANCONG1103
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,“信息过载”的问题使得电子商务推荐系统面临着如何定位用户兴趣及时提供准确产品的瓶颈。而协同过滤算法是在诸多推荐系统中使用最广泛和有效的算法之一,但推荐准确性与数据稀疏性等问题一直都是影响该算法效果的重要因素。本文利用电子商务社区中丰富的用户评论信息,通过结合用户偏好相似度来改善传统协同过滤算法的推荐准确性,并通过相似度传递,在一定程度上缓解数据稀疏性带来的问题。   本文首先对国内外电子商务推荐算法进行了深入的分析,在此基础上,提出了基于评论挖掘的协同过滤推荐算法。本文通过中文词性的句法统计分析,从评论语料中挖掘出产品特征词和情感词的常用词性模板,并利用这些模板提取产品特征词和情感词。之后利用提取出来的产品特征词和情感词划分产品的关注层面,并从评论中量化出产品各个层面的分数,最后根据学习到的用户偏好及历史评分数据,计算用户偏好相似度与评分相似度进行协同过滤推荐,并通过相似度传递缓解了数据稀疏性带来的问题。实验结果表明,在数据稀疏的情况下,本文提出的算法在推荐准确性方面较传统的协同过滤算法有明显的提高。
其他文献
近年来,信息技术不断发展,互联网络技术在人们的生活中发挥着重要的作用。随之产生的海量数据中存在着大量未被挖掘的信息,没有有效工具的帮助,人们在寻找有效信息的过程中耗
电子邮件是当前互联网上使用最为广泛的服务之一,随着互联网及应用的不断发展,垃圾邮件大量蔓延,造成社会生产力的极大浪费。因此垃圾邮件过滤非常必要,具有重要的理论意义和社会
多视图的学习在最近十几年引起了众多研究人员的极大兴趣和关注。而传统的模式识别和机器学习的方法多是集中在单视图上进行的。这些单视图方法往往通过独立、交替的方法训练
随着互联网的迅速发展,网络问答系统成为一种具有应用前景的远程教育模式。目前国内多数教育问答系统对用户提出问句的理解仍然局限在关键词匹配的模式,反映了实用性和智能性的
随着人工智能的发展,人们对这个领域的研究不断深入。对类似真人发音的语音生成和获取的控制,是机器人发音系统急需解决的问题。DIVA(Directions Into Velocities ofArtculators
无线传感器网络是一种无基础设施的网络,它由一组传感器节点以自组织的方式构成,其主要目的是协作感知、数据采集和处理网络覆盖区域中的感知对象的信息,最后将经过处理得到详尽
数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。数据仓库中的数据量非常大,并且在逐年增大。因此提高查询速度是数据仓库必须要
互联网的快速发展及电子信息的迅猛膨胀带来了严重的“信息爆炸”问题,用户可以通过网络获取到最新信息,同时,鉴于网络的开放性这一特点,用户就会不可避免的接触到暴力、色情、封
"十一五"以来,在党中央、国务院和地方各级党委、政府领导下,各地、各有关部门认真贯彻落实国务院《关于进一步加强消防工作的意见》,我国消防工作取得了明显进步。但是,随着
人们的生活包含着各式各样的数据,许多数据中都含有很重要的信息。数据挖掘就是从海量数据中提取重要信息的一种技术。作为数据挖掘中的一个重要方法,聚类分析可以有效地将这