基于评论分析的协同过滤推荐算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:ytzhjx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
个性化推荐系统可以帮助用户在海量的项目集合中找到他们喜爱的项目,其被广泛地应用于电子商务网站、在线内容提供平台以及社交网络平台中,并成为这些网站提升服务质量的重要技术之一。其中,协同过滤方法是最成功的推荐方法之一。利用集体智慧的思想,协同过滤可以产生精确的个性化推荐。然而,传统的协同过滤推荐系统面临着数据稀疏和冷启动问题,即,当用户、产品的交互信息非常稀疏时,协同过滤算法常常会失效。近年来,随着在线用户反馈信息的爆炸性增长,伴随着评论的评分反馈也越来越丰富。这些评论包含着用户和项目丰富的信息。本文通过对评论文本的分析,提出了两个改进的评分预测方法,在数据稀疏和冷启动的情况下,显著提高了评分预测的精度。第一,本文提出了一个基于文档向量和回归模型的评分预测框架,它利用文档向量表示模型将非结构化的评论文本用相同维度的向量表示,进而构造出刻画用户和产品的特征向量,并使用这些向量和用户与产品的偏置一同构造用户-产品对特征实例集,最终融合多个回归模型进行评分预测。框架使用文档向量模型,为用户-产品对构造了较为精确的特征空间,并利用高效的回归模型,使得其数据稀疏时的评分预测精度显著地优于传统的协同过滤方法。第二,本文提出了一个基于方面情感统一模型(ASUM)的潜在因子作为主题(HFT)的扩展模型:评分即情感(RAS)模型。由于文本评论中不仅包含了用户对产品的不同方面的关注情况,还包含了对特定产品具体方面的情感,这些情感在很大程度上影响了用户的评分。因此,RAS将用户在评论中表达的情感与评分相关联,相比于基准模型,它能够学习更加精确的用户和产品的潜在因子。在基于真实的数据集上的实验表明,本文提出的两个方法显著改善了数据稀疏的情况下评分预测的准确性。
其他文献
随着信息服务业的不断发展,基于用户个性化的主动信息服务作为一个新的研究热点和一种新型的信息服务模式,得到了越来越多的关注。本论文对旅游多媒体信息主动服务系统进行了
随着多媒体技术在网络和人们生活中的广泛应用,近年来,多媒体数据库管理系统(MMDBMS)方面的研究倍受关注。多媒体类型繁多,结构复杂,语义丰富。当前已有的MMDBMS 缺乏对各种媒体
文本分类是大规模文本处理的基本功能,也是提高其他文本处理功能和质量的有效手段。通过文本分类,人们可以按类别进行文本存储、检索和进一步处理。因此,迅速有效地对文本进
近年来,自动取款机(ATM)在各商业银行大量投入使用,在方便用户存取款的同时,也带来了越来越多的ATM机纠纷案件和金融犯罪,而目前的银行系统由于缺乏智能化监控手段导致此类犯
隐喻的机器处理已成为自然语言处理研究中的热门课题,隐喻处理的好坏将直接影响到机器对自然语言理解的程度,并对机器翻译、搜索引擎和情感计算等领域有着重要的推动作用。隐喻
随着网络技术的发展,网络应用的不断增多,网络带宽的不断增大,用户个性化服务需求的不断增强,用户对旅游景区在线视频的需求也会越来越大。旅游景区在线视频主动服务系统通过
空间数据模型是GIS空间数据组织和数据处理算法设计的理论基础,对地理信息系统的发展有决定性作用。Internet的飞速发展使得人们对于Web环境下的空间信息的获取需求日益明显,
如何对图像内容进行识别并确保它的真实性和完整性是信息安全领域的研究热点。图像感知哈希通过合理方法对图像数据进行降维处理,用能够表示图像本质内容的感知摘要来表征原
图像分割是图像处理的重点和难点之一,至今仍然没有一个通用且有效的图像分割算法能满足各种不同的需要,这也正是图像分割算法的研究价值所在。在医学图像处理中,虽然支持向量机
时间序列能够反映工业、经济、气象、交通、能源等各个领域中的不同现象和过程,客观地记录这些现象和过程的演变规律。如果能够很好地掌握和运用这些规律,就可以规避风险、优