论文部分内容阅读
随着网络技术的迅猛发展,数据量爆炸式的增长给人们信息的筛选带来了问题。因此一些研究者提出了使用推荐系统来更加有效的提取具有价值的信息。推荐系统的目的是帮助人们从大量的信息中挖掘出满足自己潜在的需求,同时实现对冗余信息量的剔除。早期的推荐系统起到了一定的效果,然而这种推荐方式并不具有针对性,对于需求标准高的人来说,这些结果很难符合他们的意愿。因此随着用户需求标准的提高,需要一个更加精确的针对用户个性化的推荐系统。在电子商务领域,推荐系统一般通过挖掘并分析用户的显式行为和隐式行为来完成推荐。显式行为一般包括用户对商品的打分等直接评价,而隐式行为则主要包括浏览信息、收藏记录、评论、上下文信息等间接评价。由于评论信息以短文本的形式出现,有人分析评论短文本提取特征词来构建评价标签,便于用户形成对商品的直观感受。然而对于评论短文本中潜在的情感,并没有有效利用。因此本文提出了一种面向短文本情感分析的个性化推荐方法,该方法首先根据几种常见的中文词典采用Trie树并利用隐式马尔科夫分词模型挖掘每个分数段中用户对于商品的评论短文本中的特征情感词,获得文本中的情感特征词汇,统计每类分数中的主要相关特征词及其权值,构建通用特征情感词库和满足用户个性化的情感特征词库。然后使用基于余弦相似度的朴素贝叶斯分类方法,结合用户个性化情感词库和通用情感词库中根据特征词分布情况赋予相应的分数。最后构建用户的信息组建用户-个性化情感项目评分矩阵,给出推荐。最后,本文利用爬虫技术抓取国内某电商网站上用户对服装类商品的评论信息作为实验数据集,对本文提出的面向短文本情感分析的个性化推荐方法和SVD协同推荐方法以及基于项目的推荐方法进行对比实验,结果显示本文提出的方法可以有效的提升推荐效果。