论文部分内容阅读
随着信息技术和互联网的发展,人们逐渐从信息困乏的时间走向了信息过载的时代。在海量信息中搜索自己感兴趣的信息变的越来越困难。个性化推荐服务作为解决信息过载的一种有效的手段应运而生,运用推荐算法自动在海量信息中快速发现符合用户个人兴趣的内容和服务。目前个性化推荐系统一般采取协同过滤或是基于内容推荐.但是协同过滤有冷启动问题和随着项目和用户数目的增多引起用户—项目矩阵变得稀疏性问题,这些会影响到推荐系统的推荐精确度。基于文本挖掘的推荐算法需要对内容本体进行分析,不能充分考虑用户的兴趣。针对协同过滤和基于内容过滤算法各自的缺陷,混合推荐算法能够取长补短,因而成为推荐算法研究领域的重要方向。本文就是通过对上述问题进行改进提高推荐精确度,主要工作如下:1、针对协同过滤中用户-项目的数据稀疏性问题引起的推荐准确度不高的问题,提出采用矩阵分解技术在同一模型中将项目内容信息,最大化使用已知信息提高推荐精确度。使用一阶正则化奇异值分解算法将用户针对网页的评分矩阵分解为用户针对隐主题的偏好矩阵和网页针对隐主题的特征矩阵,同时,在基于内容的挖掘中,一阶正则化奇异值分解进行隐语义分析,得到关键词针对隐语义和权重矩阵和网页针对隐主题的特征矩阵,在此基础上提出了结合两种网页针对隐主题特征矩阵的交替奇异值分解算法,将系统过滤中的用户评分信息和基于内容挖掘的内容信息相结合提高推荐的精确度。2、针对在普通协同过滤中计算用户相似度时,在用户评分数据稀疏的情况下引起的不准确,提出了采用用户的特征向量来计算相似度来缓解数据稀疏度,从而提高系统的推荐精确度。又因为在常用协同过滤中计算用户相似度需要在全域中进行计算计算量很大,该算法中通过K-means算法对用户按照用户的特征向量分簇,在计算最近邻集合时,在目标用户所属子簇中获取用户近邻,从而减少计算量。3、最后构建网页个性化推荐服务系统,结合以上算法进行混合推荐。