论文部分内容阅读
信息的指数爆炸带来了信息过载问题,从而产生了分类目录技术和搜索引擎技术,然而分类目录只能覆盖热门分类,搜索引擎只能由用户主动输入关键词检索信息,于是个性化新闻推荐系统应运而生。单一的算法很难从多个角度为用户进行推荐,易导致推荐结果多样性欠缺。为提高推荐的准确率和多样性,本文就目前已有的推荐算法展开研究,结合传统的推荐技术设计了混合加权的新闻推荐策略,将基于内容的推荐算法和基于用户的协同过滤算法按不同权重进行加权混合,使之达到取长补短的目的,提高了推荐结果的准确性,更好的为用户进行个性化的新闻推荐。本文将新闻内容建模、用户兴趣建模和混合算法建模三部分作为推荐系统的核心内容。对于新闻内容建模,首先介绍了新闻文本预处理的相关理论,针对新闻内容的特点,采取线性加权的方式进行新闻关键词的提取,并使用支持向量机实现了对新闻的分类;对于用户兴趣建模,通过对用户行为日志的收集,分析用户的新闻浏览偏好,进而完成对用户兴趣模型的建立与更新;对于混合算法建模,基于内容的推荐算法主要通过计算新闻内容向量和用户兴趣向量的夹角余弦相似度确定新闻推荐列表,基于用户的协同过滤算法通过建立用户相似度矩阵来推荐相似用户喜欢的新闻,然后将两者召回的结果按不同权值进行加权混合,并通过多次训练得出加权效果最好的权值比,确保推荐系统的准确性。另外还设置了新闻时间阀值,对推荐返回的结果进行适当过滤,在一定程度上保障了推荐结果的时效性。论文首先通过介绍系统的背景意义及国内外研究现状确立了基本工作内容,然后就典型推荐算法进行详细描述,分析了系统需求。针对新闻推荐系统数据规模大、用户兴趣时效性高等需求,构建了本系统,勾勒出实时新闻推荐系统的框架,然后叙述了推荐系统的总体设计,并对系统的架构及关键模块的实现过程进行了详细分析,为用户提供了更加个性化、实时化的新闻推荐。