论文部分内容阅读
推荐是一种典型的数据驱动型应用,其聚焦项目与用户的精准匹配,在电子商务、移动服务等领域发挥了重要作用,并对人们生活产生积极影响。作为推荐系统的核心构建,推荐算法的性能对提升用户体验和加强用户黏度起着决定性作用。随着推荐项目和应用服务的不断丰富,推荐相关数据不断更新、数据规模不断扩大,同时也让数据呈现了很大的稀疏性。上述特征对提升推荐性能、优化推荐应用等研究了极大挑战,如何基于现有推荐数据特征研究高效推荐算法并支持推荐增量更新等问题,具有重要应用价值。 本文首先对现有推荐理论和推荐算法展开对比分析,然后针对推荐数据稀疏性问题对推荐性能的影响,深入研究了协同过滤算法在推荐应用中的有效性及其优化空间;进而引入用户聚类策略将大规模数据集分解成适合推荐优化的多个小规模数据集,并构建用户相异度矩阵,研究了有效的推荐方法,提升了推荐性能并支持推荐增量更新。本文主要研究内容与贡献如下: (1)针对推荐数据集的高维度和稀疏性导致的推荐性能问题,以及协同过滤算法对时间的不敏感性,研究了基于协同过滤的改进算法(CT-CF),其通过重构类别评分矩阵,设计时间效应函数,有效解决数据稀疏性和用户兴趣随时间变化对推荐性能的影响,提升了推荐准确度。 (2)针对推荐计算中频繁的相似度计算的计算效率问题,研究了一种协同过滤和聚类方法相融合的推荐算法(MCT-CF),其通过引入聚类方法对用户进行有效分组,有效减小了相似用户查找范围,同时让多个分组可以并行开展推荐计算,在保证推荐准确度的基础上,解决了算法的可扩展性。 (3)针对新的推荐数据到达对推荐性能的影响,以及传统协同过滤方法基于整体数据集产生推荐项目、应对推荐数据变化不足的问题,本文研究了推荐的增量更新问题,通过重构基于类簇的用户相异度矩阵设计了支持增量更新的推荐算法,有效地保证了推荐数据变化时,及时快速地生成推荐项目。 本文围绕上述各项工作中的推荐模型和算法,开展了充分的理论分析和基于真实数据集的实验验证工作,并与传统的推荐算法进行了对比分析,充分验证了建议方法的有效性。