论文部分内容阅读
随着信息的爆炸性增涨,信息过载问题越来越严重,帮助用户更快的找到想要的资源一直是研究的重点,推荐系统一直在其中扮演重要的角色。邮箱平台中一直包含着非常多用户的私人特征,也是人们日常生活必备的工具之一,目前在国内邮箱平台系统中,通过推荐系统进行个性化广告推荐的研究还较为空白。本文根据邮箱平台的特点,提出了针对邮箱平台推荐系统——基于用户和基于项目的混合协同过滤算法,通过分析用户邮件信息通过中文分词等方法生成用户兴趣特征矩阵,抓取图书数据作为推荐广告的数据库,根据用户-项目评价矩阵,计算用户近邻集和物品近邻集,通过近邻集对项目评分预测产生初始推荐结果;本文的主要工作和创新有以下几点:1、本文主要研究了基于用户的协同过滤算法及基于物品的协同过滤算法,针对传统协同过滤推荐算法的不足之处,根据邮箱平台特点,提出了针对基于邮箱系统的混合协同过滤算法和框架,并在此过程中针对推荐系统的冷启动问题,提出了通过word2vec算法进行词拓展的方式来解决该问题,实验证明取得了良好的效果;2、根据邮箱平台特点,提出了一种新的计算用户相似度的算法——用户多维相似度:通过用户兴趣特征矩阵之间余弦相似度的计算,得到用户的直接相似矩阵;根据邮箱用户社交网络特点,得到用户间信任度矩阵;根据用户对物品评分的相似性,求得用户的项目评价相似度,然后将三种相似度矩阵线性加权后得到优化的用户多维相似度,实验证明多维相似度能更好地描述用户之间的相似关系;3、改进了基于物品的协同过滤的算法:计算物品间特征向量的相似度,得到物品-物品相似度矩阵,在用户-物品兴趣度矩阵的基础上,根据用户对物品的历史评价矩阵,得到目标用户对项目的兴趣度,形成基于物品协同过滤的优化算法,然后根据Top-N算法得到推荐系统对用户的推荐列表;4、提出了一个基于邮箱平台中的社交网络信息的用户信任度计算方法,并将该相信任度运用到协同过滤推荐算法中,提高了推荐系统的精度;并根据邮箱系统评分特点,提出了修正杰卡德相关系数的邮箱用户评价相似度计算方法;上述算法的提出,很好的满足了邮箱平台个性化推荐的特点,在实验中取得了非常好的推荐效果。