论文部分内容阅读
随着互联网技术的高速发展,网络上数据已呈爆炸式增长。海量的数据一方面使人们更加容易的获取到丰富的信息,另一方面人们却不得不花费大量的精力和时间来搜索对自己有用的信息,信息超载问题越来越严重。面对海量的数据资源,传统的搜索引擎已经无法满足用户的需求,个性化推荐系统成为时代的新宠。个性化推荐系统通过分析用户数据,捕获用户的兴趣,向用户推荐其感兴趣的信息或商品。本文针对现有推荐系统存在的冷启动、数据稀疏性、准确率低等问题,引入目前研究热点——机器学习方法,进行了迁移学习的跨域推荐、多源多任务的兴趣推荐、BP-RNN的混合推荐以及基于本体的旅游推荐研究,为实现个性化推荐设计了相应的算法研究。论文的主要贡献包括:针对单一域数据的稀疏性问题,提出迁移学习的跨域推荐算法模型CTR-TL。该模型依据各个域上的数值评分数据,结合各个域上的评论文本信息,对各域进行单一域内的建模。并依据各个域上的数值评分数据挖掘域间联系即迁移模式,对各域间进行跨域建模。最终,结合单一域内建模和域间的跨域建模,同时对多个域进行联合的建模,实验证明模型CTR-TL可实现良好的跨域推荐效果。针对现有推荐算法准确率低的问题,提出多源多任务的兴趣推荐算法。首先利用用户多个社交网络的个人信息,构建表示兴趣之间关联程度的树状图;然后基于Web的兴趣文本表示,用包含标签词汇及其权重信息的文本来代表兴趣,结合用户多个社交网络的多源多任务进行兴趣推荐研究;最后构建兴趣的共现矩阵,可提高准确率和召回率。针对已有推荐算法鲜有考虑时序问题,提出BP-RNN混合推荐算法。针对在短期推荐系统的用户消费最有可能取决于最近行为的现象,建立一个循环神经网络,使用门控循环单元解决时间序列的问题。循环神经网络将用户近期行为视为一个序列,每个隐藏层按顺序模拟每一位用户的行为或喜好。将循环神经网络与反向传播神经网络相结合,可获得更好的预测精度。针对推荐算法在多标准下少有优越表现的问题,提出基于本体的旅游推荐算法。首先构建适合旅游领域的旅游景点本体,接着采用FP-Growth算法挖掘访问不同景点的用户之间的关联规则,然后将协同过滤算法根据用户的不同分别改进成TEUCF算法和TAUCF算法。针对关联用户采用融入时间因子及具有特色的评价因子的协同过滤算法,将推荐结果进行上下文信息的过滤,从而更准确全面且符合实际情景。本文提出的算法在不同方面均有较好的表现,实现了推荐算法的个性化,推进了机器学习在推荐系统领域的实用性。