论文部分内容阅读
近年来,随着互联网金融时代的来临,国内的P2P (Peer-To-Peer Lending)网贷平台呈爆炸式增长,由于每个平台运营模式的差异导致其推出的理财产品参差不齐,这样一来市场上便充斥着各种各样的理财产品。面对如此繁多的P2P网贷平台,投资者很难在第一时间内挑选出适合自己的网贷产品,再加上当前缺少严格的行业监管,更加使得优良的网贷产品与大量的潜在用户失之交臂。正鉴于此,市场上又出现了一批专门针对P2P网贷的垂直搜索平台,但是当投资者不太明确自己需求时,这些搜索平台就很难发挥作用。本推荐系统不仅解决了P2P网贷产品的信息过载问题,而且拟补了搜索引擎的不足,最终使投资者与网贷平台达到共赢。本文首先介绍了P2P网贷与推荐系统的发展现状,并分别针对基于项目的协同过滤、基于内容的推荐算法进行了调研,其次,基于这两种推荐算法设计出混合推荐系统的架构以及推荐流程,并重点介绍了系统相关模块的实现原理,最后,针对本推荐系统进行测评,总结本系统中的不足与展望下一步工作。本文的主要内容包括:(1)详细描述了本系统的需求分析,设计出本系统整体架构和混合推荐算法,并将系统分为四个模块:爬虫模块、离线计算模块、在线计算模块、数据存储模块;(2)爬虫模块采用分布式架构设计,不仅可以抓取多个网贷平台的产品数据,而且支持对每个爬虫节点的任务进行管理、远程监控;(3)离线计算模块采用了Mahout算法库中ItemCF、Kmeans算法,并运行在Hadoop平台上,最后将计算结果保存到HBase中;(4)在线计算模块主要采用了Storm平台实现,它会根据不同的推荐功能为用户实时地推荐网贷产品。(5)针对本推荐系统进行测试和评估。基于以上内容,本文构建出了一套基于混合算法的P2P网贷产品推荐系统。实验证明,借助离线计算与在线计算的数据处理能力、混合推荐算法的优势有效地解决了信息过载的问题,为投资者提供更加个性化的P2P网贷产品。