论文部分内容阅读
随着移动互联网的发展,移动应用(APP)累计数量达到百万级别,其中长尾现象非常严重,大量的冷门APP掩盖在热门APP下,未能被用户注意到。APP关联推荐系统希望在用户浏览当前APP的同时,为其推荐与之相关的其他APP,进而扩大整体的分发数量。本文所述的移动应用推荐系统基于百度公司的移动应用分发平台,该平台已经完成了初版的APP关联推荐系统。本文的工作正是在原有的APP推荐基础上,提出新的APP推荐模型,具体包括以下几个方面:在APP推荐系统中引入机器学习技术,将关联APP的每次点击与否作为两类分类问题,借鉴了定向广告系统点击率预估的思路。对比了应用广泛的几种机器学习分类算法在APP推荐问题上的效果,并且通过实验结果来分析说明不同分类效果的差异,从而得出在处理APP推荐问题的一般性结论。为了在语义层面衡量APP之间的相似性,引入主题模型,采用概率潜在语义分析(pLSA)技术来获取APP的文本语义特征。语义特征相比词项特征的泛化能力更强。本文设计并实现了新模型的离线策略和在线推荐系统。新系统可以完成一整套的数据获取、特征构造、模型训练和线上服务的流程。并引入了在线学习(onlinelearning)方法,实时根据用户行为调整关联结果,以获得更好的推荐效果。改进后的APP关联推荐系统已经上线,为百度移动应用分发平台,包括PC端和手机端提供更加准确的APP相关推荐服务。