论文部分内容阅读
现在每天都有数以万计的用于满足人们多种需求的App被发布,我们俨然已经进入了一个智能移动终端承载的以App为主要卖点的移动互联网时代。随着各色各样的App眼花缭乱的出现在智能终端的应用商店上,我们如何从中挑选满足自我生活需求的App也变得日益困难,因此App推荐技术也越来越受到大家的重视。然而市场上大多数的App推荐系统更倾向于为App用户提供推荐服务,而不是App开发人员。我们注意到开发人员在开发一款App时,在设计阶段需要首先确定该款App的属性信息,比如App类别(游戏、音乐、社交等),App服务群体(成人、儿童等),App适用的平台版本(Android 5、IOS 8等)。然后开始进行App应用的功能模块开发,开发工作完成后,工作人员需要为即将上线的App应用写一段关于App功能的描述性文字。同时对于普通用户来说,他们了解到的App数量是比较有限的,当App用户需要挑选某类型的App应用但没有明确目标时,他们往往会依据App应用附带的这段关于App功能的描述信息来判断这款App是否满足自己的需求,从而做出是否下载或购买的决定。由此可以看出App应用的功能特性描述信息在用户选择App应用的过程中会起到较大作用,特别是对那些新发布的还没有形成较强影响力的App应用来说。受此启发,我们决定为App开发人员提供推荐服务,帮助他们写出更加具有吸引性的描述文字。在本文中我们提出了一个我们构建的主题推荐新模型,该模型负责为App开发者推荐与App流行度相关的主题信息,并提供相关主题应该在App功能描述中占有的篇幅比重的建议数值。因此我们将该模型命名为对流行度敏感的APP主题推荐模型(Popularity-Sensitive APP Topic Recommendation)。在该模型中我们首先使用Labeled LDA将App抽象化为由从App描述信息提取出的隐含主题(Latent Topic)所构成的关于主题概率的特征向量X,并将该主题特征向量X和App应用的流行度()一起来表征单个App应用,即将App表征为(,())。然后我们通过将来自同一个App类别的所有App应用以两两组对的方式来构建我们的训练数据集,并为每一对App计算这对App应用的表征信息对应的差分向量,其表示形式为(?,?())。最后我们会通过计算App流行度和每个隐含主题的相关度来为每个类别的App应用产生对流行度敏感的App隐含主题的排序表以及每个隐含主题在App功能描述中建议出现的概率。我们提出的这个主题推荐模型(Popularity-Sensitive APP Topic Recommendation)的创新点在于该模型不像以往推荐模型那样只会考虑普通用户,从而忽略了App开发人员对与App流行度相关的推荐信息的合理需求。同时我们推荐的不再是普通App推荐系统中所推荐的App,而是与App描述信息紧密相关的App主题以及建议出现概率,这些信息可以让开发人员了解到App相关特性的流行趋势,并可以据此来改善App功能描述的质量。这里需要指出我们在该模型的构建过程中选择组合使用文本处理和推荐领域已经成熟的相关技术,这大大减低了主题推荐模型的技术成本。