论文部分内容阅读
以用户主导的Web2.0技术已逐渐替代传统互联网模式成为目前音乐服务的主流技术。然而由于其允许用户自由上传和分享音乐相关数据容易导致出现信息过载的问题,海量的数据给音乐消费者和提供商都带来了挑战。个性化音乐推荐技术作为解决信息过载的有效方法成为当前音乐服务领域的一个研究热点。本文从隐式反馈信息着手,针对如何提高推荐性能、实现语义解释性和解决冷启动这些音乐推荐中的几个关键问题展开研究。一方面为了提高音乐推荐的性能和实现推荐的语义解释性,提出了一种基于带权重社会化标签的改进内容过滤音乐推荐方法。使用社会化标签表示歌曲内容,并通过用户行为分析为标签分配不同权重,建立基于带权重标签的用户兴趣模型,然后依据候选歌曲与兴趣模型间的匹配程度进行推荐。与传统内容过滤方法的对比实验表明,预测跳过的命中率提高了6.12%,准确率、召回率和F1-measure平均分别提高了1.68%、0.748%和0.751%,并且得益于带权重标签的用户兴趣模型,可以更好地解释用户兴趣,因为权重越高的标签暗示着用户更喜欢的信息,反之亦然。另一方面为了解决推荐系统因为数据太少而出现推荐准确率低的冷启动问题,提出了一种基于社会化标签与用户属性混合的音乐推荐方法。另外,针对用户往往由于隐私保护的考虑导致系统中用户属性信息稀疏的问题,本文还提出了一种基于隐式反馈的用户属性预测方法,通过分析已知属性用户的记录建立TFIDF属性分类模型,接着根据分类模型来预测未知用户的属性。然后利用得到的用户属性信息,建立基于属性过滤的推荐方法来启动行为数据稀疏的用户推荐进程;最后线性结合属性过滤推荐和带权重社会化标签的改进内容过滤推荐方法,得到最终的混合推荐模型。一方面,属性预测验证实验表明,该方法在预测年龄、性别和国籍上准确率分别达到91%、99%和93%,另一方面,Top-K音乐推荐对比实验表明,当推荐数目大于十时,基于混合推荐方法比单一内容过滤推荐方法在准确率上平均提高了0.46%,其最大值为98.5%。本文以隐式反馈信息为主要推荐因素,提出了基于带权重社会化标签的改进内容过滤音乐推荐方法、基于隐式反馈的用户属性预测方法和基于社会化标签与用户属性混合的音乐推荐方法。本文的研究成果将有助于为用户提供更准确、更多样化的个性化音乐推荐服务。