论文部分内容阅读
近年来,在线社区逐渐成为互联网用户进行交互和内容获取的主要方式之一。由于具有丰富的内容和多样的用户交互功能,在线社区吸引了越来越多的用户参与。随着在线社区的流行和用户的增多,用户创建内容的规模呈指数级增长。面对着用户创建的海量内容,终端用户往往很难发现自己感兴趣的内容。因此,能够帮助终端用户准确高效的获取感兴趣内容的信息推荐技术变得至关重要。推荐技术通过对用户历史兴趣的分析和建模,预测用户对其未看过的内容的兴趣程度。在线社区中,用户兴趣较为分散,内容数量巨大并且产生的速度快,用户隐私很容易通过静态或者动态的方式泄漏给推荐服务器或者第三方。上述在线社区的特点为推荐技术带来了新的挑战,现有的协同过滤等推荐方法在准确性、隐私保护范围和效率等方面都难以较好的满足用户的需求。因此,如何对现有的推荐技术进行扩展和深入以适应在线社区中新的用户需求是相关研究中的热点和前沿问题。针对上述在线社区推荐技术面临的新挑战,结合推荐技术领域最新的研究进展,本文所做的研究工作如下:1.提出基于用户兴趣的实时推荐技术—Farseer,能够针对具有分散兴趣的用户进行高质量的实时内容推荐。Farseer通过兴趣组来更准确的发现和组织用户兴趣,并提出基于兴趣组的协同过滤技术,解决了用户兴趣分散的问题。同时,Farseer采用实时用户上下文分析技术,实时获取用户活动和更新邻居列表,然后增量式的更新推荐内容评级值,能够提高推荐实时性。详细的实验分析表明,Farseer能够在实时的情况下,进行高质量的内容推荐,并且准确率好于当前先进的协同过滤算法。2.提出保护用户隐私的在线社区推荐技术—Pistis,能够在保护用户隐私不被泄漏的前提下做出高质量的内容推荐。Pistis通过分布式的安全多方计算来保护用户隐私不被服务器收集。同时,利用兴趣组结构打破用户公共兴趣与隐私兴趣之间的关联,有效的防止用户兴趣被其他恶意用户利用推荐系统攻击。详细的理论和实验分析表明,Pistis能够保护用户的隐私不被服务器获取,大大降低用户在面对攻击时的隐私泄漏,同时推荐质量好于当前先进的隐私保护协同过滤算法。3.提出高效的隐私保护推荐技术—YANA,能够在较大幅度提高隐私保护效率的同时不牺牲推荐质量。YANA通过分布式的用户分组,将用户进行重新组织,使用户隐私保护在一组用户之内,服务器只得到一组用户的聚合信息。每个用户组内,维护若干具有单一兴趣的虚拟用户来代表真实用户与服务器交互。真实用户根据自己的兴趣和虚拟用户获得的推荐重新计算自己的个性化推荐。由于安全多方计算是在小规模的用户组内进行的,因此避免了大规模安全多方计算的效率低下问题。实验分析表明,YANA能够在不牺牲推荐质量的前提下,较大幅度的提高隐私保护协同过滤的效率。