论文部分内容阅读
随着互联网技术与Web2.0应用的发展,在线社交媒体已经成为信息传播、信息获取、信息共享与个体创造内容的重要平台,由此产生了信息过载问题。同时用户产生的在线应用数据往往包含用户敏感信息,这些信息的发布与传播带来了用户隐私泄露的风险。社会化推荐技术将用户在线社交数据与社会属性信息应用到推荐结果中,以帮助用户过滤冗余信息并获取个性化的推荐服务。然而在当前在线社交媒体上如何有效提取用户社会网络信息应用于社会化推荐、如何在帮助用户获得准确推荐结果的同时尽可能保护用户隐私成为具有理论与实践意义的研究难题。针对社会化推荐面临的问题与挑战,本文阐述了社会化推荐的应用领域与技术特点,概况了与社会化推荐相关的隐私保护技术特征。接着以在线社交媒体中的用户社会网络信息提取和社会关系感知模型作为出发点开始本文的研究工作,根据社会关系感知模型所反映的用户网络信息利用与用户隐私保护问题,分别从用户信任网络的量化计算角度和用户社会网络层次刻画角度深入开展了信任网络上的随机游走推荐机制以及社会化推荐隐私保护机制的研究。在社会关系感知模型方面,给出了统一的在线社交应用情景描述方法,使用该方法可以将不同的在线社交应用情景映射到自我表达与社会存在两种分类维度中进行研究。给出了在线社会关系实体属性及关系约束条件的形式化表达,从复杂的情景对象中抽象和精炼出情景的主要成分,为用户社会网络信息的有效提取提供可操作对象。本文利用社会关系感知模型从在线社会关系强度和社会关系信任值两个方面考察了不同在线社会关系类型对相关在线社交应用情景下的社会化推荐效果的影响。研究结果显示:(1)针对特定在线社交应用情景下的社会化推荐方法需要细分社会网络实体类型,考虑社会同质性现象对在线社会网络实体属性的影响。根据这一结论,提出了利用在线社会网络实体交互行为与交互模式作为实体相似性与同质性的外在表达形式。(2)相比于社会关系强度,社会关系信任值存在更强的非对称性,可细分并刻画社会网络实体的个体属性特征。在基于信任网络的随机游走推荐机制的研究方面:(1)提出一种基于目标实体社会网络结构的全局信任网络构建方法。该方法考虑目标实体社会网络结构属性信息,结合实体在线行为特征向量的相似性来量化表达实体间的信任值,在此基础上构建起实体的量化信任网络。该方法是一种基于实体网络结构信息的信任度量方法,相比于传统方法,其优点在于融合了实体在线行为特征的余弦距离,从而在社会化推荐过程中能更快发现网络中的推荐节点。实验结果表明,该方法能有效发掘具有相似在线行为特征的实体。(2)提出一种基于实体信任网络的随机游走推荐方法。该方法以实体量化信任值作为信任网络中随机游走的概率偏好,根据游走节点的行为特征属性与游走步长停止概率计算因子,快速发现目标推荐节点,提高推荐产生效率。利用条目相关系数的计算与条目实际评价域值,生成目标实体在目标条目上的推荐结果。在信任网络上的实验结果表明,相比于几种典型的推荐方法,该方法能有效应对冷启动与稀疏评价矩阵问题。在社会化推荐隐私保护机制的研究方面:(1)提出一种基于差分隐私的社会网络层次化构建方法,利用连接概率值来替换节点网络边信息,在此基础上将噪音信息注入到概率值集合中,生成与输入网络结构属性相匹配的净化网络,该生成的净化网络能够满足-差分隐私保护条件。在包含敏感用户信息的社会网络数据上的实验结果表明,生成的净化网络能够匹配原始网络的结构信息,并且能有效控制注入的噪音信息量。(2)针对净化网络对社会化推荐效用的影响,提出一种社会化推荐效用的度量方法。该方法定义了效用函数的可交换性与集中性特点,通过计算目标推荐节点的共有邻居节点数来分析净化网络的隐私边界,给出了社会化推荐隐私保护与社会化推荐效用之间的限制条件。综上所述,本文研究了面向社会化推荐的社会关系感知模型、信任网络上的随机游走推荐机制以及社会化推荐隐私保护机制等问题;给出了统一的在线社交应用情景描述方法,从在线社会关系强度与在线社会关系信任值两个方面考察了不同在线社交应用情景下的社会关系;提出一种基于目标实体社会网络结构的全局信任网络构建方法以及在此基础上的随机游走推荐机制;针对社会化推荐隐私保护问题提出了一种基于差分隐私定义的净化网络生成方法,并分析了隐私保护与社会化推荐效用间的限制条件,在推进社会化推荐与隐私保护机制的实用化方面具有较强的理论和应用价值。