论文部分内容阅读
互联网发展至今,各种新技术、新理念和新应用不断涌现,给人们生活的各个方面带来一次又一次革新。其中,社会化媒体以用户为中心,允许用户创造内容、分享内容、进而讨论内容,成为当前互联网领域内最闪亮的一颗新星。“社会化”是社会化媒体最核心的理念,它的运转基石就是用户之间的社交关系。然而,社会化媒体中的社交关系却与现实生活中的社交关系有所不同,它目前只能简单地反映用户之间“是朋友”或者“不是朋友”,缺乏真实社交关系中非常重要的“强度”属性。本文以用户间社交关系强度为研究对象,基于社会化媒体中的用户数据,研究如何自动区分用户间社交关系的强度,如何将用户间社交关系的强度信息直观地展现给用户以便于利用。本文首先介绍了研究的背景及意义,然后在对国内外研究现状进行全面综述的基础上,阐述本文研究的目标、思路和方法,概述本文的研究内容和研究框架。在理论基础部分,本文先从社会交往、社会网络和社交关系这三个层面总结相关的理论,然后重点讨论社交关系强度的影响因素及强度类型划分,最终,将影响社交关系强度的因素总结为相似性因素、时间性因素和互动性因素这三大类,亦明确地将社交关系按照强度的不同划分为强社交关系、弱社交关系和临时社交关系。在研究环境和研究工具部分,本文基于对社会化媒体的详细分析选择人人网作为本文具体的研究平台,并进一步介绍了本文研究使用到的研究工具,包括自行开发的数据采集工具、数据挖掘工具和数据可视化工具。在社交关系强度的分类研究中,本文利用监督学习的方法从人人网的用户个人数据和用户交往数据中分两个阶段挖掘最佳的社交关系强度分类模型。研究发现,基于贝叶斯网络算法的分类模型在第一阶段区分强社交关系的过程中被证明最有效,而基于Logistic回归算法的分类模型则在第二阶段区分出临时社交关系的过程中表现最佳。此外,研究还通过属性分析和误差分析发现社交关系强度的各个影响因素对社交关系强度的区分能力有所不同,互动性因素总体上对社交关系强度的区分能力最为突出,相似性因素中的共同好友数也有很好的区分能力,但唯一的时间性因素(好友最近来访用户主页时距今的天数)对于社交关系强度的区分能力没有被发掘出来。为了向用户直观地展现其社交关系强度的分布,本文利用已经获得的分类模型和数据可视化工具在网页上生成社交关系强度图谱,并且利用半结构式访谈的方法,依据可用性评价体系对图谱进行评价。评价结果显示,社交关系强度图谱基本上能够有效地反映出用户与其好友间的社交关系强度,也可以帮助用户快速地选择出不同强度的社交关系,其直观性和易理解性也让用户感到满意。在评价结果和访谈过程的分析和讨论中,笔者也发现了许多值得进一步关注的问题和需要改进的不足。本文在理论研究方面的贡献包括:1)利用了互联网环境下新的方法和新的数据,拓展了传统社会学理论的研究外延,为基于互联网的社会学问题研究提供了新的理论支持;2)对于社交关系强度影响因素以及社交关系强度分类体系的研究和归纳有助于丰富网络社会学中社交关系强度方面的理论内涵。本文在实践活动方面的贡献包括:1)有助于社会化媒体基于社交关系强度分类和社交关系强度图谱开发更合理且更细粒度的用户隐私控制功能;2)有利于社会化媒体基于社交关系强度信息实现丰富而有效的信息过滤功能;3)启发社会化媒体多角度利用社交关系强度信息优化自身的各类服务,提升用户的使用体验。