论文部分内容阅读
随着科学技术的发展,社交网络平台的兴起,人们获取信息的方式变得多样化,人们的社交关系通过社交网络平台实现了即时交互,资源共享,极大地加速了人们获取信息和传播信息的过程。人们不仅是信息的接收者,同时也是信息的传播者。近年来,人们开始关注社会网络上的扩散问题,观察社会网络上信息、观点、谣言等的传播过程,挖掘隐藏在社会现象背后的真理。其中,扩散模型的构建和影响力的分析尤为重要,扩散模型的构建可以帮助我们探索社会活动的规律,模型上影响力的分析可以帮助我们发现扩散特征,从而控制传播范围,将影响按照有利的方向引导。目前的扩散模型主要模拟了传染病、信息、创新、产品等的扩散过程。众所周知,知识的传播扩散对人类社会的发展至关重要。知识是数据的解读和提炼,依托社会网络传播知识越来越普遍。但是目前的扩散模型却很少关注知识的扩散过程,而且,传统的扩散模型用节点来表示社会参与者,仅通过节点的有限状态(激活状态、非激活状态等)来描述扩散的过程,社会网络中人与人之间的知识交互很难模拟出来,具有一定的局限性。基于此,本文提出了一种基于社会网络交互的群体知识获得模型(Crowd-based Knowledge Acquisition),旨在模拟知识在人群中的扩散过程。该模型引入了agent来表示社会参与者,重点关注网络结构特性对知识扩散的影响。具体来说,该模型基于多个agent构成的社会网络,agent以分散的方式收集和处理数据,每个agent仅能管理自己的数据。数据代表信息,agent具备把信息内化为知识的学习能力,并且可以通过交互来提升自己的知识。模型主要分为两个阶段,初始化阶段,每个agent收集自己的数据,根据其独立地内化为知识模型。演化阶段,agent进行交互,包含了信息和知识的交互,我们假设agent之间的交互是双向的,数据的交互扩展了agent接收到的信息,而知识模型的交互让agent可以采纳与其信息最匹配的知识。随着多轮交互的进行,个体的信息和知识在网络中逐渐扩散,agent通过交互最终达到知识模型的统一。本研究用决策树作为agent的知识模型,因为决策树是数据属性之间关联规则的自然模型,不仅常用于知识获取,而且在集成时,随机构建的决策树的集合通常表现出非凡的鲁棒性和可靠性。本文的研究内容主要分为以下四个方面:(1)在微观层面,本文关注影响个体agent知识可靠性的位置属性,探索agent的中心性是否能为它获得可靠的知识提供优势。研究发现传统的扩散模型并不能真实的反映个体位置对知识获取的影响,如独立级联模型。本模型展现出离心率小的agent在获取可靠知识时更具优势。(2)在宏观层面,本文观察了影响整体agent知识可靠性的结构特征,如密度、聚类系数。本文比较了完全图网络、星图网络、线图网络、小世界网络、无标度网络、随机网络和一系列真实网络,发现越密集的网络越容易传播可靠的知识。(3)基于群体知识获得模型,本文还探究了知识的影响力问题,旨在通过小部分agent来扩散可靠性高的知识模型,从而提升整体agent知识模型的可靠性。研究发现,经典的影响力最大化问题与知识的影响力问题有一定的相关性,影响力最大化算法同样可以用于解决知识的影响力问题。(4)为了验证模型的合理性,本文进行了大量的实验。本文用到了11个生成网络,包括小世界网络、无标度网络和随机网络,3个特殊网络,包括完全图网络、星图网络和线图网络,7个真实社会网络,包括世界贸易网络,俱乐部网络,通婚网络、动物网络、Facebook网络。同时,本文还用到了3种不同的监督学习数据集。实验结果表明,本文提出的交互机制可以促进可靠性高的知识扩散,同时还验证了许多重要的结构见解,与真实的社会情况高度一致。