论文部分内容阅读
学术虚拟社区是学术观点在非正式交流平台一种更快捷、高效的沟通模式,其知识的共享与传递补充了学者在正式交流情况下的不足之处。而学术虚拟社区间用户的互相评论、回复关系代表了一种潜在的对被回复对象的关注,且这种回复间的关系呈现一定规律形式,用户间的回复与被回复类似于引文关系代表了其话题关注的风格与观点认同。本文基于Barabasi和Albert(1999)无标度理论,即一种具有幂律分布特征的复杂网络,将其引入学术虚拟社区的分析。无标度网络的构建是把具有相关联系的人和关系,抽象成节点与连线,构造成一个复杂网络集合,对网络内部节点与节点、节点与子群的分析,探究内在特征与相似性,挖掘小团体。而学术社区的用户之间存在一定的关系,则可将用户看作节点,发帖/回复看作是两两间的关系线段,通过研究用户构成的复杂网络,认识其内在的特性与相似度大的用户构成的小团体,了解知识传递与共享的模式,促进学术虚拟社区信息交流与控制,为后续研究提供借鉴意义。论文首先系统的总结了复杂网络的演变,由简单网络、随机网络演变至今的复杂网络之无标度特性与小世界特性等理论,并总结了学术虚拟社区的不同定义与特点。以及前人对相关研究的实证分析与理论总结。选择特定专业的学术论坛的用户间构建复杂的无标度网络图,进行社会化分析,并进行深入用户群体间相似性挖掘,可发现学术用户的关注情况及话题氛围。论文数据来自丁香园网站中的肿瘤医学讨论版信息,在完成网页信息数据抓取与整理的基础上,从用户本身基本属性、用户间回复共现次数、用户间互回复次数角度挖掘该讨论版的核心区域用户群,识别小团体核心用户,发现小团体主题流派等规律的研究。论文先将获取论坛讨论版的用户间回复共现数据与互回复数据全貌,再基于数据关系矩阵基础上,构建用户间共回复无标度网络与用户互回复无标度网络,利用复杂网络特征指标计量分析学术虚拟社区中核心用户的控制力与权力。最终采用多种方法,核心边缘分析、k-core、系统聚类、多维尺度分析法结合用户自身发帖主题与身份信息,按论坛主题分为四大主要流派:1)关于肿瘤医学前沿进展、国际会议文献指南等重要最新文献的信息检索与共享2)关于化学治疗手段的探讨3)关于物理治疗方法与临床实践讨论。4)关于求医问药类非学术用户与学术权威的信息交流。通过比照用户的主要高得票发帖题目内容和其基本身份信息,可以说明本文所得话题划分基本是合理的。结果显示从复杂网络角度去研究学术社区网络的用户群体、挖掘结构团系,话题流派是可行的。本文在传统网络计量方法的基础上,选取肿瘤医学领域学术用户为研究对象,从回复认同的角度研究用户群体。将聚类分析、社会性网络分析等方法与可视化结合挖掘学术用户的话题流派将可能是本研究的创新,同时论文利用核心用户的高得票文献对结果进行了验证说明。基于上述研究对肿瘤医学版块信息交流、知识分享进行了分析。