论文部分内容阅读
人类活动遍布于经济、文化、科技等各个领域,人们每天都有很多不同的事情要处理,工作、学习、娱乐、运动等等。对人类行为进行科学而系统的研究大约有百年的历史。在这一百年里,人类行为一直是社会学、心理学和经济学共同关注的焦点。经典的人类行为动力学分析中包含了一个潜在的假设--从总体上看发出人类的行为是随机和稳态的,因此,人类行为可以用泊松过程来描述,人类发出相继行为的时间间隔分布具有一个指数的尾部。然而,研究者们通过对人们的发送或者回复电子邮件等时间间隔的人类行为的研究发现这些行为表现出明显的偏离泊松分布:在这些人类行为中,长时间的静默和短时间内大量事件的爆发同时被观测到,并且他们的时间间隔分布具有明显的胖尾性质,这些发现开辟了人类行为动力学的新领域。
根据目前对于人类行为动力学的研究,我们发现人类行为动力学的方法论--从人类行为的历史记录中挖掘统计规律,不仅仅局限于对人类行为的间隔时间和回复时间的统计分析,可以拥有更广泛的应用范围。例如,我们可以用人类行为的历史数据分析和量化人类的非理性行为和从众行为。实际上,网络论坛上网民的浏览和回复行为是一种很具有代表性的从众行为。
本文我们通过对网络论坛上帖子的点击量和回复量、回复时间间隔分布的统计分析以及计算机模拟来研究网络论坛上网民的浏览和回复行为。文中,我们选取了中国的知名论坛--新浪论坛和西方的有名论坛--Chat Avenue论坛的数据进行统计分析。
通过对BBS论坛上的点击量和回复量进行统计分析来研究网民在网络论坛上的行为,统计结果显示网络论坛上帖子的点击量和回复量的统计分布服从幂律分布,并且点击量和回复量的分布具有不同的幂指数。另外,我们还进一步地发现,如果同一个主题的帖子的点击量和回复量的分布都服从幂律分布,那么这个主题的帖子的点击量和回复量之间具有非线性关系,并且这种非线性关系也服从幂律分布,即在双对数坐标下拟合的曲线表现出直线的性质。根据拟合直线的斜率和截距,我们可以定量的刻画网民的点击和回复行为。结果显示中国网民和西方网民对于点击和回复贴子的行为表现出不同的偏好--中国网民更多的喜欢点击帖子,而西方网民可能更倾向于回复贴子。
通过对回复时间序列进行统计分析,我们发现无论是连续两个回复时间间隔的分布还是以发表时间为参照的回复时间间隔都是服从幂律分布的。对于新浪论坛Chat Avenue论坛的回复时间序列的突发性和记忆性基本没有差别--拥有较高的突发性和较低的记忆性。
依据复杂网络生成幂律分布的方法--偏好依附和网络增长模型,对网络论坛上的帖子的点击量和回复量进行了计算机模拟。模拟结果与实证结果进行对比分析,可以发现点击量和回复量的幂律分布它们能够很好的吻合,这也说明网络帖子对网民的吸引力以及帖子的不断增长是形成点击量和回复量的幂律特性的重要标志。
通过以上的实证分析及计算机模拟,可以发现人类行为可能在很多层面上都表现出偏离泊松过程的特性。