论文部分内容阅读
随着社会的进步和互联网的快速发展,许多社交媒体平台开始融入人们生活的各个方面。以医疗领域为例,在医疗资源分配严重不足的情况下,医疗和互联网相结合而形成的在线医疗社区,在解决看病就医问题上有着重要的现实意义。然而,在线医疗社区在约束参与者行为以及执行管理决策方面还存在着诸多问题,这在一定程度上影响了在线医疗社区的健康发展。当前,利用数据分析技术深度挖掘参与者的行为规律,同时发现在线医疗社区运营中潜在的问题并提供相应的管理建议,已成为了在线医疗研究领域中的热点和重点。基于此,本文选取好大夫在线网站作为在线医疗社区的典型代表,使用爬虫技术从该网站爬取了大量的实时数据并对其进行深入挖掘。结合与参与者相关的多维重要变量,通过对医生、患者和在线医疗社区管理者的行为进行分析研究,发现了导致社区发展不均衡的潜在问题。本文的主要研究内容如下:第一,研究选取了参与度作为在线医疗社区中医生参与行为的表现形式,利用爬取数据对医生的参与行为进行了深入分析。研究结果发现医生参与度增加量排名前10%的医生占据了参与度增加总数的92.4%,基尼系数达到了0.935。这表明只有少部分医生愿意积极参与在线医疗社区的活动,而大部分医生并没有充分利用在线医疗社区的资源。进一步的研究发现,医生参与度增加量排名前1%的医生,其中有54%的医生是来自于累积参与度排名前1%的医生。研究结果表明可利用马太效应解释了医生参与度出现不平衡原因。同时,基于多元线性回归模型的进一步研究发现,当医生获得的心理或物质奖励的数量分布不平衡时,医生参与度增加量的分布将更加不平衡。第二,本文将患者访问量作为患者参与行为的表现形式,基于爬取数据的分析研究发现,患者访问量主要集中在排名前10%的医生,占据访问量增加总量的78.0%,其基尼系数高达0.854。这表明在线医疗社区中,患者访问量的分布不平衡的现象非常严重。进一步的研究发现,访问量增加量排名前1%的医生,其中有78.2%的医生是来自于累积访问量排名前1%的医生研究结果表现出强烈的马太效应,即在前一期数据中有明显优势的少部分医生,在下一阶段更有可能获得更多的访问量。而使用多元线性回归模型的研究发现,当心理或物质奖励的数量分布不平衡时,患者访问量增加量的分布将更加不平衡。第三,本文结合S型曲线识别了每位医生应诊患者数量的增长模型并将它们总结为正态模型、阻尼指数模型和波动模型。研究发现1.2%的医生应诊患者数量增长模型属于正态模型,13.9%属于阻尼指数模型而84.9%属于波动模型。进一步地,本文使用了多元逻辑回归模型分析了增长模型的影响因素,发现影响增长模型主要的因素为注册时长、感谢信增加量、礼物增加量和医生主页访问量增加量。综合实验结果,本文为在线医疗社区管理者提供了相应的管理建议。