论文部分内容阅读
随着经济社会的快速发展,特别是脱贫攻坚取得决定性胜利,社会公众的生理需求和安全需求得到充分保障,如何高质量健康生活、如何获取健康信息已成为当前社会公众关注的热点,受到前所未有的重视。由于社会公众对健康信息关注度的提高,在面对健康风险时,无论是使用PC端,还是移动终端,都会及时浏览和搜寻健康相关问题,关注健康信息。微博作为社交媒体时代的重要传播媒介之一,微博平台所拥有的海量用户数据和健康信息,使其在健康信息生产和发布、传播和扩散、促进个人及公众健康等方面发挥着重要作用,日益成为社会公众获取健康信息的主要窗口和渠道。社会公众可以通过微博平台浏览、检索海量实时健康信息,满足个性化健康信息需求,同时还可以通过关注、转发、评论等方式,拓展朋友圈,扩大人际交往范围,建立新的社交关系,更好满足健康信息需求。然而,随着微博平台数据的爆炸式增长,社会公众获取健康信息的时间成本也随之增长;同时,社交媒体语境下,人人都是麦克风,以往充当“把关人”角色的审核机制和专业人员作用被不断弱化消减,乃至缺位,虚假健康信息泛滥,大量未加证实的、虚假错误的“伪健康”信息得到广泛传播,严重扰乱用户健康认知。如何在海量微博信息中为用户推荐高质量的健康信息,满足用户个性化需求,提高健康信息消费和利用效率,解决“信息迷航”和“伪健康”信息问题,成为当前社交媒体信息推荐和微博健康信息传播和利用领域的研究热点。本文基于社交网络用户行为分析理论和马斯洛需求层次理论,通过分析微博用户行为,特别是用户标注行为、用户发布行为、用户关系行为和用户交互行为,识别其中表现用户需求的主要数据源,构建了基于用户行为分析的微博健康信息推荐模型,提出了面向用户行为分析的微博健康信息推荐方法体系,为解决微博健康信息过载、信息迷航和“伪健康”问题以及满足用户个性化信息需求提供理论和方法支持。主要研究内容如下:(1)构建了基于用户行为的微博健康信息推荐模型框架。在分析微博用户行为的基础上,针对微博健康信息推荐存在深层次的用户兴趣偏好难以被表达、推荐结果不具备多样性和个性化的问题,结合社交网络用户行为分析理论和马斯洛需求层次理论,构建了基于用户行为的微博健康信息推荐模型框架,结合社交网络用户的信息发布、交互、转发、使用等行为特征和用户健康信息需求表现出的社交需求、尊重需求、自我实现的需求,进行模型形成机理分析,并从微博用户内容行为和社交行为两方面,提出了基于用户行为分析的微博健康信息推荐方法体系:针对用户标注行为,提出了基于社会化标签的微博健康信息内容推荐方法,以提高健康信息推荐的精准性和实时性;针对用户关系行为,提出了基于主题和多重信任关系的微博健康信息协同过滤推荐方法,以提高协同过滤推荐的质量和准确性;针对用户发布行为和交互行为,提出了基于博文语义和用户间交互关系的多样性推荐方法,以提高推荐结果的多样性与个性化。(2)提出了基于用户标注行为的微博健康信息内容推荐方法。在分析基于信息内容的推荐方法的基础上,面对海量复杂的微博健康信息,为提高健康信息推荐的精准性和实时性,针对当前基于用户标注行为的微博信息内容推荐存在的用户标签偏少、标签语义缺乏和用户-标签矩阵高维稀疏等导致的推荐准确性、实时性不高的问题,提出了一种基于社会化标签挖掘的微博健康信息内容推荐方法。首先,针对用户标签偏少的问题,借助微博健康信息内容进行用户标签扩充,形成初始的用户-标签矩阵表征用户兴趣偏好;然后,针对标签语义缺乏问题,通过标签语义映射和语义相关性挖掘,构建标签语义相似度矩阵进行用户-标签矩阵更新,使更新后的用户-标签矩阵融入标签间的语义相关性,既能解决用户-标签矩阵高维稀疏问题,又能更好地表征用户兴趣。(3)提出了基于用户关系行为的微博健康信息协同过滤推荐方法。在分析基于协同过滤的推荐方法的基础上,针对当前微博推荐方法存在的用户兴趣漂移、用户间信任关系利用不充分等导致的推荐质量不高的问题,利用微博用户关系行为产生的信任关系,提出了基于主题和多重信任关系的微博健康信息协同过滤推荐方法。首先,利用HDP主题模型进行目标用户及其关注用户的主题挖掘,获取目标用户及其关注用户个体兴趣偏好;其次,通过计算目标用户及其关注用户的相似度和多重信任关系强度,获取目标用户群体兴趣偏好;再次,通过将目标用户个体兴趣偏好与群体兴趣偏好进行线性加权,得到目标用户对微博主题的综合兴趣度;最后,根据新发布微博的主题概率分布和目标用户对微博主题的综合兴趣度,计算目标用户对新微博的兴趣度并降序排列,得到前Top-N个推荐结果。(4)提出了基于用户发布行为和交互行为的微博健康信息多样化推荐方法。在分析多样化推荐方法的基础上,针对当前微博推荐方法存在的推荐结果缺乏多样性与个性化的问题,利用用户发布行为和交互行为产生的博文和交互关系,提出了基于博文语义和用户间交互关系的多样性与个性化推荐方法。首先,根据博文之间的语义关系和浏览博文的用户之间的交互关系,构建博文主题-交互关系相关度矩阵,实现博文语义与用户间交互关系的融合;其次,在博文主题-交互关系相关度矩阵的基础上,利用k-means聚类方法进行博文多样性划分,得到若干具有差异性的博文聚类簇;最后,利用矩阵分解类算法进行博文选取与个性化排序,从各聚类簇中选出满足用户偏好的博文推荐列表。(5)实验验证与分析。以新浪微博为数据采集对象,通过采集健康领域信息构建实验数据集,对本文提出的基于用户标注行为的内容推荐方法、基于用户关系行为的协同过滤推荐方法、基于用户发布行为和交互行为的多样化与个性化推荐方法进行对比实验验证。通过在新浪微博数据集上的实验表明,利用微博用户发布的历史内容进行用户标签扩充,并将标签间语义相关性融入用户兴趣偏好表达中,能够显著提高微博内容推荐的准确性;利用微博用户在社交过程中形成的用户间信任关系进行推荐,能够有效解决用户兴趣漂移问题和用户间信任关系利用不充分问题,能够显著微博推荐的精准性和质量;利用微博用户发布的博文和用户间交互关系进行健康信息推荐,不仅使得博文推荐列表具有多样性,同时也具有更高的推荐准确性,实现了博文多样性与个性化推荐的有机融合。