论文部分内容阅读
当今互联网技术飞速发展,人们的生产、生活均已被信息时代占领,进入快节奏状态,传统的社交媒体已经无法满足人们的需求,转而越来越多的投入互联网在线社交平台。据中国互联网络信息中心(CNNIC)研究,在互联网现有的在线社交平台中,综合类社交应用的用户群体较大,常被作为人们日常信息分享传播的平台。对于弱关系的社交网络中,用户的自由度较高,使用平台关注时事热点新闻、关注感兴趣的内容,获取知识和分享观点。因此,分析用户兴趣对于社交平台来说十分重要。根据心理学研究,人们的兴趣存在迁移和遗忘的特征,以关注时间为依据划分为长期兴趣和短期兴趣。本文中结合兴趣关注度和关注时间,定义用户兴趣的兴趣关注序列。考虑用户精力的有限性,以及兴趣由主观意愿决定的发散性,本文提出基于模糊分配策略的资源受限人工免疫系统用户兴趣挖掘模型。将用户社交文本内容进行预处理作为入侵抗原,通过计算抗原与记忆细胞对应文本特征词之间的相似性,判断用户兴趣是否已存在于用户的兴趣向量中,从而给出相应的免疫应答,并构造对应兴趣的关注序列,计算出用户兴趣关注度,从而反应用户兴趣变化。通过对比实验,基于社交内容的用户兴趣挖掘模型能够给出用户不同时刻的兴趣关注程度,并且很好地体现用户兴趣的变化情况。社交网络中人们之间兴趣相互影响,依据人们对于社交网络使用目的的不同,将分为信息探求用户群和信息分享用户群。尤其针对信息探求型用户,其相关社交内容较少,基于用户文本内容的用户兴趣模型存在一定不足。本文结合用户的社交关系影响力,构造基于社交关系的用户兴趣挖掘模型,进一步优化用户兴趣向量。首先利用PageRank算法根据用户粉丝质量进行重要性排名,并根据用户重要性排名对用户进行分类。对社交网络中用户之间影的响力因素进行分析,采用梯度上升学习模型对影响因素赋予相应的权值,给出相关用户的社交影响力。最后,分别针对不同类型的用户给出其综合社交关系和社交内容的用户兴趣。通过对比实验可知,在社交内容的基础上综合社交关系对用户兴趣的影响,得到的用户兴趣更加完善。