论文部分内容阅读
如今网络上社交网络发展日趋繁荣,基于社交网络上的发掘人与人之间的研究越来越多,但目前大多数的研究是基于标签和内容方面的推荐,存在过度推荐和过度专业化的问题,并没有考虑社交网络中其它有关联的内容的影响,这样很难全方面准确地推荐用户感兴趣的人。因此,本文主要知识图谱构建、用户画像构建和人物推荐算法三个层面开展相关研究。针对构建拥有丰富知识的知识图谱的问题,本文提出了一种基于微软开源数据集构建知识图谱的方法。目前大多数研究中构建知识图谱的方法大多来源单一数据通道,本文分析了AngleList网站与用户之间的关系,提出了一种从AngleList出发获取同一用户的Twitter、Facebook、Linkedin多通道数据的方法,进而提出了基于微软开源数据集和多通道数据集的实体识别和实体关系抽取的方法,最后提出了一种基于实体和实体关系构建完整知识图谱的方法,保证了知识图谱拥有知识的完整性和丰富性。针对基于知识图谱准确构建用户画像的问题,本文提出了一种基于知识图谱中属于用户的节点之间权重构建用户画像方法。本文提出了一种根据用户发表的每条短文本提取兴趣主题和关键词的方法,保证了细粒度地提取,这两部分和用户的固有属性组成了知识图谱中代表用户的全部节点。本文中属于用户的任意两个节点之间的权重是通过这两个节点之间的距离和节点之间的边的权重这两部分计算出来的,并提出了一种基于用户节点构成的连通图的最小生成树方法构建用户画像的方法,这种方法保证了用户画像的准确性和丰富性。针对用户画像进行人物推荐的问题,本文提出了基于权重的广度优先搜索方法WDFS和基于权重的深度优先搜索方法WBFS对用户画像进行遍历得到知识图谱中用户所有节点的排名的方法。通过实验对比分析发现,基于WDFS的人物推荐方法效果最好,紧接着本文针对WDFS的人物推荐方法进行了算法调优,提高了人物推荐的准确率。最后,根据单一变量原则,选取其它人物推荐的方法进行对比试验,本文中的方法的平均准确率达到38.7%,优于其它人物推荐方法。