论文部分内容阅读
复杂网络结构划分算法已经渗透到各个学科的研究应用中,其优势在于通过对网络结构的分析,找出用户之间、用户与社区关系,这些关系都是现实世界中的真实反映。本文深入分析复杂网络结构划分算法及科技论文推荐算法的研究现状,针对复杂网络结构划分算法效率不高、科技论文推荐算法性能不佳的特征,对复杂网络结构划分及科技论文推荐算法进行了分析和研究。首先,针对复杂网络结构划分GN算法效率不高的问题,提出了科技论文社区网络结构划分算法。该算法对构成上次删除最大边介数的顶点与其它顶点之间的边的权重上加入惩罚值C,并且不计算所有顶点之间所构成的边的边介数,而是通过逐次加入相关顶点计算边介数来进行网络结构划分。其次,针对仅仅依靠模块度的大小来判断分区会造成分区不准确性的问题,提出通过误差分数并且结合分区模块度来对分区结果进行评价。再次,针对科技论文推荐算法性能不佳的问题,提出基于隐语义模型科技论文推荐算法。该算法通过建立科技论文的隐语义模型,应用科技论文网络结构划分算法获得的用户和论文的社区号以及论文的发表日期来进行科技论文推荐。另外为了提高该算法的效率,提出了首先根据之前的用户-类别和论文-类别矩阵给出推荐列表,然后再根据用户最近的行为记录修正推荐结果。最后,将基于隐语义模型科技论文推荐算法没有加入分区号类别时推荐性能与加入分区号类别时推荐性能进行对比。同时也将该算法与基于领域、基于图并基于论文共同作者学术关系的学者推荐算法的离线实验性能作比较,分析验证算法的有效性。