论文部分内容阅读
推荐系统在社交领域和电子商务领域的成功应用,推动了推荐系统的研究热,大量的推荐系统算法开始涌现出来。但是,在科技论文推荐领域,相关研究还甚少。科技论文的“信息爆炸”问题同样需要得到有效的解决。本文基于引证网络,深入研究现有推荐系统算法在科技论文推荐领域的应用。同时,总结各种算法的优劣,并在探索了相应的改进措施后,基于原有算法提出了多种新的算法,并通过大量的实验证明了算法改进措施的有效性,以及新算法的可行性,最后成功的提高了科技论文推荐的质量。本文的具体工作如下:1.分析经典协同过滤系统在科技论文推荐上的不足之处,然后通过加入了PageRank排名算法,将协同过滤系统改进为基于“带权”引证网络的推荐系统,以区分引证网络中的重要性论文和非重要性论文,进而提高推荐论文的质量和推荐精确性,并用实验证明算法效率的提升程度。2.详细分析了链路预测的相似性指标在引证网络中使用时所存在的问题,然后探讨了论文源节点的出度、目的节点的入度、“同被引论文”关系和“共引论文”关系对相似性的影响,进而提出了“基于引证网络的论文相似性指标”,最后通过三组实验验证了提出的指标在引证网络中的链路预测的有效性。3.应用传统的物质扩散和热传导方法做科技论文推荐,并做简要分析。然后分析并改进了物质扩散的初始资源配置问题,提出了科技论文合作者之间的“合作相似度”。在物质扩散的初始资源配置问题上,本文将初始资源分配与PageRank值相结合用于区分各篇重要性不同的科技论文。在合作相似度上,本文首先将合作相似度与物质扩散正向结合,用于提高推荐算法的精确性;然后再将合作相似度与物质扩散反向结合,用于提高推荐算法的多样性。在最后,辅以两组实验证明。