【摘 要】
:
每年,数以万计学术论文的发表使得论文的规模达到了空前的高度。科研人员如何在众多的学术论文中找出感兴趣的论文成为困扰他们的一个棘手问题。早期,研究者主要运用传统的协
论文部分内容阅读
每年,数以万计学术论文的发表使得论文的规模达到了空前的高度。科研人员如何在众多的学术论文中找出感兴趣的论文成为困扰他们的一个棘手问题。早期,研究者主要运用传统的协同过滤推荐方法来为用户推荐论文。由于基于协同过滤的推荐方法无法解决推荐当中面临的冷启动问题,因此,他们又提出基于论文文本内容的推荐方法。但是,该模型仅考虑到论文的文本内容而忽略了学术论文之间的潜在联系,使得推荐的结果差强人意。针对上述两种模型的缺点,本文围绕基于网络图模型的学术论文及其标签推荐方法开展研究,主要研究最新发表学术论文的有效推荐问题以及为学术论文推荐合适标签的问题。通过分析现有网络图模型方法中存在的问题,借鉴其易融合异构信息的优势,提出了两种图模型方法:一种结合标签数据图模型的新发表论文推荐方法和一种基于多源异构图模型的学术论文标签推荐方法。前者主要将学术论文的标签数据添加到文本内容中计算论文间的相似度值,有效的解决了新发表学术论文因缺少历史用户行为信息而造成的数据稀疏问题,增强了学术论文之间的内容互信;后者则充分利用了学术论文中存在的异构信息构造多源异构图模型,不仅可以为学术论文推荐相关的标签信息,而且也有效的解决了标签推荐中面临的冷启动问题。另外,这两个图模型较其它图模型仅添加了少量的学术论文相似关系,其结构得到了极大的简化,可以更好地适应稀疏数据,降低模型的计算成本。本文将学术论文中的多种信息统一整合到图模型中,然后再运用重启动随机游走的方法计算图中任意节点的相似度值,进而完成了学术论文及其标签信息的推荐任务。在两个真实数据集上进行的实验结果表明本论文提出的两个模型相比对照模型具有更高的推荐效率和精度。
其他文献
随着移动互联网技术的积累和发展,各种智能移动设备不断出现,传统行业与移动互联网的联系越来越密切。利用各种移动软件和智能网络我们可以轻松的处理我们的生活和工作,给我
分类是指通过对已知类别的样本集进行学习,来预测未知类别样本的过程。多标签分类允许一个样本同时拥有多个标签,并且标签之间可能存在一定的关联性。由于在现实中的应用广泛
日像仪是一种对日射电成像的大规模天线阵的综合孔径系统。获取理想的太阳亮度分布图像是日像仪的最终目标。而制约日像仪成像性能的最主要因素是有限的预算和天线数目之间的
P2P技术快速发展的同时,也导致了网络阻塞、网络安全性和网络资源产权保护等问题的产生,因此,通过研究有效的P2P流量识别方法,用以解决上述问题成为重要课题。 论文通过对比机
近年来,大图数据特别是数十亿顶点规模的图数据大量涌现,这一趋势对图数据管理领域提出了全新挑战。图的存储方式直接决定了图数据的访问效率、图查询与挖掘的效率。如何采用合
21世纪软件产业飞速发展,软件组织如何进行卓有成效的软件过程改进,以减少软件开发过程中的阻力,按照预期的预算和时间成本投入开发出高质量的软件系统,越来越成为软件行业所
Z-Wave协议是无线传感器网络的一种新协议。由于Z-Wave网络中的设备大多是靠电池供电,而电池的能量是有限的,所以如何延长网络中节点的寿命和整个网络的生存时间已经成为了一个
为了保障分布式实时系统的可靠性,本文采用主副版本复制技术来提高系统的容错能力。在此基础上,结合首次适应分配算法,提出了一种基于异构的分布式实时容错调度算法。综合考
随着经济的发展和企业规模的扩大,企业对于信息化的投入逐渐增大,不同类型的系统被引入和运行。由于系统开发时间有差别,系统基于不同的开发平台、工具和语言,这样会导致系统之间
随着物联网的高速发展,无线射频识别(Radio Frequency Identification,RFID)技术的应用范围越来越广泛,快速多样化的发展对RFID技术的适应性、灵活性及可维护性有了更高的要求,RF