基于多因素的引文推荐策略研究

来源 :东北大学 | 被引量 : 10次 | 上传用户:xiaoxie20092009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息传播速度的快速提升,可供查阅的科技文献数量也在迅速增加。用户想要在上千条引文查询结果中找到自己需要的结果是一件很困难的事情。查询结果推荐是解决这个问题的方法之一。查询结果推荐根据已有的用户信息,预测出用户可能感兴趣的项目,将这些项目推荐给用户,避免了用户从搜索工具中返回的数量巨大的结果集中挑选结果,减轻了用户的负担。由于引文之间的题目相似度不能准确反映引文之间的相似度,现有的查询结果推荐方法不能很好的对引文做出推荐。本文基于引文自身的特点,提出了一种基于多因素的引文推荐策略。该策略综合了引文自身因素和用户因素进行论文推荐。首先,根据引文的引用关系,生成一个引文引用图。接着,根据同作者、共同引用等引文之间特殊的联系定义一系列规则,并基于这些规则给引用边赋权值,权值的大小表示引文之间联系的强弱。之后,应用聚类算法对联系紧密的引文进行聚类,并根据聚类结果,找出用户需要的相关引文,生成初始的引文推荐集合。最后,找出当前用户的相似用户,根据它们的行为对之前生成的推荐集合进行调整,生成最终的引文推荐集合。本文主要研究以下几个问题。一是将用户协同过滤策略和基于项目的推荐策略结合起来,提出一个引文推荐模型。在初期用户评分稀疏的情况下,利用项目之间的相似度进行推荐。在系统运行一段时间之后,根据用户的评价对之前计算的相似度进行调整,使结果更准确。二是在计算项目相似度的时候,根据引文自身的属性计算(引用关系、作者、发表时间等),而不是传统的语义相似度。这样,可以避免抽取和语义分析的不准确。三是改进了用户-项目评分矩阵的生成方法,解决了传统用户协同过滤策略存在的一些问题。文中通过大量实验对比,验证了我们提出的基于多因素的引文推荐方法在性能上要优于现有的推荐方法,使得在WebCitation系统中,对目标引文做出的引文推荐集合符合用户的需要,减少了用户的操作负担。
其他文献
该论文所论述的基于Exchange的信息管理与应用平台的实现,是为获取、组织、管理、发布与应用信息等问题提供一种解决方案.同时论述了信息管理与应用平台及有关信息属性化和数
控制器是自动控制系统的核心,必须对其进行性能评估和监控以保证其控制性能。广义最小方差是广泛使用的控制器性能评估与设计的方法。目前的文献在设计广义最小方差控制器时,
儿童弱视是一种发病率较高的眼科疾病,传统的仪器治疗方式需要患儿定期到医院治疗,这不仅给家长来不便,而且由于治疗内容单调,儿童配合治疗的积极性不高,加大了医生治疗的难度。这
本文主要通过研究神经网络专家系统以及 PDA和 PC之间的远程串行通信,设计并实现了基于神经网络和 PDAjPC电话拨号连接的农作物病害诊断专家系统(PDDESN),具体如下: (1)本文采取
该论文共分七章.首先介绍了远程通信技术的发展现状以及研究的意义,然后在分析,对比了各种远程教学的网络模型之后,提出一种新的远程教学的网络模型.然后介绍了一个基于此模
该文通过对网络技术和组态软件的研究与分析,提出了一种网络环境下组态软件的结构框架,并通过编程实现了基于Web的组态软件的开发.通过对计算机网络在工业信息监视系统上的应
该文深入讨论了单元素表、通用表以及规范化通用表映射方案的优缺点,从存储空间和操作效率等方面综合考虑,提出了一种基于WL数据挖掘算法的无损映射方案.在此基础上,对不同类
人脸检测是指利用计算机在图像中定位人脸,并给出人脸的大小、位置、数目等信息,为人脸特征的获取奠定基础。近些年来,人脸检测技术已经成为模式识别与计算机视觉领域中一个
自面向对象技术问世以来,人们已提出了数十种不同的类内聚度度量方法。这些度量方法在软件工程的各个领域内已得到了广泛应用。虽然度量方法众多,但是这些度量方法在适用性及准
论文主要从以下方面展开论述:一.课件的发展及开发技术概述,模块化课件开发概念及参考模型;二.设计CAMP平台所需的相关技术研究;三.提出模块化课件开发的改进模型,在此基础上