【摘 要】
:
本文研究的面向项目需求的专家推荐算法能够快速、精准提供专家推荐策略,具有重要的实践意义。面向项目需求的专家推荐的主要依据是专家科研成果与项目的匹配度,专家的科研成果主要包括学术论文和攻关项目、专利、课题基金等非学术论文成果两大类。专家学术论文数据主要为长文本数据,与学术论文相比,非学术论文成果的文本具有词汇少、语义稀疏等特征,属于短文本数据。针对专家学术论文主题动态变化以及非学术论文成果主题语义稀
论文部分内容阅读
本文研究的面向项目需求的专家推荐算法能够快速、精准提供专家推荐策略,具有重要的实践意义。面向项目需求的专家推荐的主要依据是专家科研成果与项目的匹配度,专家的科研成果主要包括学术论文和攻关项目、专利、课题基金等非学术论文成果两大类。专家学术论文数据主要为长文本数据,与学术论文相比,非学术论文成果的文本具有词汇少、语义稀疏等特征,属于短文本数据。针对专家学术论文主题动态变化以及非学术论文成果主题语义稀疏而造成的专家推荐准确率下降的问题,本文从在传统主题模型中融合时间因素以及融合自注意力机制两个角度展开研究,提出两种基于内容的专家推荐算法:(1)一种基于双主题模型的专家推荐算法针对专家学术论文主题动态变化带来的推荐准确率下降的问题,本文新建一种基于双主题模型的专家推荐算法。首先,该算法利用两种主题模型分别对专家论文数据和项目需求文档数据进行主题特征提取,一方面,对于专家论文数据的特征提取,构建了一种引入时间遗忘因子的有监督作者主题模型(S-TFATM),该模型通过引入时间遗忘因子研究时间因素对专家学术论文主题词权重变化的影响,同时利用关键词作为文本的主题标签,解决了主题模型难以确定主题数的问题;另一方面,对于项目需求文档数据,运用LDA主题模型进行项目的主题特征提取。其次,利用KL距离进行专家与项目需求文本的主题对齐;再次,基于主题对齐后的专家与项目需求的主题分布信息,计算并排序专家与项目的匹配度,根据匹配度计算值大小生成推荐名单。最后通过文本分类和专家推荐实验验证了算法的有效性。(2)一种基于融合自注意力机制词对主题模型的专家推荐算法针对专家非学术论文成果数据语义稀疏而造成的推荐准确率下降的问题,本文新建一种基于融合自注意力机制词对主题模型的专家推荐算法。首先,构建一种融合自注意力机制的词对主题模型(SA-BTM)对专家短文本数据以及项目需求文档数据进行文本特征提取。SA-BTM模型在BTM模型的词对共现机制的基础上,将词对之间的语义相似度值以及词汇的TF-IDF值作为为先验知识融入到模型中,同时,在SA-BTM模型中引入Self-Attention机制,获取词汇在原文中的上下文语意信息。获取到专家短文本以及项目文本的文本特征后,利用SABTM模型输出的两个分布信息计算专家与项目之间的匹配度,根据匹配度大小进行推荐。最后通过文本分类和专家推荐实验验证了算法的有效性。
其他文献
单像素成像是一种基于压缩感知理论的计算成像方法,因其具有灵敏度高,信噪比大等优良特性,被广泛应用于荧光显微、光谱成像和生物医学成像等多个领域。将光子计数技术与单像素成像技术结合,能够实现更高灵敏度、低成本的单光子压缩成像。用于单光子压缩成像的传统图像压缩重建算法往往具有极高的计算复杂度,且在微弱光环境下,噪声的存在会带来图像重建质量的大幅度下降,而将深度学习与单光子压缩成像相结合是解决这一问题的有
发生交通事故或车辆行驶途中发生故障时,通常需要在事故车辆后方的一定距离摆放三角警示牌,用于提醒后方车辆小心驾驶,避免后方车辆反应不及时引发二次交通事故。但三角警示牌存在许多不尽人意的地方,比如:晚上可视距离太短、易被大风刮走、摆放过程中有发生二次事故的危险等。设计研制新的警示机器人取代三角警示牌,对于保证车辆交通安全具有重要意义。论文提出了一种解决方案,研发了一种基于物联网的交通警示机器人系统,与
随着电商行业的迅猛发展,电商评论文本数据呈爆炸式增长。电商评论文本是用户用来表达个人对电商商品的情感文本,包含着用户对评论对象的情感信息,具有数量多,文本短小,表达的情感丰富等特点,是电商平台、商家和潜在用户决策的重要依据。因此,如何高效科学地从海量电商评价文本准确挖掘并能反映用户情感倾向的信息,已经成为电商平台、用户和商家科学决策亟待解决的问题。传统基于词典的评论文本情感分析受制于情感词典的质量
科技的日新月异使得人与人之间的交流越来越便利,人们在享受信息交流便捷的同时,信息泄露也日益严重。例如,信息通过网络时被肆意复制、篡改以及恶意传播,这对信息安全构成了严重威胁。作为多媒体信息安全的重要技术手段,数字水印技术在版权保护方面扮演着重要角色。为进一步提高数字水印算法的抗几何攻击能力,本文提出了两种抗几何攻击的水印算法。论文主要研究工作如下:基于混沌序列加密算法、双树复小波变换和离散余弦变换
微电网中可再生能源出力存在着较强的随机性和波动性,伴随着大规模电动汽车(EVs)接入所带来的随机负荷,导致需求侧也出现较大随机性。供需两侧的随机性会对微电网的稳定运行产生影响,制定提高微电网稳定性、降低运行成本的调度策略是非常有必要的。含EV微电网结构复杂,模型难以准确建立,传统优化算法求解时容易陷入局部最优解。本文结合量子计算并行能力对长短期记忆神经网络(LSTM)进行改进,建立量子长短期记忆神
在安防领域,摄像头具有不可替代的作用,但是传统的安防监控系统需要投入大量的人力去对监控内容进行监督与分析进而发现异常情况。而本论文研究的人群异常行为检测算法旨在利用计算机技术代替人力以实现自动地对监控视频里面的人群异常行为进行检测和预警。传统的人群异常行为检测算法大多基于手工特征,由于人群异常行为本身具有非线性和不确定性,这些传统的方法存在鲁棒性差,泛化性弱等缺点。而基于深度学习的网络模型具有强大
遥操作控制能够将人类智慧加入到机器人的控制中,将人类的操作空间延伸到危险环境或人类无法到达的地方。在主从遥操作控制中,在面对操作精度要求较高且轨迹可以预先确定的作业任务时,如焊接、切割动作,操作者需要缓慢进行移动,操作效率较低且难以精准完成。这时可以利用机器人自主控制,充分发挥其精准完成任务的优势,在遥操作控制不便于实现的环节采用自主控制,使机器人在部分时间内自主完成关键任务。本文主要研究内容如下
随着新兴智能化产业技术的蓬勃发展,在人们生产生活中越来越多的工作任务被赋予到机器人身上,而如何在复杂未知环境空间控制机器人实现精细化自适应抓取成为一项极富挑战性的研究任务。因此,本文结合了对机器人的轨迹优化控制,通过融合视觉和触觉的多模态组合方式对目标物体进行了精细化抓取操作的研究,最后在软件中进行了仿真建模,并在实验室中搭建了多模态抓取系统用于对本文所提出的抓取策略加以验证。本文的主要研究工作如
由于遥操作系统存在着通信时延,当通信时延变化时,对遥操作的稳定性会产生极大的影响。因此,本文在从端设计了加幂积分型有限时间控制算法实现主从轨迹的快速跟踪,在主从端设计了切换滤波器来解决变时延情况下遥操作系统的稳定性。论文的主要内容如下:首先,基于指数乘积法构建了机器人的运动学模型,基于拉格朗日法构建了机器人的动力学模型。然后根据机器人的动力学模型建立了遥操作系统的数学模型。其次,考虑到主从端机器人
随着全球环境问题加重,温室气体效应在世界范围内成为了越来越关注的话题。大气中水汽作为温室气体的主要组成部分,对于全球气候的影响有着非常重要的作用。将GNSS技术应用于大气水汽含量监测作为一种新兴的水汽监测手段,具有成本低、时间分辨率高等优点,拥有广阔的应用前景。本文结合以往学者的经验和方法,对GNSS技术探测水汽过程中关键参量的模型精度进行分析。在分析模型精度的基础上,对对流层延迟以及加权平均温度