基于主题模型和因子分解机的Web API推荐方法研究

来源 :湖南科技大学 | 被引量 : 0次 | 上传用户:yangtianmei02
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“根据用户的自然语言需求描述推荐用于解决该问题的Web APIs任务集合以辅助用户构建Mashup”是本文研究所追求的目标。然而,Web APIs的数量和种类的快速增加,Web服务描述文档非结构化,以及存在许多功能相似但性能差异较大Web API等一系列问题,使得这一目标的实现变得越发困难。考虑到,主题模型技术能够帮助更好的理解Mashup服务需求文本中所包含的功能信息,以获取其潜在主题分布向量,进而挖掘Mashup服务需求文本与Web API描述文档之间的潜在语义关系。因子分解机模型能够在其模型中加入各种补充信息,因此该模型能够有效降低传统协同过滤算法与矩阵分解方法中Web API历史调用矩阵的稀疏性,进而优化特征组合的方式。基于以上的分析,本文提出融合主题模型和因子分解机模型推荐方法,推荐Top-N Web APIs辅助目标Mashup的创建。本文的主要研究方法如下:(1)融合标签、主题、流行度、共现性的Web API推荐方法(TR-FM)。该方法首先对Web服务(Mashup或Web API)的标签进行扩充,并计算扩充后的每一个标签对于相应的Web服务的重要性权重,以此计算标签层的相似度。接着利用RTM主题模型导出Web服务描述文档主题的分布向量,以计算文本层的相似度。利用Web API的category信息辅助Web API的历史调用次数来计算Web API的流行度,采用经典的Jaccard相似系数来计算Web API的共现性。最后利用因子分解机模型融合以上特征推荐Top-N Web API集合。实验结果表明,该方法在准确率,召回率和F-measure等方面具有良好的性能。(2)基于HDP主题模型与因子分解机的Web API推荐方法(HDP-FM)。该方法探索HDP主题模型导出Web服务(Mashup或Web API)的最优主题分布向量,接着利用增强余弦相似度公式度量Web服务之间的相似度。最后将Mashup之间的相似度,Web API之间的相似度,Web API的流行度和共现性作为因子分解机模型的输入,通过评分排序获取用于推荐的Web APIs集合。该方法在真实的Web服务数据集(爬取自ProgrammableWeb平台)上进行了一系列实验,结果显示该方法在准确率,召回率,F-measure和NDCG@N等方面具有优越性。
其他文献
微博作为一种新的社会化媒体已经逐渐渗透到我们每个人的生活,对我们的媒介信息接收和媒介互动产生了重要的影响。除了微博本身以外,媒体机构在微博上开通新的传播路径以及专
<正>按照《孙冶方经济科学基金会章程》规定,孙冶方经济科学奖每两年评选一次。自2018年6月第十八届孙冶方经济科学奖(2018年度)评奖公告发布以后,截至2018年11月底,孙冶方经
互联网科技的飞速发展正改变着整个世界,各行各业随着互联网+的模式快速转变。科技的发展导致信息膨胀愈演愈烈,面对海量的数据人们越来越难以获取自己想要的知识。为解决信
十九大报告中提出的国家未来发展的重要目标,是通过教育促进全民审美素养的提升实现建设美丽中国。全国各级各类的学校都在积极进行美育课程的落实,相比之下中职学生的美育教
随着电影行业的不断发展,我国对于电影业所提供的政策帮扶以及相关的资金投入占比相较于电影业发展之初已有了极大的改观,本文通过对现阶段我国的电影投融资项目的相关问题进
水彩画是现代美术艺术中表现形式比较多样的一种绘画方式,由于其具有色彩透明性,不同层次和颜色的覆盖能够形成不同的效果,并能够表现出不同的意境,所以一直受到美术界的热捧
随着移动互联网的发展和Web2.0应用的流行,推荐系统在帮助用户获取感兴趣的内容和帮助平台推广内容方面发挥着日益重要的作用。在众多优化目标中,准确性和多样性是推荐算法最
随着基因组学以及二代测序的蓬勃发展,比较基因组学在动物学、遗传学和进化生物学等领域已经成为非常重要的研究手段。本论文基于全基因组数据,利用比较基因组学和生物信息学
水彩画属于西方绘画的一种,自19世纪末传入中国。1902年"钦定学堂章程"将其列入中小学图画课的色彩教程,具有广泛的普及性。同时,由于高难度的技法要求,最后能成气候者不多。
对入院患者进行心源性猝死相关危险因素风险评估,筛选出高危患者,制定出针对性预防和抢救护理措施,降低住院患者SCD发生率和死亡率。