基于VSM的科技期刊文献与专利文献的相似度计算方法研究

来源 :情报工程 | 被引量 : 0次 | 上传用户：sun54965436

【摘要】

：

文本相似度的计算方法以采用TF—IDF的方法对文本建模成词频向量空间模型（VSM）为主，本文结合科技期刊文献和专利文献特点，对TF—IDF的计算方法进行了改进，将词频的统计改进为科技

【作者】

：

曾文徐红姣李颖王莉军赵婧

【机构】

：

中国科学技术信息研究所

【出处】

：

情报工程

【发表日期】

：

2016年3期

【关键词】

：

自然语言处理 TF—IDF 向量空间模型科技期刊专利相似度 Natural language processing TF-IDE vector spac

【基金项目】

：

本研究得到国家社会科学基金项目（项目编号：14BTQ038）和中国科学技术信息研究所科研项目预研资金项目（项目编号：YY2016-08）的支持.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本相似度的计算方法以采用TF—IDF的方法对文本建模成词频向量空间模型（VSM）为主，本文结合科技期刊文献和专利文献特点，对TF—IDF的计算方法进行了改进，将词频的统计改进为科技术语的频率统计，提出了一种针对科技文献相似度的计算方法，该方法首先应用自然语言处理技术对科技文献进行预处理，采用科技术语的自动抽取方法进行科技文献术语的自动抽取，结合该文提出的术语权重计算公式构建向量空间模型，来计算科技期刊文献和专利文献之间的相似度。并利用真实有效}向科学期刊和文献数据进行实验测试，实验结果表明文中提出的方法

其他文献

具有积分型边界条件的抛物方程一个新混合元方法的超收敛分析

主要目的是对一类具有积分型边界条件的抛物方程,基于双线性元及最低阶Nédélec′s元（Q）_（11）/Q_（01）×Q_（10）提出了一个新的混合有限元方法,它具有总体自由度小且满足B

期刊

抛物方程积分型边界条件混合元方法(Q)_(11)/Q_(01)×Q_(10)单元对超逼近及超收敛结果parabolic equationin

创一流品牌，做百年光大——访山东光大绿源食品科技有限公司总经理韩桂萍及技术总监梁运

人造奶油的生产历史可追溯至20世纪50年代，近60年来已广泛应用于烘焙食品配料、冷制食品配料、糖果配料、固体饮料配料等食品工业中。人造奶油一度成为现代食品工业不可或缺的

期刊

技术总监食品科技总经理现代食品工业反式脂肪酸食品配料品牌山东

乳与乳制品中动物水解蛋白的检测

<正>动物水解蛋白是利用皮革下脚料等水解制成,其的特有成分为L-羟脯氨酸和羟赖氨酸,且羟脯氨酸的含量高达10%以上,而大豆蛋白和乳蛋白中不含此成分。利用这一特殊性,该实验

期刊

特有成分羟赖氨酸氯胺脯氨酸吡咯环乳蛋白磨口三角瓶摇匀氯化亚锡氢氧化钠溶液

人性化护理对老年心肌梗死患者心理状态及护理满意度的影响

目的：探究实施人性化护理对老年心肌梗死患者心理状态及护理满意度的影响。方法：临床纳入2013年7月至2014年9月间在我院进行治疗的心肌梗死老年患者124例，按随机投掷法进行分组，

期刊

心理状态护理满意度人性化护理老年心肌梗死

7次Z7-等变平面多项式干扰向量场的极限环分支

研究一个7次Z7-等变平面多项式干扰系统.利用平面动力系统的分支方法和判定函数方法，通过选择恰当的扰动系统参数以获得尽可能多的极限环个数.借助于数值计算，获得了35个极限环

期刊

极限环分支Z7-等变平面干扰向量场判定函数异宿环和同宿环扰动哈密顿系统bifurcations of limit cyclesZ7-equivaria

社区护理干预对糖尿病患者遵医行为的影响研究

目的：对糖尿病患者的护理中社区护理干预对患者遵医行为的影响进行探究。方法：对我院112例糖尿病患者的临床资料进行回顾性分析，并根据护理方式的不同分为观察组（n=56）与对照组（n=5

期刊

社区护理干预糖尿病遵医行为

FIC2012同期举办中国木糖醇50周年庆典活动

3月28日-30日．第16届中国国际食品添加剂和配料展览会暨第22届全国食品添加剂生产应用技术展示会（FIC2012）在上海世博会展览馆举行．同期举办的中国木糖醇50周年庆典，吸引了众多行

期刊

中国国际食品添加剂和配料展览会木糖醇食品添加剂生产应用技术展示会庆典活动上海世博会展览馆

基于SAPSO优化灰色神经网络的空中目标威胁估计

针对目标威胁估计有很多不确定性的特点,分析了传统目标威胁估计方法和灰色神经网络初始参数随机选择的不足。采用模拟退火改进的粒子群算法代替梯度修正法,对网络参数初始值

期刊

灰色系统神经网络模拟退火粒子群算法目标威胁估计

二巯基丙磺酸钠对杀虫脒急性中毒动物的保护作用

比较二巯基丙磺酸钠与亚甲兰对杀虫脒急性中毒动物的保护作用,结果表明:1、该两解毒剂对杀虫脒急性中毒小鼠和大鼠都有非常显著的保护作用(P<0.01),二巯基丙磺酸钠保护作用优

期刊

农药中毒杀虫脒二巯丙磺酸钠insecticidej sodium dimercaptopropane sulphonatej methyl-en.e bl

保膝治疗的研究进展

“保膝”治疗,即在不破坏软组织生物活性及生理特性的情况下,采用微创手段治疗膝关节周围疾病。临床中常见的膝关节损伤的疾病为膝关节骨关节炎和胫骨平台骨折,针对上述两种

学位

膝关节骨关节炎骨折外科手术微创性

基于VSM的科技期刊文献与专利文献的相似度计算方法研究

与本文相关的学术论文