基于VSM的科技期刊文献与专利文献的相似度计算方法研究

来源 :情报工程 | 被引量 : 0次 | 上传用户:sun54965436
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本相似度的计算方法以采用TF—IDF的方法对文本建模成词频向量空间模型(VSM)为主,本文结合科技期刊文献和专利文献特点,对TF—IDF的计算方法进行了改进,将词频的统计改进为科技术语的频率统计,提出了一种针对科技文献相似度的计算方法,该方法首先应用自然语言处理技术对科技文献进行预处理,采用科技术语的自动抽取方法进行科技文献术语的自动抽取,结合该文提出的术语权重计算公式构建向量空间模型,来计算科技期刊文献和专利文献之间的相似度。并利用真实有效}向科学期刊和文献数据进行实验测试,实验结果表明文中提出的方法
其他文献
主要目的是对一类具有积分型边界条件的抛物方程,基于双线性元及最低阶Nédélec′s元(Q)_(11)/Q_(01)×Q_(10)提出了一个新的混合有限元方法,它具有总体自由度小且满足B
人造奶油的生产历史可追溯至20世纪50年代,近60年来已广泛应用于烘焙食品配料、冷制食品配料、糖果配料、固体饮料配料等食品工业中。人造奶油一度成为现代食品工业不可或缺的
<正>动物水解蛋白是利用皮革下脚料等水解制成,其的特有成分为L-羟脯氨酸和羟赖氨酸,且羟脯氨酸的含量高达10%以上,而大豆蛋白和乳蛋白中不含此成分。利用这一特殊性,该实验
目的:探究实施人性化护理对老年心肌梗死患者心理状态及护理满意度的影响。方法:临床纳入2013年7月至2014年9月间在我院进行治疗的心肌梗死老年患者124例,按随机投掷法进行分组,
研究一个7次Z7-等变平面多项式干扰系统.利用平面动力系统的分支方法和判定函数方法,通过选择恰当的扰动系统参数以获得尽可能多的极限环个数.借助于数值计算,获得了35个极限环
目的:对糖尿病患者的护理中社区护理干预对患者遵医行为的影响进行探究。方法:对我院112例糖尿病患者的临床资料进行回顾性分析,并根据护理方式的不同分为观察组(n=56)与对照组(n=5
3月28日-30日.第16届中国国际食品添加剂和配料展览会暨第22届全国食品添加剂生产应用技术展示会(FIC2012)在上海世博会展览馆举行.同期举办的中国木糖醇50周年庆典,吸引了众多行
针对目标威胁估计有很多不确定性的特点,分析了传统目标威胁估计方法和灰色神经网络初始参数随机选择的不足。采用模拟退火改进的粒子群算法代替梯度修正法,对网络参数初始值
比较二巯基丙磺酸钠与亚甲兰对杀虫脒急性中毒动物的保护作用,结果表明:1、该两解毒剂对杀虫脒急性中毒小鼠和大鼠都有非常显著的保护作用(P<0.01),二巯基丙磺酸钠保护作用优
“保膝”治疗,即在不破坏软组织生物活性及生理特性的情况下,采用微创手段治疗膝关节周围疾病。临床中常见的膝关节损伤的疾病为膝关节骨关节炎和胫骨平台骨折,针对上述两种