【摘 要】
:
为解决传统文本相似度计算方法没有充分考虑专利文本结构特殊性以及计算文本相似度过程中往往忽略词汇间语义信息的问题,在传统方法的基础上,考虑词性以及专利文本的结构特征,将
【机 构】
:
北京信息科技大学网络文化与数字传播北京市重点实验室
【基金项目】
:
国家自然科学基金项目(61671070);北京成像技术高精尖创新中心基金项目(BAICIT-2016003);国家语委重大课题基金项目(ZDA125-26、ZDI135-53)
论文部分内容阅读
为解决传统文本相似度计算方法没有充分考虑专利文本结构特殊性以及计算文本相似度过程中往往忽略词汇间语义信息的问题,在传统方法的基础上,考虑词性以及专利文本的结构特征,将IPC分类号、标题、摘要、权利要求书作为主要研究对象,词在不同位置出现分别赋予不同的权重,通过word2vec将词表示成词向量的形式,通过词汇跟词汇之间的语义信息改进余弦相似度公式。实验结果表明,提出方法相比于传统文本相似度计算方法准确率和召回率有所提高,验证了其有效性。
其他文献
针对裂纹对压力容器疲劳寿命的影响,应用断裂力学理论将存在初始裂纹的压力容器进行应力强度因子计算,采用Paris理论对裂纹扩展速率进行描述,应用ANSYS workbench仿真计算含
日前,为了进一步促进全省高等学校档案管理工作规范化水平,江苏省档案局、省教育厅依据《高等学校档案管理办法》等档案法律法规,对全省120多所高等学校档案工作开展了专项执
文中阐明了高等院校学生科技论文写作质量的现状,总结了目前高等院校学生科技论文写作中存在的主要问题,分析了问题产生的根源,提出了提升高等院校学生科技论文写作能力的途
5月13日至14日,由国家档案局举办的《企业档案工作规范》中央企业宣贯暨培训会在北京举行。国家档案局副局长李和平出席并讲话。此次培训旨在宣传贯彻《企业档案工作规范》,国
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
以乳清为原料,选用胰蛋白酶对其进行水解,制取乳清多肽果汁饮料。对水解条件及风味的调配方案进行了研究。结果显示,控制好水解条件和进行适当处理,可以得到水解度适中、风味良好
利用汾河河津水文站1950年以来的水文资料,应用多种统计分析方法,系统分析了汾河水沙的季节及年际变化规律,并且对人类活动导致的年径流变化影响进行了估算。研究表明,汾河流域水沙年内分配极不均匀,年内不均匀系数有明显上升趋势,且越到近期稳定程度越低。水沙的年际变化剧烈,且在20世纪80年代之后年径流基本都是枯水时段。应用累积滤波器对汾河水沙变化趋势进行分析,结果显示,汾河流域水沙均呈减少趋势,且泥沙变
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
混合感染在鸡群中是经常发生的,它使疫病的症状及其病理变化等方面变的复杂化,给诊断造成很大困难,本次试验通过临床症状、病理学、病原学、血清学等系统诊断方法,最后确诊本