基于SVM的论文元数据抽取方法研究

来源 :电子设计工程 | 被引量 : 0次 | 上传用户:cai8211306
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过分析多分类支持向量机(SVM)的特点,建立了基于平衡二又树的支持向量机模型BBToSVM,并在训练过程中调整相关参数。得到目标支持向量机。针对PDF文件的特点,应用pdfbox开源库对PDF文件进行解析,去除PDF文件的文件头、交叉引用表以及文件尾等额外的文档描述信息,得到目标信息;最后利用libsvm开源库对PDF格式论文解析后的目标信息进行论文元数据抽取。实验结果表明:各类元数据的查全率都在86%以上,查准率都在92%以上,F度量值都在89%以上,与基于正则表达式的方法相比提高了20%以上,效果较
其他文献
本文基于研究和发展基于声子晶体的声表面波器件技术,其在电子工程、通信技术等领域有着广泛的应用,通过对国内外基于声子晶体的声表面波器件研究的分析与总结,介绍并讨论了
本文以2017广东省青少年体操锦标赛为调查背景,女子11岁组、12岁组全能比赛前八名运动员为研究对象,通过调查访问法、统计法、逻辑分析法及等进行研究。为广东省体操女队新周
文章基于山东烟威高速公路连续配筋混凝土路面的基本结构参数,利用FWD实测CRCP路面不同破坏等级的裂缝间传荷系数,建立了三维有限元分析模型,分析了裂缝间不同传荷能力对CRCP
词汇教学的目的是让学生掌握教学大纲所规定的词汇量,并能正确由于运用一些常用词。对学生来说,正确掌握和运用词汇是学好语言的基础和提高听、说、读、写能力的保障。
期刊
本文对2010年至2011年创业板上市公司营业收入增长率的数据进行分析,研究了创业板上市公司是否为树立良好企业形象、迎合监管进行盈余管理,并探讨盈余管理动因,最后从制定上
期刊
目的:研究308nm准分子激光对皮肤色素沉着的诱导作用,为其治疗白癜风提供科学依据。方法:以正常棕黄色豚鼠皮肤为实验模型,用不同剂量的308nm准分子激光进行照射,分别采用肉眼
摘 要:本文通过运用文献资料法,专家访谈法和归纳法,根据现阶段我国武术微杂志发展的现状,提出建构武术微杂志模式的研究。结果表明:要使武术文化市场得到长远的发展以及在现今人们时间利用的碎片化的情况下满足消费需求,武术微杂志模式的建构迫在眉睫。  关键词:武术 微杂志 模式  中图分类号:G852 文献标识码:A 文章编号:2095-2813(2017)11(c)-0167-04  目前武术微杂志发展
各种类型云的辐射特性以及分布情况,对大气收支平衡以及天气气候都有重大影响,对云进行正确分类是遥感领域的重要应用和研究热点。文章基于对卫星云图进行自动准确识别和分类研究的前提,通过介绍几种特征提取和选择方法,以及介绍无监督、有监督和神经网络3类云分类研究常用分类方法,对国内外近几十年来所做的卫星云图分类研究进行综述介绍。并简要介绍了云分类结果的评价方法,对分类研究的结果进行定性讨论。
中国住房保障制度在不断深化和完善,但对残疾人住房问题关注还不够。主要体现为各地残疾人住房优惠政策只注重保障深度.而忽略了保障广度。尤其在准入条件方面很少体现出残疾人