科技论文中学术信息的提取方法综述

来源 :数字图书馆论坛 | 被引量 : 0次 | 上传用户:zht336
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为更好地利用和挖掘学术论文文本,识别并提取学术论文中的学术信息已成为一种非常迫切的现实需求,在文本挖掘、信息检索、主题监测、信息计量学等领域都有广阔的应用前景。学术信息可以分为题录信息、章节信息、引文信息、引用信息和其他信息。本文综述了在PDF和HTML/XML两种不同格式的学术论文全文中,提取各类学术信息的主要方法,并指出这些方法主要面向的格式文本以及可用来提取的信息种类。最后,本文列出了提取学术信息的常用工具。
其他文献
2006年江苏盐城市中考语文有一道这样的仿写题:自由选取一具体形象。运用“写物寓意”的手法。创造一句“名言”。  例:船:永远在风浪中生活,但从来没有因此而停航。  [参考示例]①风筝:展翅翱翔蓝天,何愁人间无情系你。②蝴蝶:不知你获取了多少,只知道你追寻的一生都是美丽。③台灯:不可能人人都成为普照的太阳。但为任一方就得将一方照亮。  这是一道新型仿写题,新就新在要运用“写物寓意”的手法仿写,这种