多语种投资信息抽取系统的实现

来源 :上海交通大学学报 | 被引量 : 0次 | 上传用户:Spring_880916
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多语种投资信息抽取实验系统可以用中文、英文和德文的关键字或限定的自然语言问句查询语料库中的中文投资信息.它由语言处理模块、查询处理模块、信息抽取核心和动态交互获取模块组成.其主要特点:基于语种无关的模板和与语种有关的模式,实现不同语种信息抽取处理的一致性;事先定义的抽取模板结合动态获取的模板,来弥补信息抽取技术依赖于固定模板的缺陷,增加系统的健壮性.系统抽取的各个槽的平均精度为86.27%.动态获取模板的精度为85.27%,如果人工对约5个例句修改,动态交互获取模板的精度可达88.55%,提高了3%左右.
其他文献
气相色谱法-质谱法联用技术(GC-MS)是结合了气相色谱的高效分离能力和质谱强大的结构分析能力相互结合的技术,由于其检测灵敏度高,适用范围广等特点,该技术被广泛应用于基础
景物描写在散文和小说中经常出现,其作用也是不容忽视的。下面就课文来谈谈景物描写的作用。  一、散文中的景物描写  散文中的景物描写多为用景物衬托歌咏对象特征,为下文做铺垫。如茅盾先生的《白杨礼赞》这样写道:“汽车在望不到边际的高原上奔驰,扑入你的视野的是黄绿错综的一条大毡子,黄的是土,未开垦的荒地,绿的呢,是麦田,和风吹起一轮轮绿波……黄绿主宰,无边无际坦荡如砥。”作者开篇成功勾勒了一幅辽阔平坦、
由于模板法可以有效地设计和调控纳米材料的形貌、结构、尺寸等,赋予纳米材料独特的性能,近年来,在介孔纳米羟基磷灰石的制备研究中,引起了学者们的广泛关注。简述了软模板法
数字时代高校图书馆面临着巨大挑战,要适应时代发展、不断提高服务质量,就必须进行创新。本文就如何创新、如何提高服务质量,提出了一些见解。
本文通过对图书馆员形象艺术本质、形象艺术基础、形象艺术表现、仪容艺术、语言艺术的简要论述来说明图书馆员形象艺术在图书馆工作中的作用及其重要性。