【摘 要】
:
目前,在自然语言处理领域中,信息抽取已经成为人们研究的热点。信息抽取系统获得的信息不仅可以直接提供给用户,还可以作为构建智能查询系统和数据挖掘系统的基础,有着广阔的
论文部分内容阅读
目前,在自然语言处理领域中,信息抽取已经成为人们研究的热点。信息抽取系统获得的信息不仅可以直接提供给用户,还可以作为构建智能查询系统和数据挖掘系统的基础,有着广阔的应用前景。实体属性抽取和事件抽取作为信息抽取的两个方面,都侧重于为一些具体应用提供前期操作。实体属性抽取可以应用于定义新的实体、数据挖掘等实际应用,而事件抽取则可以应用于事件分类、事件跟踪等实际应用。本文采用自学习的方法进行实体属性抽取,利用最大熵模型进行事件抽取,具体的研究工作主要集中在以下几个方面:1.领域特征识别。领域特征识别是实体属性抽取的准备工作。本文采用自学习的方法进行领域特征识别,首先使用领域词汇作为种子词识别领域特征;然后根据领域特征总结得到的规则识别领域特征和相应的领域词汇;最后将新的领域词汇当作新种子词重新进行领域特征的识别,直到没有新的领域词汇出现。实验结果达到预期的效果。2.实体属性抽取。实体属性抽取的任务是抽取属性及属性值。本文的实体属性抽取建立在句法分析的基础之上,利用规则与统计相结合的方法实现。首先对已识别领域特征的文本流进行词法分析和句法分析,从得到的句法树中抽取出可能包含属性与属性值的句法块,进而从句法块中抽取出属性及相应的属性值。3.事件抽取。本文利用最大熵模型进行特定领域的事件抽取,首先分别使用统计和规则的方法识别事件元素对应的实体,然后通过最大熵模型判断事件元素是否属于该事件,从而实现事件抽取。该方法取得较好的实验结果。
其他文献
绩效考评是一种先进的现代管理方式,是激励和约束员工行为、实现组织战略目标的重要工具。当下,采编绩效考评方法在各大媒体普遍运用,但实施效果并不令人满意。本文针对绩效
设计工时管理是设计管理的基础,在准确把握设计工时数据的基础上,进行科学地设计工时分析和设计负荷平衡,建立满足生产需求和设计能力的设计计划,为缩短设计周期和提高设计效
从理论和实践上对一个40位的高性能算术逻辑部件(ALU)进行了全定制设计。首先研究了高性能ALU的设计方法,对多种加法器进行了性能比较,在超前加法器中提出了先行进位理论与并
心血管疾病是威胁人类生命的最主要的疾病之一,对心脏病人在家中进行心电远程监护(ECG Telemonitor)可以使心脏病人得到及时有效的治疗。本文介绍了一种心电远程监护系统软件
刑事诉讼中的告知义务主要是为国家专门机关设定的程序义务,其目的在于规制其诉讼行为,防止其滥用权力,保证诉讼程序的公正性。设定告知义务的价值目标是为了平衡控诉与辩护
生产性服务业是现代服务业的核心和最主要组成部分,它的发展对于我国新型工业化、产业结构升级和形成新的产业发展模式具有极其重要的战略意义。本文以承接产业转移为背景,以
随着我国城市化进程的加快,城市污水处理率逐年提高,城市污水处理厂的污泥产量也急剧增加。将产量巨大,成分复杂的污泥无害化、资源化,是目前世界环境领域瞩目的研究课题之一
目的:运用免疫组化等方法通过对不同年龄实验犬椎间盘内组织学、细胞学变化进行观察,探索不同年龄犬椎间盘内组织的差异并由此探讨自发性犬退变模型的可行性与科学性;在上述研
九年一贯制学校作为新生事物,在办学模式方面有许多经验,但是在管理模式上经验欠缺,有待深入研究,因为只有科学的学校管理模式才能实现学校教育教学质量的提高,才能实现素质
城市污水污泥是城市化进程中产生的固体废弃物,这些城市固体废弃物的处理处置是一个必须尽快解决的问题。利用污水污泥制备陶粒,不仅充分利用了污泥中的有机质作为焙烧过程中