【摘 要】
:
随着计算机的普及以及互联网的迅猛发展,大量的信息以电子文本的形式出现在人们面前。为了应对信息爆炸带来的挑战,迫切需要一些自动化的工具帮助人们在海量信息源中迅速找到
论文部分内容阅读
随着计算机的普及以及互联网的迅猛发展,大量的信息以电子文本的形式出现在人们面前。为了应对信息爆炸带来的挑战,迫切需要一些自动化的工具帮助人们在海量信息源中迅速找到真正需要的信息。信息抽取(Information Extraction)研究正是在这种背景下产生的。信息抽取的主要目的是将无结构的文本转化为结构化或半结构化的信息,并以数据库的形式存储,供用户查询以及进一步分析利用。信息抽取有三个基本任务,命名实体识别、实体关系抽取和事件发现。实体关系抽取不仅是信息抽取的一项重要任务,也是事件发现和多种应用系统的基础,具有重要意义。实体关系抽取的基本任务是寻找并判定实体对之间存在的特定关系。当前主要的抽取技术可分为基于知识库的抽取算法、基于特征向量的机器学习算法、基于核函数的机器学习算法、基于模式的Bootstrapping算法。本文的工作在命名实体识别的基础上重点研究了实体关系抽取技术并实现了一个完整的实体关系抽取系统。通过深入分析关系抽取技术的重点和难点以及现有技术的特点和不足,设计实现了基于改进的语义核
其他文献
通过在单个芯片上集成成千上万个简单处理核来获得高性能和高吞吐量,已成为目前计算机体系结构研究的热点。虽然众核芯片上的单个简单处理核不具备复杂控制逻辑,在开发指令级
近些年来,由于移动通信和蜂窝电话的发展趋势非常迅速,无线设备网络容量的需求与频率资源的受限已在实际网络运营中日益暴露,并严重困扰着各个移动通信运营商。合理的网络规划和
随着计算机技术的不断发展,特别是网络技术的不断发展,企业信息系统和以往相比,也有了巨大的进步。企业级的应用不再满足于单机系统和简单的客户/服务器系统,而是向着三层或
数据挖掘中的分类与聚类问题一直都是研究的热点,因为它们贴近实际生活,能为人们提供各种应用模型。近年来对分类和聚类的研究也从纵向研究逐渐转变为横向研究,即与其他算法进行
随着高性能计算机技术的迅猛发展,高性能计算机逐渐在很多行业的得到应用。网格技术的迅猛发展更是促进了高性能计算机的使用。要充分发挥高性能计算的效能,要有与之相适应的软
随着互联网络的普及,网络安全问题日益严重,单一的安全软件或安全设备已经不能满足对于安全状况的需求,因此,网络安全管理平台应运而生。一个完整的网络安全管理平台能够集成多种
分布式虚拟环境(Distributed Virtual Environment,以下简称DVE)就是工作在各自工作站的多个用户进行交互的一个共享的虚拟环境。一部分工作站(基础系统,Basic System,简称BS
缓冲区溢出漏洞一直是安全漏洞的最常见的一种形式。近年来,在CERT/CC(Computer Emergency Response Team/ Coordination Center)发布的公告中,关于缓冲区溢出漏洞的占50%以
本文主要介绍了多CCD大幅面扫描仪底层驱动程序的结构及设计方法。论文主要涉及三方面的内容:WDM驱动程序模型的介绍,LM9833芯片的结构说明,以及扫描仪底层驱动程序的设计。
数字签名技术是提供认证性、完整性和不可否认性的重要技术,因而是信息安全的核心技术之一,是安全电子商务和安全电子政务的关键技术之一.随着对数字签名研究的不断深入,随着电