命名实体相关论文
随着互联网的发展,网络已经成为人们日常生活中必不可少的一部分。人们获取新闻时事的主要渠道已经由传统的纸质版媒介转化为以互......
通过识别机场的业务实体能够帮助管理者在网络舆情中快速定位服务中的痛点问题.旅客评价中存在较多的复杂实体并伴随有数据类别失......
神经网络模型可以有效地处理通用领域命名实体识别,然而在标注语料匮乏和包含大量噪声的特定领域,其性能通常会下降.针对这一问题,......
针对当前医学语料库涵盖实体分类以及实体关系难以满足精准医学发展需求的问题,本文从儿科疾病入手,参考现有的医学命名实体和实体......
框架下,本文针对事件发展的动态性提出了一种先进行文档过滤再进行摘要抽取的方法,其中文档过滤的原则为:体现出当前文档集合与历......
词语对齐是目前主流的统计机器翻译系统的基本模块,GIZA++是词语对齐最常用的工具,但是GIZA++的对齐结果仍然存在不足。本文从约束双......
命名实体识别是中文信息处理的一个重要问题.本文根据篇章中利用互信息识别命名实体的方法,引入词性互信息和有距离的匹配策略,通......
报纸文献主题标引、分类标引和命名实体抽取是其内容深加工的主要形式,基于知识库的自动标引是报纸文献标引自动化的一种实现方式......
本文探讨了地名的概念、构成等问题,并针对其分布特点,使用常见地名匹配、碎片分析和组合扩展相结合的方法初步识别了中文基本地名......
基于规则的方法识别维吾尔文本中的数字、日期、时间等(也称命名实体)短语表达式,将识别之后的维文短语表达式翻译成对应的汉语。......
英汉双语文本聚类是一项非常有价值的研究。使用单语言文本聚类算法,在英汉双语新闻语料基础上,对基于中文单语、英文单语和英汉双......
随着互联网这个新兴的信息传递媒体的迅猛发展,互联网信息急剧膨胀,如何从海量网络电子文档中及时准确地找到需要的信息己经成为一个......
机器翻译作为替代传统高成本的人工翻译的可行方案,具有很高的应用价值。然而,传统的统计机器翻译模型因其线性不可分、全局信息丢失......
维吾尔语命名实体识别和翻译是维汉机器翻译的基础任务,也是信息检索、信息抽取、智能问答等技术的基础,研究并实现有效的维吾尔语命......
命名实体是文本中基本的信息元素,是正确理解文本的基础.命名实体识别就是要判断一个文本串是否代表一个命名实体,并确定它的类别,......
互联网是人们发布信息和获取知识的重要平台,随着冗余信息和垃圾信息的急剧增加,快速准确地获取需要的知识成为客观需求。在此背景下......
BBS(Bulletin Board System)作为一种在拨号网络时代就已经出现的网络应用,随着Internet和技术的发展,因为其开放、自由、交互性强等......
随着网络技术和计算机技术的飞速发展,网上的信息呈带宽的指数级增长。在这样一个信息量爆炸的社会中,人们希望通过网络获得大量信......
随着互联网上网页数量的爆炸式增长,网页中知识挖掘的研究成为热门话题。命名实体是网页中人们感兴趣的专有名词和特定的数量词,表......
在自然语言处理和信息检索的领域中,语义相关度的测量一直扮演着非常重要的角色。目前很多工作都集中在词与词之间的语义相关度测量......
词义消歧(WSD)技术是计算机根据文本距离、上下文语境等特征来自动获取并确认词语的意义。词义歧义是指一词多义,即一个词在不同的......
随着网络技术的发展,网络上电子可读文本的日益增加,呈指数膨胀的文本信息资源,使得如何准确有效地获取用户所需要的信息成为人们关注......
随着互联网的迅猛发展,Web已经成为世界上最大的信息资源,各种不同的应用都在使用Web信息资源。搜索引擎是目前信息检索最常用的工具......
随着搜索引擎用户量大规模的增长,对于搜索引擎服务质量和性能提出了挑战。基于用户搜索行为过程中产生的大量搜索日志,相继展开了优......
实体间语义关系抽取是信息抽取中的重要环节,目的是通过命名实体对的上下文来确定实体之间是否存在关系以及存在何种关系。作为实体......
随着电子计算机技术和互联网的快速发展,网络知识资源呈爆炸式增长,网络资源内容多样,人们往往不能有效的获取、利用所需的网络知......
随着信息技术的发展,不同语言之间的沟通和交流变得越来越重要,在此背景下机器翻译等自然语言处理技术得到长足发展。作为当前研究......
处于大数据时代下,网络信息出现迅猛增长的趋势,互联网日趋发展成为一个信息覆盖面广的共享仓库,与此同时,对信息资源进行准确地理......
随着互联网信息的飞速发展,信息的增加在满足人们对信息需求的同时也给人们快速、准确的查找所需要的信息带来了一定的难度。在这种......
命名实体(Named Entity,NE)识别的任务是识别出文本中特定的实体,它是信息抽取、机器翻译、信息检索和自动问答等多种自然语言处理......
随着互联网技术的不断发展和应用的不断深入,在线可用的信息呈爆炸式增长。当在线的信息持续增长时,现有的搜索引擎的不足,比如系......
随着网络对传统出版物和媒体的冲击,用户对于新闻浏览习惯发生了改变,越来越多的人养成了每天在网络上浏览新闻的习惯。本文研究如......
随着世界经济一体化的进展,各国之间互联网交流更为广泛、频繁,互联网信息的多语种特点,给交流带来的语言障碍日显突出。为解决语......
随着社会的发展,互联网信息呈现爆炸式的增长,通过观察网民提交的文本发现,大多数网站特别是新闻和政府的网站,文本信息都具有结构......
随着计算机的快速普及和Internet技术的迅猛发展,网络上的各种信息呈现指数级的增长,Web已经成为一个巨大的信息资源库,从海量数据中......
命名实体(Named Entity, NE)是指文本中承载着人名、地名、组织机构名等重要信息的词语。命名实体识别(Named Entity Recognition,......
双语实体在跨语言信息检索、机器翻译等领域有着非常重要的应用。由于缅甸语为资源稀缺语言,汉-缅双语语料库构建面临着很多困难。......
词对齐技术是统计机器翻译中的翻译模型和调序模型的基础,这表明了词对齐技术是统计机器翻译系统中最重要部分。同时,词对齐技术在......
在家庭机器人研究领域,如何将语音指令正确地转化为机器人可执行的任务序列已经成为重要的研究课题之一。解析指令的能力成为机器......
随着一带一路的大力发展,中国与东南亚各国的交流也逐渐频繁,中国和老挝国自古以来关系密切,语言作为重要的交流工具,加强对老挝语......
本论文为比较研究中蒙两国蒙古语网络语言词汇的特点,从中国和蒙古国的共20个蒙古文和基里尔文网站的《时事政治》、《财经》和《......
学位