一种开放式中文命名实体识别的新方法

来源 :第五届全国信息检索学术会议CCIR2009 | 被引量 : 0次 | 上传用户:mmghb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究开放式中文命名实体识别问题。针对传统命名实体识别方法具有训练语料标注困难,自适应能力不强等缺点,研究人员提出了开放式的命名实体识别。但由于汉语的特殊性,使得开放式中文命名实体识别的相关研究很少,效果也不理想。本文提出了一种开放式中文命名实体识别方法,模拟语言习得的过程,从句子结构出发,通过分类器得到含有命名实体的碎片序列,进而从中抽取出命名实体。实验结果表明,该方法可以较好地从不限领域的中文文本中抽取不限类别的命名实体。
其他文献
“两弹一星”是20世纪中叶我国国防尖端科技领域取得的巨大成就,是中华人民共和国发展史上具有里程碑意义的惊世创举。本文介绍了“两弹一星”工程的发展过程,浅谈了“两弹一星
谢雍是他的笔名,实名叫谢学鉴。他不仅是书法家,而且在篆刻、绘画、诗词楹联、根雕、赏石等诸多方面都有属于自己的骄人成就。谢雍多才,在书法界属于书品人品皆有口碑的人物,
“两弹一星”的研制成功是我国20世纪最辉煌的历史成就之一,使中国一举成为世界上少数几个独立掌握核技术和空间技术的国家。以“两弹一星”为代表的尖端战略武器装备,使我国在
张爱萍同志是我国国防科技事业的杰出领导者,他呕心沥血铸利剑,为发展以“两弹一星”为主要标志的国防尖端科技事业,建立国防工业体系,提高我军武器装备的现代化水平,付出了大量心
本文介绍了高度重视科学技术在社会主义建设事业中的关键作用、参与组织领导制定和实施了我国第一个科技发展规划《1956-1967年科学技术发展远景规划纲要》,全面推进我国科学
伟大的无产阶级革命家周恩来同志为我国的革命和建设事业建立了丰功伟绩。在我国的科技事业中,同样凝结着周恩来的辛勤劳动和卓越智慧,他是新中国科学技术事业的伟大奠基人。本
人物关系抽取是实体关系抽取研究的一个重要分支。本文提出了一种基于搜索引擎的人物社会关系抽取方法。该方法首先将人物关系特征词与测试集人名一起作为组合关键词提交到搜
会议
目前,中国硝酸硝铵产能和产量已经自给有余,且在生产技术、安全管理方面逐渐成熟,但整个行业发展中存在着产能过剩、创新能力不强问题。未来硝酸硝铵应发挥自身优势,通过发展
针对专利文献的特点,本文提出了一种基于统计和规则相结合的多策略分词方法。该方法利用文献中潜在的切分标记,结合切分文本的上下文信息进行最大概率分词,并利用术语前后缀规律
句际语义关系是指语篇上下文中相邻句子之间存在的语义关系。准确的识别句际语义关系对于文本理解、文本推理和文本结构分析具有重要的意义。然而,由于受到语篇上下文环境、指
会议