融合丰富语言知识的汉语统计句法分析

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：lilac_cs

【摘要】

：

知识获取一直以来是自然语言处理中的瓶颈,基于树库的统计句法分析也不例外.树库中潜在隐含的语言知识是非常丰富的,但它们并不是可以直接得到,往往需要特定的策略才能将它们

【作者】

：

熊德意刘群林守勋

【机构】

：

中国科学院,中国科学院

【出处】

：

中文信息学报

【发表日期】

：

2005年3期

【关键词】

：

人工智能自然语言处理统计句法分析非递归短语中心词映射表上下文配置框架 artificial intelligence natural language

【基金项目】

：

国家高技术研究发展计划(863计划)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

知识获取一直以来是自然语言处理中的瓶颈,基于树库的统计句法分析也不例外.树库中潜在隐含的语言知识是非常丰富的,但它们并不是可以直接得到,往往需要特定的策略才能将它们融合到模型中.我们的汉语统计句法分析模型从3个方面融合潜在的丰富语言知识:1)重新标注树库中的非递归名词短语和非递归动词短语;2)设计新的中心词映射表;3)引进上下文配置框架以更具体地描述二元依存结构.由于融合了以上三种潜在语言知识,模型的F1值提高了2.37%,完全匹配正确率提高了5.36%.

其他文献

荆州市假丝酵母菌属医院感染的菌群分布及耐药性探讨

目的探讨荆州市医院感染假丝酵母菌属的分布及耐药特点,为临床控制真菌感染提供实验室依据。方法真菌培养、鉴定和药敏试验严格按照《全国临床检验操作规程》进行。结果感染

期刊

假丝酵母菌属医院感染白色假丝酵母菌抗真菌药物Candida Nosocomial infection Candida albicans Antif

供应室设备现状与配置建议

为加强医疗机构消毒供应工作的管理,预防和控制疾病的医源性传播,保障医疗安全,2009年4月1日卫生部发布的3项强制性卫生行业标准,对医院消毒供应中心的管理、人员、建筑、设

期刊

供应室设备建议

Mohnarin 2011年度报告：尿标本细菌耐药监测

目的了解我国尿路感染常见病原菌的分布及耐药性,为临床应用抗菌药物提供指导依据。方法对49所卫生部全国细菌耐药监测网（Mohnarin）成员单位分离自尿标本的细菌进行常规鉴定,采

期刊

卫生部全国细菌耐药监测网尿路感染病原菌耐药性Mohnarin Urinary tract infection Pathogen Drug resi

基于Tobit—BP网络组合测评模型

本文针对已婚妇女工作时间的预测问题，提出先用Tobit（审查回归）模型对影响因子进行评价和优化筛检，再利用神经网络对已婚妇女工作时间进行预测，结果表明：该方法不但提高了预测的准

期刊

BP神经网络TOBIT模型

ZN公司数据标准化实施方案设计

从ZN公司的实际出发,考虑到ZN公司的数据现状,从基础数据、业务数据、实时数据、指标分析类数据分别对数据进行标准化建设的思路、方法、实施步骤及后续管控等进行了分析,给

期刊

大数据基础数据标准化数据标准化业务数据实时数据

特殊时期线上教学对中学英语教师教学的影响

新冠疫情期间,为实现“停课不停学”,线上教学成为绝大多数中小学的主要教学方式,并引起社会广泛关注。本研究通过对223名中学英语教师进行问卷调查,探究特殊时期线上教学对

期刊

线上教学中学英语教学影响

861株多药耐药菌耐药表型回顾性分析

目的了解医院多药耐药菌（MDROs）的分布及流行情况。方法收集医院2006年1月-2010年12月住院患者各类标本中分离出的非重复菌株资料,以WHONET5.4软件进行数据分析。结果 23 405份

期刊

医院感染多药耐药菌表型Hospital infectionMultidrug-resistant organismPhenotype

食管肿瘤行气管插管全麻术后肺部感染临床分析

目的探讨食管肿瘤行气管插管全麻术后造成肺部感染的影响因素,为临床防治提供依据。方法将医院2006年2月-2011年1月收治的5938例食管肿瘤行气管插管全麻患者临床资料进行总结

期刊

食管肿瘤气管插管全麻术肺部感染Esophageal neoplasm Endotracheal intubation General anesthe

基于凸包像素比特征的粘连汉字切分

汉字切分正确与否直接影响了汉字识别系统的识别率 ,粘连汉字则是切分中的难点。本文将基于背景细化的切分方法应用于《四库全书》的两字符粘连汉字数据集 ,并针对其中切分路径选择问题 ,提出了一种新特征 -凸包像素比 ,反映了在不同切分路径下汉字结构变化的特性。实验结果表明该特征对多种分类器均能有效地提高切分路径选择的正确率。其中在使用基于高斯混合模型分类器时取得了 88 6 %正确率。

期刊

人工智能模式识别粘连汉字汉字切分背景细化凸包artificial intelligence pattern recognition touchi

2005-2010年鲍氏不动杆菌耐药趋势分析

目的了解鲍氏不动杆菌感染及耐药性变迁情况,探讨其发生的危险因素,并为临床提供预防治疗措施。方法对2005-2010年某医院临床标本中分离出的802株鲍氏不动杆菌进行耐药趋势分

期刊

鲍氏不动杆菌耐药性趋势分析Acinetobacter baumannii Drug resistance Trend analysis

融合丰富语言知识的汉语统计句法分析

与本文相关的学术论文