融合丰富语言知识的汉语统计句法分析

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:lilac_cs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识获取一直以来是自然语言处理中的瓶颈,基于树库的统计句法分析也不例外.树库中潜在隐含的语言知识是非常丰富的,但它们并不是可以直接得到,往往需要特定的策略才能将它们融合到模型中.我们的汉语统计句法分析模型从3个方面融合潜在的丰富语言知识:1)重新标注树库中的非递归名词短语和非递归动词短语;2)设计新的中心词映射表;3)引进上下文配置框架以更具体地描述二元依存结构.由于融合了以上三种潜在语言知识,模型的F1值提高了2.37%,完全匹配正确率提高了5.36%.
其他文献
目的探讨荆州市医院感染假丝酵母菌属的分布及耐药特点,为临床控制真菌感染提供实验室依据。方法真菌培养、鉴定和药敏试验严格按照《全国临床检验操作规程》进行。结果感染
为加强医疗机构消毒供应工作的管理,预防和控制疾病的医源性传播,保障医疗安全,2009年4月1日卫生部发布的3项强制性卫生行业标准,对医院消毒供应中心的管理、人员、建筑、设
目的了解我国尿路感染常见病原菌的分布及耐药性,为临床应用抗菌药物提供指导依据。方法对49所卫生部全国细菌耐药监测网(Mohnarin)成员单位分离自尿标本的细菌进行常规鉴定,采
本文针对已婚妇女工作时间的预测问题,提出先用Tobit(审查回归)模型对影响因子进行评价和优化筛检,再利用神经网络对已婚妇女工作时间进行预测,结果表明:该方法不但提高了预测的准
从ZN公司的实际出发,考虑到ZN公司的数据现状,从基础数据、业务数据、实时数据、指标分析类数据分别对数据进行标准化建设的思路、方法、实施步骤及后续管控等进行了分析,给
新冠疫情期间,为实现“停课不停学”,线上教学成为绝大多数中小学的主要教学方式,并引起社会广泛关注。本研究通过对223名中学英语教师进行问卷调查,探究特殊时期线上教学对
目的了解医院多药耐药菌(MDROs)的分布及流行情况。方法收集医院2006年1月-2010年12月住院患者各类标本中分离出的非重复菌株资料,以WHONET5.4软件进行数据分析。结果 23 405份
目的探讨食管肿瘤行气管插管全麻术后造成肺部感染的影响因素,为临床防治提供依据。方法将医院2006年2月-2011年1月收治的5938例食管肿瘤行气管插管全麻患者临床资料进行总结
汉字切分正确与否直接影响了汉字识别系统的识别率 ,粘连汉字则是切分中的难点。本文将基于背景细化的切分方法应用于《四库全书》的两字符粘连汉字数据集 ,并针对其中切分路径选择问题 ,提出了一种新特征 -凸包像素比 ,反映了在不同切分路径下汉字结构变化的特性。实验结果表明该特征对多种分类器均能有效地提高切分路径选择的正确率。其中在使用基于高斯混合模型分类器时取得了 88 6 %正确率。
目的了解鲍氏不动杆菌感染及耐药性变迁情况,探讨其发生的危险因素,并为临床提供预防治疗措施。方法对2005-2010年某医院临床标本中分离出的802株鲍氏不动杆菌进行耐药趋势分