论文部分内容阅读
本文设计并实现了领域汉语理解中的智能分词系统及其未登录词的识别模型,并将其应用于产品的设计过程,依托整个领域汉语理解系统实现了以自然语言形式描述的用户设计要求到计算机能够识别的概念设计要求或设计参数的转化。首先,分析了现有的分词系统设计的优点及其存在的不足,提出了基于系统论的机械分词和基于语义理解的分词相结合的智能分词模型,并将此智能分词模块嵌入到整个领域汉语理解系统中。在机械分词阶段智能分词系统提供了所有可能的分词结果,并进行词法分析级别的歧义排除,在后续的汉语理解系统的语义分析模块中排除存在语义歧义的分词结果,最后利用体现其智能性的反馈模块将理解结果反馈回分词词库,实现分词系统和整个自然语言理解系统的自我完善和良性互动。其次,在未登录词识别模块本文主要介绍了中文人名和机构名的识别方法,提出了规则和统计相结合识别中文人名的方法,以及基于模板匹配识别机构名的方法。最后,结合实际将领域汉语理解中智能分词系统和未登录词识别模块应用于产品设计的用户需求分析领域,通过系统测试,结果比较令人满意。