论文部分内容阅读
本文设计并实现了面向测试计量技术领域基于统计的分词系模型,并将其应用于产品的设计过程。该模型依托整个领域汉语理解系统实现了以自然语言形式描述的用户设计要求到计算机能够识别的概念设计要求或设计参数的转化。本文分析了中文分词的特点和难点,结合现有的分词方法,提出了机械分词方法、基于语料库的统计分词方法和知识表示相结合的分词模型,并将此分词模块嵌入到整个领域汉语理解系统中。在机械分词阶段,本分词系统提供了所有可能的分词结果,并初步的歧义排除。在统计阶段,利用基于语料库的统计方法对初次切分结果进