论文部分内容阅读
本文对几何自然语言理解技术进行了研究。文章指出,几何自然语言理解的过程可以分为两个部分,中文分词和语义理解。中文分词首先需要构建一部分词词典,对平面几何中的一些例子进行分析,在把句子中常用的一些词归纳、整理后,分为几何元素、几何关系、方位与动作、辅助词、标识字符、数字、断句符号、格式符号共八类词语,把这些词放入分词词典。对于输入的几何自然语句,按照词典内容采用最大匹配原则来进行句子和词类的切分。相对于中文分词,语义理解不是对“词典”中单个孤立词的理解,而是对于短语、句子的理解。可以参照分词词典构建一个规则库,然后把短语和句子对照该规则库进行匹配,实现语义理解。本文探讨了中文分词、语义理解和JavaCC编程实现的一些问题和技巧。