论文部分内容阅读
本文根据汉语自身的特点,及不同汉语语块具有的不同敏感特征,从多Agent理论入手,进行了基于多Agent策略的汉语语块模型的探索。本文研究从以下几个方面展开:1、对比分析了四种传统主流语块识别模型在汉语识别中的性能,从理论和实验结果两方面研究了这些模型的特点,揭示了造成这些模型在识别英语和汉语时性能差异的原因。明确了当前汉语语块识别的主要问题。2针对汉语语块识别特征灵活和语料规模较小的现状,提出了一种基于多Agent策略的汉语语块识别模型。此外,本文还对汉语语块识别中关键的名词语块的识别提出了词性串规则结合边界统计的算法,最终得到了较好的识别结果。3在利用各种不同的敏感特征识别语块时,对最优规则集进行总结,并规划解综合的结构。最后,综合运用本文所研究的各种方法,实现了一个支持基于多Agent策略的汉语语块识别系统。