论文部分内容阅读
基于结构风险最小化的SVM(支持向量机)统计学习理论随着样本数量的增加,不仅训练模型的时间开销会非线性地增长,而且分类的时间开销也会随着支持向量个数的增加而增大。为了使语言分析模型涵盖足够的语言现象并能快速完成模型训练和句子分析,采用了先将组块识别看成文本切分的二分类问题的办法,通过SVM对语料中不同类别词语分别建模,再从组块的构成知识进一步判定组块类型。实验结果表明,这种方法的分析速度和准确率都有一定的提高。