论文部分内容阅读
目前信息模板的抽取是中文信息自动抽取中的一个主要困难.本文提出将文本中每个子句都看作样本,利用模糊聚类分析将文本中的句子进行分类,从而完成文本中信息的分类,最终实现信息模板的自动形成.通过对常用的基于模糊等价关系的聚类分析算法的分析,我们发现它们的复杂度都过大,很难实用于中文信息中大文本数据的处理.因此我们提出了一类新的快速模糊聚类算法,它具有准线性的速度和较高的聚类精度.