论文部分内容阅读
随着网络的迅猛发展,海量文本信息正在以几何级数不断增长,自动分类技术已成为文本信息分类的主导关键技术。自动分类技术可分为自动聚类和自动归类两种类型,现有的文本分类技术主要采用基于连接、基于规则和基于统计等三种方法。随着数据挖掘领域和机器学习理论、技术研究的不断深入,解决不同实际应用和数据特征的问题将成为文本分类相关研究及其应用的主要突破方向和攻克难点。