改进偏二叉树多类SVM的文本分类

来源 :广东石油化工学院学报 | 被引量 : 0次 | 上传用户:q6748799
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在文本分类过程中,为解决传统支持向量机(SVM)多类分类的不可分区域问题及提高分类性能,提出了一种改进的偏二叉树多类SVM算法。算法依据根据样本的分布情况计算训练集文本特征参数的信息熵,并将熵值结合欧式距离公式以确定各类文本间的相似性测度;以相似性测度作为偏二叉树结构的分类走向,对训练集进行学习,构建各个二类子SVM分类器。实验结果表明,该算法具有较高的分类性能,能更好地解决实际文本分类过程中的问题。
其他文献
本文介绍了四川攀西芒果选育研究进展及主要育种方法,并对选育种存在的问题进行了分析,提出相应对策和建议。
本文分析了地膜覆盖与对照对宿根甘蔗产量的影响,结果表明,地膜覆盖宿根蔗能促进早发苗、多分蘖、有效茎数量增加、单茎重提高;每667m^2有效茎增加502株,增产1169.7k,增收473.97元。
选取广东茂名油页岩煅烧废渣作为人工湿地基质,研究了该基质的磷吸附特性。结果表明,Laagmuir方程和Fmadlich方程都能很好的拟合人工湿地基质对磷的吸附数量,其中Langrnuir等温
深化国有企业的改革要求企业建立现代企业制度,建立和完善公司法人治理结构。董事会作为公司法人治理结构的核心,对企业的发展起着重要作用。如何加强国有独资公司董事会建设,提