一种基于文本分类的特征选择方法

来源 :南昌大学学报:工科版 | 被引量 : 0次 | 上传用户:sws1274
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类中通常采用向量空间模型(VSM)来表示文本特征,如何选择最能够表达文本主题的特征词,从而减少特征空间维数,降低时空复杂度,是一个十分重要的问题。针对此问题本文提出了采用截集模糊C-均值(S2FCM)聚类进行类间特征降维,该方法以最大隶属度原则为指导,在保持模糊聚类的同时,提高收敛速度,并且能够提高特征选择的正确性。同时在算法中使用改进的隶属度、聚类中心计算方法并使用非随机方法确定初始聚类中心。最后实验表明采用该方法选择的文本特征项进行文本分类能够收到比较好的分类结果。
其他文献
目的研究参麦注射液联合黄芪注射液治疗小儿病毒性心肌炎的临床疗效。方法将160例病毒性心肌炎患儿随机分为治疗组84例和对照组76例,在对照组一般治疗、保护心肌的基础上,治
目的对复方芙蓉泡腾栓的泡沫量检查提出修改建议。方法查阅资料,并对复方芙蓉泡腾栓的泡沫量检查方法进行验证。结果复方芙蓉泡腾栓泡沫量检查内容不完整、检查方法欠科学。
2008年7月20~22日甘肃河东出现了一次区域性暴雨天气,对这次过程的环流形势演变、主要影响系统和物理量场特征进行分析。结果表明:在有利的环流形势下,高原低涡东移发展是造成此
目的建立测定富马酸酮替芬滴鼻液中富马酸酮替芬含量的反相高效液相色谱法。方法采用Agilent SB-C18色谱柱(250 mm×4.6 mm,5μm),流动相为甲醇-0.1%磷酸溶液(50∶50),流速1.
2010年(2010年3月-2011年2月),全国大部分省份均发生了不同程度的旱情,旱区农业、人畜饮水以及江河水位等受到不同程度的影响。大气环流异常,不利于水汽的输送是导致各地干旱少
以改进自动编程系统为目的,通过对CAX集成系统工作模型的研究,在比较当前几种流行的数据交换技术的基础上,提出了一种采用XML语言作为数据交换标准的信息集成解决方案,构造基于XML的CAX系统全局产品数据库共享模型.用.NET平台C#语言开发实例说明运用ObjectARX进行AutoCAD二次开发的过程和方法,包括CAD图元识别技术、XML与AutoCAD图形数据转换技术、XML与NC代码的转换技术
2007年笔者在河南省虞城县北部沿黄背河洼地池塘中进行泥鳅无公害养殖试验,取得了较好的养殖效果,现将养殖技术介绍如下: