基于支持向量的迭代修正质心文本分类算法

来源 :北京航空航天大学学报 | 被引量 : 0次 | 上传用户：bashi0000

【摘要】

：

针对质心分类算法容易产生归纳偏置或模型失配问题的不足,提出一种基于支持向量的迭代修正质心分类算法.该方法仅使用由支持向量机(SVMs,Support Vector Ma-chines)选出的支

【作者】

：

王德庆张辉

【机构】

：

北京航空航天大学软件开发环境国家重点实验室,

【出处】

：

北京航空航天大学学报

【发表日期】

：

2013年02期

【关键词】

：

文本分类质心向量支持向量迭代修正支持向量机

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对质心分类算法容易产生归纳偏置或模型失配问题的不足,提出一种基于支持向量的迭代修正质心分类算法.该方法仅使用由支持向量机(SVMs,Support Vector Ma-chines)选出的支持向量来构造质心向量,然后利用训练集误分样本来迭代修正初始质心向量.与其他分类算法相比,该算法取得较好的宏平均F1和微平均F1,在8个常用文本分类数据集上的实验验证了该算法的有效性,特别是在不均衡文本语料上. In order to overcome the shortcomings of inductive bias or model mismatch in centroid classification algorithm, an iterative correction centroid classification algorithm based on support vector (SVMs) is proposed. This method is only used by Support Vector Machines (SVMs) Support vector to construct the centroid vector, and then use the training set to misclassify the sample to iteratively correct the initial centroid vector.Compared with other classification algorithms, this algorithm achieves good macro-average F1 and micro-average F1, and in the eight commonly used text classification data sets Experiments show the effectiveness of the algorithm, especially in unbalanced corpus.

其他文献

医师的注意能力——医师的注意义务系列研究(4)

医师的注意能力是医师认识自己的医疗行为可能产生的后果的能力,认识自己究竟采取怎样的措施才能有效地防止损害结果发生的能力和基于上述认识而采取措施,以避免损害结果发生

期刊

医师注意能力医疗水准

“ZY一期”信贷资产证券化项目案例分析

为加强评估技术方法的应用,交流资产评估业务实操,提高评估从业人员执业技能,本刊从本期开始开辟《评估案例》专栏。欢迎广大读者撰写案例分析文章,案例选取和分析应当观点独

期刊

信贷资产证券化保证人偿债能力借款人抵押物可回收金额案例分析

论油画艺术中色彩的主观表现力

在油画艺术中,艺术家主观性色彩的应用加强了作品艺术感染力和表现力,而色彩主观表现力更能使作品获得特别的精神内涵和更强烈的视觉体验。

期刊

油画艺术主观性色彩主观表现油画作品

牙轮扩孔器异材钢焊接工艺

牙轮扩孔器是海上石油钻井中的关键设备,由于受海底地质条件的影响,设计选用35CrMo和35CrMo、35CrMo和35、35CrMo和Q235-B、35和35钢焊接结构,由于多种材质组合焊接,结构焊接

期刊

钢焊接扩孔器

浅议集团公司所属微小单位经济责任内部审计

<正>经济责任内部审计是集团公司加强对负有经济责任的领导干部监督和管理,正确评价领导干部任期经济责任、量化政绩、勤政廉洁,促进领导干部全面履行职责的有效监督机制。本

期刊

内部审计审计单位

高效液相色谱法测定电合成反应液中的3,6-DCP和3,4,5,6-TCP

建立了同时测定电化学合成反应液中的3,6-二氯吡啶甲酸（3,6-DCP）和3,4,5,6-四氯吡啶甲酸（3,4,5,6-TCP）的高效液相色谱分析方法.实验采用Hypersil C18色谱柱,紫外检测器,检测波长2

期刊

高效液相色谱电化学合成36-二氯吡啶甲酸3456-四氯吡啶甲酸

基于Windows平台的键盘记录技术的研究

本文提出一种新型的键盘记录技术,该技术记录中英文,记录CMD和终端服务3389,实现DLL自装载技术以逃避检测。经过测试表明,该技术实现的键盘记录系统NKL,功能全面且隐蔽性好。

期刊

间谍软件键盘记录器线程注入钩子

复采采场再生顶板结构及支架载荷确定

为确定复采采场支架的合理承载,通过理论计算、现场观测和顶板结构探测得到了复采再生顶板的结构分带特征,建立了再生顶板结构模型;基于该结构模型,结合现场观测和相似材料模

期刊

复采再生顶板顶板结构探测支架载荷

印度的资本流动与资本账户开放

印度在上世纪90年代开始的资本账户开放,促进了印度资本流动的大发展,本文从五个方面介绍了资本账户开放的主要内容。印度的资本账户开放对印度意义重大,并取得了初步成功,其

期刊

印度资本流动资本账户开放

浅析建筑工程造价管理的发展现状以及完善对策

本文主要对建筑工程造价管理的含义进行概括，并在此基础上对工程造价管理中所出现的问题以及相关措施进行阐述。

期刊

建筑工程造价管理发展现状对策

基于支持向量的迭代修正质心文本分类算法

与本文相关的学术论文