论文部分内容阅读
Web文本自动分类技术是Web文本挖掘的关键技术之一。针对Web文档中不同标签中的文本具有不同的表达文档内容的能力,提出了改进的特征项加权计算方法。根据特征项在文档中的位置和出现频率计算其权值,并给出了具体的Web文本分类算法和评测方法。经实验验证,改进后系统的微平均查准率均大于0.8,分类性能明显好于改进前。