文本分类中一种混合型特征降维方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:chad
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于特征选择和特征抽取的混合型文本特征降维方法,分析基于选择和抽取的特征降维方法各自的特点,借助特征项的类别分布差异信息对特征集进行初步选择。使用一种新的基于PCA的特征抽取方法对剩余特征集进行二次抽取,在最大限度减少信息损失的前提下实现了文本特征的有效降维。对文本的分类实验结果表明,该特征降维方法具有良好的分类效果。
其他文献
为了能使五年一贯制毕业生在社会上寻求职业,更好地发展,本文结合学校实际,从严格的管理、职业生涯规划、创造良好的育人环境等方面,加以理论和实践相结合的论述。
研究基于微聚类算法的VoIP压缩码流说话人识别算法。给出直接从G.729,G.723.1(6.3Kb/s),G.723.1(5.3Kb/s)压缩语音的码流中提取识别参数,以微聚类算法作为识别结构的说话人识别算法。实验结
背景:髋关节置换患者中维生素D低水平的发病率及其影响国内尚未有过报道。全髋关节置换的患者维生素长期处于低水平状态没有受到足够的重视。目的:确定接受全髋关节置换患者置
<正>湖州师范学院文学院马明奎教授著,中国社会科学出版社2016年1月出版。本书以原型意象为逻辑起点,建构了中国少数民族文学的叙事性理论体系,并以此阐释满都麦、南永前、张
IA-64体系结构使用软件流水提高程序的执行性能,但产生的二进制代码跟机器特性紧密相关,给代码跨平台移植造成了困难。该文针对IA-64体系结构下软件流水的特点,提出2种软件流
无论是对于极值理论,还是在金融和风险理论中,分布函数的尾部性质都具有极其重要的意义.而分布函数的极值指数γ在刻画尾部性质时起到了很大的作用,并且金融时间序列的分布一
随着时代的不断发展,社会对人才素质的要求越来越高,家长对孩子教育的重视程度也不断增加,加之近几年房地产市场起伏不定,学区房成为社会的焦点之一。而学区房的热炒这一不符
据媒体报道,2016年11月3日凌晨,来自山东青岛的女留学生江歌在东京都中野车站接回同住的女友刘鑫时,在公寓楼门口遇到刘鑫的前男友,双方发生了争吵,继而遭到该名男子杀害。近日,一
报纸
本文旨在通过对我国当前中小企业现状展开分析,寻找在危机条件下的市场机遇,探讨中小企业应如何采取措施自救度过危机。1、利用全球产业转移机遇,加速产业结构的升级;2、利用
随着我国证券市场的蓬勃发展,证券投资基金作为市场参与主体,其规模和数量迅速增长,基金规模问题也引起了广泛的关注。我国基金的运作是否越大越好?在现在的国情下,是否存在一个