融合CHI与信息增益的情感文本特征选择

来源 :西安工程大学学报 | 被引量 : 0次 | 上传用户:houqiusheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对卡方统计量(CHI)忽略低频词对文本分类的影响以及信息增益(IG)只考虑对整体的贡献,忽略对局部影响的问题,通过分析CHI和IG特征选择算法,提出融合CHI和IG,适用于情感文本分类的文本特征选择算法(CHI -IG).该算法在CHI和IG 2种特征选择算法中增加了权值,集合这2种特征选择算法的优点,降低了2种方法不足带来的影响.并在此基础上对情感词的特征值附加权值区别于非情感词.基于该算法并采用随机森林(Random Forest)和支持向量机(SVM)分类方法对情感文本进行分类实验.结果表明,该方
其他文献
利用热重分析技术研究了不同载气流量、载气气氛和升温速率下柴油的热解过程.比较分析了单一反应模型和DAEM模型对柴油热解动力学分析的适应性.结果表明,单一反应模型不能在
采用管式炉研究了在O2/CO2气氛下燃烧温度对PM2.5排放特性的影响.实验采用荷电低压撞击器(ELPI)采集和分析燃烧后的PM25.结果表明,燃烧温度是燃烧过程中影响PM25生成的重要因素.对于
我国应系统地研究制定煤化工用煤的技术标准用以指导和规范我国的煤化工用煤。完善的煤化工用煤技术标准应包括基础、煤炭资源评价、用煤技术条件和用煤管理等4类。目前《煤
国有林场属于林业的重要内容之一,是我国林业建设的主体,具有举足轻重的作用。本文从人力资源的角度出发,分析我国国有林场在人力资源管理方面出现的问题,以及一一对应分析这些存