基于信息增益的文本特征选择方法

来源 :电脑知识与技术:学术交流 | 被引量 : 0次 | 上传用户:qwe1658361
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在类和特征分布不均时,传统信息增益算法的分类性能急剧下降。针对此问题,提出一种改进的基于信息增益的文本特征选择方法。首先,降低了低频词对特征选择的影响。其次,使用离散度分析特征词在类间的文档频率,增加波动性大的特征词的权值。通过对比实验分析表明,选取的特征具有更好的分类性能,并且对于不平衡数据集表现也较好。
其他文献
主动配电网规划时需充分计及风、光等间歇式分布式电源的不确定因素的影响,在常规负荷预测的基础上建立了接入主动配电网的风、光等间歇性分布式电源可信出力模型,并考虑负荷
视频监控及智能传感器是与计算机相关的自动控制新技术。北京大兴花卉苗圃的监控报警系统和温室自动控制系统,应用了这些先进技术,使苗圃生产管理迈上了现代化新台阶。林业院校
目的:观察多点多轴悬吊训练对恢复期脑卒中患者躯干控制力的影响。方法:选择符合治疗条件的24例患者随机分为观察组12例、对照组12例,对照组采用常规Bobath和运动再学习技术