一种改进的文本分类特征选择方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:chouchouzhuzhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类中特征空间的高维问题是文本分类的主要障碍之一。特征选择(Feature Selection)是一种有效的特征降维方法。现有的特征选择函数主要有文档频率(DF),信息增益(IG),互信息(MI)等。基于特征的基本约束条件以及高性能特征选择方法的设计步骤,提出了一种改进的特征选择方法SIG。该特征选择方法在保证分类效果的同时,提高了对中低频特征的偏向。在语料集Reuters-21578上的实验证明,该方法能够获得较好的分类效果,同时有效提高了对具有强分类能力的中低频特征的利用。
其他文献
<正>珠海市位于广东省南部,珠江口西岸,是全国唯一以整体城市景观入选"全国旅游胜地四十佳"的城市。香洲城区是珠海市政府所在地,也是珠海市经济、生活、文化、交通中心,常住
经过30多年的发展,我国小城镇数量不断增加,特色小城镇由于自身基础条件的优越性已经逐步走向不断发展的道路,而其它大多数传统小城镇由于受资源环境、区位交通、思想观念等
随着我国居住区设计和建设质量的不断提高,对北方地区水景景观设计的要求也随之提上日程,我国北方居住区水景的设计在目前由于各种原因,会存在一系列的问题,针对这些问题,本
社会主义核心价值观是当代中国精神的集中体现,凝结着全体人民共同的价值追求。全国人民积极响应抗疫防控战争,彰显了社会主义核心价值观的强大精神力量。习近平总书记强调,
提出了一种结合小波变换的从明暗恢复三维形状的最小化方法,该算法利用图像小波变换各个子频段的不同频率特性和方向特性,分别采用不同的算法重构。在图像被分解后的低频区域采用小波直接提取自然条纹相位,高频区域使用最小化方法重构。这种方法在低频区域避免了SFS最小化方法的假设条件,而高频区域又发挥了它对细节部分重构的优势。实验结果表明该算法比单独使用最小化方法的误差要小。
在新课程推进过程中,许多音乐教师或因为对教学新理念缺乏深层次的理解和思考,没有很好地从音乐的本位去挖掘教学资源,导致了音乐课缺乏"音乐味"。音乐课要上出"音乐味",应充分发
序说1988至1995年,敦煌研究院石窟考古研究所对敦煌莫高窟北区石窟进行了系统发掘,出土了大量的汉文、梵文、藏文、西夏文、叙利亚文、古回鹘文以及蒙古文文献,并整理出版《
尽管越来越多的置乱算法被提出,如Arnoldcat变换、Hilbert变换、幻方变换和基于混沌置乱变换等,但是针对这些置乱算法的衡量方法却很少,现有的方法都是基于某一种置乱变化而提出的,通用性不强。从图像置乱均匀分布的角度出发,定义了理想置乱状态的模型,并根据理想状态的特点提出了一种图像置乱衡量方法,通过比较置乱效果与理想状态的偏离度来评价置乱效果的好坏。对Arnoldcat变换进行了仿真分析,实