【摘 要】
:
特征选择是中文文本分类的一个重要研究领域,是提高学习算法性能的一个重要手段,也是模式识别中数据预处理的关键步骤。该文对特征提取的定义及其分类进行了深入分析,介绍了
【基金项目】
:
国家高技术研究发展计划(项目编码:2012AA101008)
论文部分内容阅读
特征选择是中文文本分类的一个重要研究领域,是提高学习算法性能的一个重要手段,也是模式识别中数据预处理的关键步骤。该文对特征提取的定义及其分类进行了深入分析,介绍了几种常用的经典特征选择方法,并针对特征选择研究过程中存在的不足,提出了基于方差分析的χ2统计特征选择改进算法。该算法在引入方差分析思想的基础上,向传统的χ2统计特征选择算法融入特征频数、文档间均衡因子和文档内均衡因子三个元素和一个制约条件,对于提高其性能方面起到很大作用。
其他文献
欧洲联盟可以说是当今国际社会的“制度典范”,众多超国家和政府间制度构筑了欧洲联盟内的制度框架。新制度主义以其强大的学科背景和众多流派在解释欧盟内超国家机构的权力扩
美国在后冷战时期拥有世界上首要的和最高的权力。这一现实令美国和世界各国都要做出新的抉择。一方面,“单极时刻”并不代表“单极时代”,在面临诸多竞争者的多极化时代,美国应
首次利用电感耦合等离子体发射光谱研究木薯皮的矿物质的种类及含量,又利用超临界及传统提取方法得到木薯皮不同极性部位的化学成分,并通过气-质联用、红外光谱、核磁共振技术
一直以来,描述文学自身的发展规律是文学史书写的主要模式,这种书写模式为文学史的合法存在提供了可靠的依据。然而,一种文学现象替代另一种文学现象的确定性书写极易忽略文学现
国家意识是一个国家占主导地位的自身定位意识。日本近代的‘"脱亚入欧",是确定日本跻身欧美列强的国家意识。为实现此目标,日本采取批判以中华文化为主导的东亚文明,丑化中华民族
论文不仅反对区分人道主义和历史唯物主义的"两个马克思论",而且不认为异化劳动理论是马克思过渡性的和不成熟的理论。马克思通过异化劳动把费尔巴哈的感性原则与黑格尔的活动
近年来,大多数西方国家都对行政区划体制进行了改革,以便适应政治、经济、文化和社会的发展变化。简化行政区划层次、坚持行政区划的经济发展取向和扩大中下层行政区划幅度,构成
探讨橡实壳中植物多酚的提取工艺,以普鲁士蓝法测定多酚含量,在单因素试验的基础上,采用正交试验,由极差分析得知,在本试验所考察的影响因素中,提取温度的影响最大,其次是时
摘要:目前,学校小型办公室网络以宽带接入为主,由于是交换机互联接入,造成网络繁杂拥挤,网线密布。如果采用无线局域网,就更容易实现办公室之间计算机互联,又能实现在办公室任何地方移动上网并不用更改线路,方便实用。本文就办公室实现WLAN无线方案作深入探讨。 关键词:无线AP;宽带;路由器;AC 中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2016)26-0040-02
以黄粉虫脱脂粉为主要辅料,通过单因素试验、正交试验,确定黄粉虫高蛋白火腿肠的最佳配方为:黄粉虫脱脂粉粗细度为100目,猪肉与黄粉虫脱脂粉的质量比为73∶27,猪肉的肥瘦质量