基于t检验和弹性网的数据分类特征选择方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:stong_sz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据分类是数据挖掘领域中一类重要的问题,然而,当前的数据挖掘工作面临着大样本量、高维度数据的挑战.从数据特征中选择出有效的数据特征子集,能够使数据降维,是进行进一步数据分类的基础.目前比较流行的特征选择方法对高维数据不太适应,精度也不高.因此,提出一种基于t检验和弹性网的特征选择方法,其基本思想是通过t检验得到特征在不同类之间的差异程度,并利用弹性网回归模型对差异程度较大的特征进行分析,通过回归系数压缩和误分类率得到最终的特征子集.本文通过实验证实了此方法在准确性、稳定性及时间代价上都具有良好的效果.
其他文献
中氮茚类及含氮杂环类化合物是有机化合物中的一大分支。它们由于结构特殊而具有多种高效的药理活性。在农业、医药、工业等多种领域都需要该类化合物的参与。因此,对于它们的研究合成是十分有必要的。环丙烷结构片段广泛存在于多种天然化合物中,含有环丙烷结构单元的衍生物在医药上被广泛应用,由于环丙烷的特殊构型使其在多种领域都有着重要的应用价值。此外,它们还可作为各种有机化合物的有价值的合成中间体。因此,环丙烷的合
[目的]已有研究表明,甾体激素在生物体的生长、发育、分化、生殖等诸多方面都有重要的调控作用,而这些激素主要是通过.与作为细胞内信号传导与转录因子的特定甾体激素受体蛋
课堂导入是一节课的开始,是每节课给予学生的第一印象,它是课堂教学的重中之重。激发学生的学习动机,一般在导入新课时进行,因此导入是学习新课的重要一步。精美的新课导入,
老挝从1986年开始实行对外革新开放政策,在经过30年的发展后,国家经济和社会都取得了巨大的发展。根据经济基础决定上层建筑的发展定律,推动老挝经济进一步发展必将成为未来
黄瓜.全国各地和各个民族吃法不同。人们常见的有以下三种食法:一是酱黄瓜;二是拌黄瓜;三是炒黄瓜。也有一不酱、二不拌、三不炒。将黄瓜洗干净,拿在手中当水果一样的吃。但多数人
目的胃癌(Gastric Cancer)是世界上最常见的恶性肿瘤之一。对于局部晚期胃癌,胃切除术联合术后辅助化疗已成为目前常用的治疗方案选择,但疗后肿瘤可能再次复发。近年来,肿瘤干细胞(cancer stem cells,CSCs)被认为是肿瘤的发生,耐药,侵袭、转移和肿瘤复发的重要原因,这也是癌症相关死亡的原因之一。目前有研究报道,乙醛脱氢酶1A1(ALDH1A1)和CD133很有可能成为预测肿
词项语法(Word Grammar)是英国语言学家理查德.哈德森(Richard A.Hudson)于20世纪80年代提出并予以完善的。这种新的语法理论不仅提出了在句法分析中把词看成是唯一单位并通
目的:分析78例急性乌头碱中毒病例的临床资料,探讨其临床特征和抢救要点。方法:回顾性分析比较78例急性乌头碱中毒病例的临床特点、体征、性别、年龄等,总结出乌头碱中毒对心
在当今国民经济迅速发展的情况下,对旅游市场的需求量越来越大。但是旅游的方式还是比较单一,针对风景区的旅游还停留在游和看为主。休闲和体验式的旅游方式尚不多见,意识到
窦口鼻道复合体(Ostiomeatal Complex,OMC)是鼻科学近年来比较新兴解剖学名词。主要在中鼻甲(middle turbinate)、中鼻道(middle meatus)及附近区域解剖结构,是以筛漏斗为中