面向大数据的增量式学习算法研究

被引量 : 0次 | 上传用户:jeremy008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据规模快速增长,能够处理大数据集的数据挖掘算法得到了广泛的研究和应用,成为目前研究的热点之一。本文主要研究了面向大数据的增量式特征选择和增量式分类学习算法。论文的主要研究工作有以下两个内容:(1)以条件互信息作为度量标准的基础上进行增量式的特征选择算法,主要通过将大数据模拟数据流并划分为数据块,增量对特征子集进行信息度量,提高运算效率,最终得到特征子集。为了验证所改进的增量特征选择算法的有效性,在UCI实验数据集上进行模拟实验比较分类性能。通过实验表明,增量特征选择(I-MIFS)算法在大多数情况下都比其他算法要好,I-MIFS算法是一种适合大规模数据集的特征选择算法。(2)在神经网络集成的基础上研究增量式大数据学习算法:研究了运用改进的Boosting技术完成个体神经网络的生成和最后结果的集成,将分类边界的错分样本作为研究目标,使集成的神经网络可以进行大数据增量学习,通过设计实验,运用UCI数据集进行实验,对比分析可以得到增量大数据学习算法是有效可行的实验结果。研究基于改进的Learn++算法,使神经网络具备了大数据增量式学习的能力,解决了类别不平衡的问题。本文提出的面向大数据的增量式大数据学习算法,能够在有限的存储容量和计算资源情况下,分批处理大数据的分类问题,该算法具有一定的社会实用价值,对以后相关的研究工作也有一定的借鉴意义。
其他文献
<正> 牛年岁首,春意盎然。1997年首期学报带着浓浓的墨香又和读者见面了。牛年大吉多建树,学术科研满园春。这是本刊编委会、编辑部向广大读者、作者的诚挚祝愿!
急性肾损伤(AKI)是一种以肾功能迅速下降、高死亡率为特征的常见严重疾病。然而,AKI的分子机制尚未明确,且缺乏有效的治疗方法。非编码RNA(nc RNAs)通过调控炎性反应、细胞程
目的:评估造影剂肾病(CIN)常用定义与传统定义相比在基线血清肌酐(SCr)正常患者中的临床应用价值。方法:前瞻性入选行冠脉介入诊疗术且基线SCr正常的患者,根据术后48~72 h内S
目的:观察益气活血化痰法配合无创机械通气治疗慢性阻塞性肺疾病急性加重期(AECOPD)呼吸衰竭的疗效。方法:将符合纳入标准的72例(其中包含20%的脱落病例)AECOPD呼吸衰竭证属肺肾
融资融券交易对股市流动性的影响尚未形成一致结论,不过大多数学者的研究结论认为融资融券将提升股市流动性。本文基于沪深市场个股交易数据得出的实证结果表明:融资融券标的股
通过胁迫试验研究Hg-Cd复合胁迫对卵叶喜盐草光合色素含量、丙二醛(MDA)含量及抗氧化酶活性的影响。结果表明,Hg-Cd复合毒性对卵叶喜盐草叶绿素a、叶绿素b和类胡萝含量显著影响
分析了大学考试的认识误区和功能误区 ,提出大学生必须消除考试的思维依附 ,用未来的观点和标准去评判、塑造驰骋未来世界的强者 ;学生应走出考试的困境 ,不为考试所奴役 ,去
参谋职能,是企业秘书部门工作的首要职责。经济新常态下,企业生存发展面对更大挑战,秘书部门参谋职能发挥得如何,一定程度上已经影响到企业的管理和发展。在这一特殊历史时期
我国殷、周时代的文字在其形体构造上一般都具有十分鲜明的历史文化的具象性。当时由于殷、周宗法社会的特定需求,田猎与国家的政治、军事紧密结合在一起,形成了一种特有的田猎