基于学习自动机的分类算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:lzhonline276
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近些年来信息技术的迅速发展,当前社会的信息量呈爆炸式增长。在有效检索、利用数据方面,数据挖掘技术扮演着重要角色。其中,数据分类作为一种基础技术,为信息的自动识别、归档提供了基本手段,在数据挖掘中起着关键作用。当前随着信息来源渠道的多元化和数据规模的海量化,数据的类别信息以及分类中的数据处理环节更容易受干扰,而目前在实现具有强抗干扰能力的分类方法方面仍有待于进一步深入展开研究。为提高随机环境中数据的分类效果,本文在学习自动机(Learning Automata,LA)理论的基础上,对参数连续的LA分类方法的收敛性质、强化方案,更新规则等进行深入研究,并提出相应分类方法。
  首先,本文对广义学习自动机(Generalized Learning Automata,GLA)分类算法进行深入研究,分析了可能导致学习速度变慢以及收敛不稳定的因素,并给出了可行的解决方案。文中将GLA与变步长的启发式规则相结合,提出了一种基于自适应步长的改进型学习算法。该方法利用随机梯度信息间的相关性,在学习过程中适应性地调整步长,并通过恰当的阈值过滤不合理的更新以取得鲁棒性。同时文中还详细地给出了步长变化特点的理论分析。实验结果表明,改进后的算法能更好地兼具学习速度和稳定性,同时还保持了GLA原有的抗噪性能,为标签噪声环境下的分类问题提供了性能更好的方案。
  其次,分析了传统斜决策树节点分割平面搜索技术的特点和不足,针对斜决策树生成算法中因数据采样而导致分割适合度评估值受干扰的问题,提出了以连续行动学习自动机(Continuous Action Learning Automata,CALA)作为分割优化手段的斜决策树生成算法。该算法使用单维最优分割作为CALA的初始状态,在随机环境中的具有较稳定的搜索能力,能够在评估干扰严重的环境中保持较高的准确性。实验结果表明,该方法切实可行,有效地提高了斜决策树生成算法对评估噪声的容忍能力。
  
其他文献
会议
学位
本翻译实践报告以《时间秩序》(The Order of Time)8-11章作为翻译文本。《时间秩序》出版于2018年4月,作者是意大利著名物理学家卡洛·罗威利。该书以时间为主题,解释了时间的本质。作者认为人类丰富的情感构成了我们短暂的生命,让我们意识到了时间,这打破了我们以往对时间的认识。《时间秩序》(The Order of Time)是一本科普类书籍,语言风趣幽默,简洁精炼。但由于本书的专业
学位
近一个世纪以来,人们致力于追求性别平等,女性社会经济地位在很大程度上得到提高,但是,仍面临着很多难题。那么,女性该如何应对职场中的挑战?马歇尔和莎莉的《女性如何晋升——改掉阻碍你进步的12个坏习惯》(How Women Rise:Break the 12 Habits Holding You Back from Your Next Raise,Promotion,or Job)用简洁明了的语言讲述
学位
科普作品的功能及目的是宣传、普及科学知识,文本不但具有科学性和文学性,还往往具有趣味性和通俗性。正是这些特点使得科普作品的翻译尤为复杂,也使得译者在翻译过程中面临巨大挑战。本文是译者在翻译物理科普著作《时间秩序》(The Order of Time)前四章后写出的实践报告,包含两大部分。第一部分为正文,分五章。第一章是翻译任务简介;第二章是任务描述,包括选题理由、源文本内容、源文本语言特征、文本类
学位
期刊
学位
期刊
会议
期刊