面向概念漂移问题的集成算法研究

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:sinjorzhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着技术发展,许多领域每天会产生源源不断的数据流,如股票分析、电子商务、气象监控、信用卡欺诈监测等。数据流实时产生且规模庞大,无法将所有数据存储下来,这使得传统的数据挖掘算法难以有效的对数据流进行处理。在动态变化和非平稳的环境中,数据分布会随着时间推移而发生变化,即产生概念漂移现象。如何从概念漂移数据流中挖掘出潜在的、有价值的信息,已成为目前研究热点之一。分类是数据流挖掘领域中常用的技术之一。目前对于概念漂移问题的研究,大部分围绕分类算法展开。由于集成算法具有快速适应变化的优点,因此基于集成的分类算法是最常用的处理概念漂移的方法。为此,本文围绕面向概念漂移数据流的集成分类算法展开研究,主要工作如下:(1)出了一种基于差异性指标的概念漂移数据流的集成分类算法。首先根据相邻数据块的样本均值变化程度检测概念漂移。若检测到漂移发生,通过新到达的数据块构造出新基分类器;否则仅对已有基分类器进行权重更新,不构造新基分类器。最后将基分类器的分类准确率和集成差异性进行融合,结合时间因子作为综合度量指标,对基分类器加权,以高集成的泛化能力。理论和实验证明,该算法具有更高的分类准确率,能更快地适应概念漂移。(2)出了改进的自适应随机森林方法。首先利用集成分类过程中的分类性能调整Poisson分布的抽样参数,动态调整新样本在基分类器中的权重,从而增加基分类器之间的差异性。其次在集成模型上增加概念漂移检测算法。当检测到概念漂移警告信号时,根据集成分类器的准确率生成指定个数的背景树,同时背景树协同基础树参与最终决策;当发生概念漂移时,用训练好的背景树替换分类性能较差的基础树。与自适应随机森林算法相比,该算法具有更高的分类准确率。
其他文献
热定型是整条染整工艺链中不可或缺的一道工序,其定型效果的好坏直接决定着织物质量的高低。静压箱是热定型机中的主要送风部件,其出风性能决定着织物表面能否获得均匀稳定的气流场,从而影响着织物的定型质量。因此,探究不同风道结构对静压箱流场均匀性的影响,提高静压箱出风性能,对提升织物定型效果、提高产品质量乃至提升整个染整行业经济效益都有着十分重大的意义。本文通过数值模拟的方法建立了静压箱风道模型,探究了不同
学位
折叠翼结构被广泛应用于现代导弹上,在提高武器系统整体作战能力方面发挥至关重要的作用。相比传统的固定式翼面,折叠翼面类型多,设计要求高,机构组成和功能原理复杂。为探究折叠翼关键性能参数的影响变化规律,有必要建立其力学模型并开展相关仿真研究。论文以某型号导弹使用的绳索驱动式折叠翼为对象,基于其组成和工作原理分析,进行运动学和动力学建模,并开展有限元模拟、虚拟样机仿真以及灵敏度分析等工作,分析了折叠翼从
学位
HIV相关神经病理性疼痛(HIV-induced neuropathic pain,HNP)是艾滋病常见并发症,其主要诱因是HIV包膜糖蛋白gp120。课题组前期研究发现,TLR2介导gp120诱导的HNP模型小鼠脊髓小胶质细胞激活并参与其机械异常性疼痛的发生。但TLR2参与gp120激活小胶质细胞的具体分子机制尚不明确,因此,本课题拟在体外建立gp120诱导的小胶质细胞损伤模型,进一步研究TLR
学位
电静液伺服机构(Electro-Hydrostatic Actuators,EHA)是一种新兴的电力驱动伺服机构,具有功率重量比大,效率高、可靠性高、安全性高、维护成本低等突出特点,是未来实现对机电设备多电/全电化控制的优选执行机构。斜盘式轴向柱塞泵是EHA的关键部件,目前缺乏行之有效的状态监测方法,无法利用EHA的工作状态数据实现对柱塞泵运行状态的自动监测,难以及时消除EHA发生故障的风险。本文
学位
随着制造业的持续发展,耐压软管已广泛应用于各大工业领域。耐压软管的工业性能主要由其内部编织增强体的生产质量决定,为提高耐压软管编织增强体的编织质量,需要对耐压软管编织增强体在生产过程中的实时检测方法展开研究。目前,耐压软管编织增强体瑕疵检测都是基于人工检测,但随着编织效率的提高,低效的人工检测方式已难以适应实际的生产节奏。因此,本文提出了一种基于YOLOv5的耐压软管编织增强体瑕疵检测方法,帮助企
学位
针对现有的葫芦科幼苗半自动嫁接设备自动化程度较低的问题,本文开展葫芦科顶插接法自动接合装置研究。本文首先根据顶插接法的农艺要求,设计了一种能完成各种接合动作的终端机构,基于计算机视觉技术实现了非接触的嫁接苗嫁接参数识别,并根据识别结果实现接合机构各种动作的视觉伺服控制。本文的创新点为:基于计算机视觉的嫁接参数识别定位方法,实现嫁接苗生长点、苗茎宽度以及子叶旋转方向的高精度识别与定位,并设计了一种多
学位
细胞色素P450酶是一类广泛分布于生物体中含血红素的蛋白质超家族,能够将一个氧原子引入到一些化合物的非活性C-H键中,并普遍具有严格的区域和立体选择性。作为一类天然的生物催化剂,它能识别的底物类型以及催化功能丰富多样,在药物结构修饰方面发挥重要作用。甾体药物作为目前市场销售额仅次于抗生素的第二大类药物,具有多种生理活性,对其进行结构修饰以获得更具应用价值的甾体药物是目前常用的手段之一。通过化学合成
学位
当下,随着我国非遗保护措施不断完善,非遗传承大环境日益良好,文章经过文献调查、社会调研、实地考察、案例研究等多元化调研发现在非遗良性发展大环境下,我国非遗仍存在着发展不平衡、小众式断层、产品转化困难等诸多难题。同时基于浙南蓝夹缬对小众非遗面临困境的代表意义,文章将其作为小众典型非遗展开当代转化和创新发展探索。蓝夹缬作为我国四缬之一,具备独特的文化价值与美学意义,但随着时代更迭,其逐渐消失于大众视野
学位
穴盘精密播种既可减少用种量,又可为后续移栽提供优质秧苗,降低劳动力成本,提高经济效益。气力式滚筒排种器的精密取种、精确投种是穴盘精密播种的关键技术,但由于种子的大小、重量、形状等物料特性不尽相同,不同类型的种子在播种过程中所需要的工作参数也各有差异,这同样是排种器的设计难点。针对这一问题,本文基于气力式滚筒排种器的播种原理,结合异形种子特性,开展排种器的虚拟样机研究,主要研究内容如下:(1)阐述气
学位
在降本增效的智能物流体系下,电商企业常常缺乏系统性的拣选作业指导。化妆品企业在大促期间出现订单爆仓现象,多品种、小批量、多频次的订单特性和客户对于响应速度的要求,使得企业需要从订单调度、拣选流程方面来提升拣选效率以提高竞争力。传统的固定批量拣选策略己经无法满足客户对响应时间的要求,需要更加高效灵活的拣选模式。首先分析货架到人拣选模式具有高效灵活的特点,能够将拣选人员从反复拣选商品的耗时作业中解放出
学位