基于AdaBoost回归树的多目标预测算法的研究

来源 :北京交通大学 | 被引量 : 6次 | 上传用户:JAVA01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,如何利用好数据潜在信息价值,成为商业巨头能否实现经济飞速发展的重要因素。准确的目标预测,对于国民经济的发展具有不可估量的意义。在商业、经济和其他领域中,预测分析日益依赖于数据挖掘建模、统计、分析得出。随着互联网金融进程的推进,目标预测问题已成为具有现实意义的课题。多目标回归预测作为数据挖掘"年轻"的新兴领域,它与多标签分类学习紧密相关。现阶段,分类学习发展更成熟、更广泛。多标签分类学习的最新研究成果激发了我们能否将其成功地应用于多目标回归领域的探索。事实上,多目标预测已经出现在很多领域,如预测车辆部件的风噪、股票预测和生态模型等。预测问题通常涉及到相同的输入变量同时预测多个目标变量。当目标变量为二进制时,预测任务被称为多标签分类;当目标变量为实值时,预测任务称为多目标预测。在本文,我们提出了两种新的多目标回归方法:多目标堆叠(Multi-Target Stacking)和集成回归链(Ensemble of Regressor Chains)。灵感来自两种流行的多标签分类方法。MTS和ERC在第一阶段的训练,都将采用基于回归树AdaBoost算法(ART)建立的单目标预测(Single-Target Regression)模型作为基准方法;在第二阶段的训练,MTS和ERC都通过额外加入第一阶段的目标预测值作为输入变量来扩展第二阶段的输入变量空间,以此建立多目标预测模型。两种方法利用目标变量之间的关系,不同的是,ERC除了考虑目标的依赖性关系还考虑了目标的顺序问题。此外,我们总结了 MTS和ERC两种方法的缺点,并且对算法进行修改,提出了相应的改进版本 MTS Corrected(MTSC)和 ERC Corrected(ERCC)。本文另一个重要的贡献是提供真实世界存在的12个不同领域的数据。实验中六种方法的对比是根据12个大量且多样化的数据集进行实验评估,实验结果表明,修改后的回归链ERCC算法在多目标预测问题中表现最好,其性能明显优于单目标预测ART和最先进的多目标随机森林(MORF),也好于本文中提出的其他方法MTS、MTSC、ERC。除此之外,结果也表明,修改版本MTSC和ERCC使MTS和ERC性能得到显著提高。
其他文献
随着互联网技术的迅速发展,网络课程在国内外已经取得了令人骄傲的成果,先后出现了许多优秀的网络课程资源,此外,MOOC作为网络课程的一种新型表现形式,它在教育领域引起了的
由于发布/订阅通信机制能够使参与者在空间、时间和控制流上完全解耦,且具有异步、多点通信的特点,因此能够较好地满足许多大型分布式系统松散耦合通信的需求,成为构建大规模
乒乓球机器人是一个手眼协调系统,它包括机械系统,视觉系统和控制系统,分别相当于人的手臂,眼睛和大脑。而本文的重点是机器人的控制系统,即如何有效的控制机器人的手腕使其
近年来,无线传感器网络(Wirless Sensor Network)技术异军突起,成为本世纪最具影响的技术之一。   无线传感器网络(Wireless Sensor Network)因其广阔的应用前景,受到了人们
传统搜索技术一方面能够提供给用户丰富的信息,但另一方面也给用户带来大量的噪声和冗余的数据,使用户难以分辨出自己感兴趣的信息。为了满足互联网用户的个性化需求,给用户
1982年,Z.Pawlak提出粗糙集理论,为处理不确定数据提供了一个很好的方法。近年来,粗糙集理论及其应用发展发展十分迅速,主要都着眼于粗糙集模型的概化、粗糙集中不确定理论的
蚁群算法是一种求解复杂问题的元启发式算法,它是意大利学者M. Dorigo, V.Maniezzo等人于20世纪90年代初,受到自然界中蚂蚁在觅食过程中所表现出来的路径寻找模式的启发率先
随着互联网技术和数字技术的发展,多媒体信息,比如图像、声音、视频,甚至是文本信息,已经成为人们获取信息的主要来源。人们可以通过互联网下载、传播网上的数字多媒体产品,
随着计算机网络技术的快速发展,网络犯罪日益增多,犯罪手段也日益多元化。这时计算机离线取证存在的许多不足就逐渐显露出来,比如:很多易失数据如内存映射文件等将会丢失,内核级
图像分割是图像分析,识别和图像理解的基础,是图像处理到图像分析的一个极其关键的步骤之一。正是由于图像分割的这种重要性,国内外一些学者对其进行了大量研究,同时也提出了