【摘 要】
:
基于核的机器学习方法(简称核方法)是人工智能和机器学习领域的研究热点之一,广泛应用于图像处理、生物信息技术、文本分类和入侵检测技术等多个领域。其中,极限学习机和支持向量机(SVM)作为一种高效的分类和检测工具引起了广泛关注。本文提出了一种分布式算法来解决核极限学习机以及SVM在大规模数据集中的应用问题。首先,核极限学习机虽然能够解决复杂的非线性问题,但当处理大型核矩阵时十分耗时。基于此,本文提出了
论文部分内容阅读
基于核的机器学习方法(简称核方法)是人工智能和机器学习领域的研究热点之一,广泛应用于图像处理、生物信息技术、文本分类和入侵检测技术等多个领域。其中,极限学习机和支持向量机(SVM)作为一种高效的分类和检测工具引起了广泛关注。本文提出了一种分布式算法来解决核极限学习机以及SVM在大规模数据集中的应用问题。首先,核极限学习机虽然能够解决复杂的非线性问题,但当处理大型核矩阵时十分耗时。基于此,本文提出了一种分布式约简核极限学习机方法,用于解决核函数矩阵维度随着数据规模的增大而呈级数式增长,从而导致机器负载过重的问题。在分布式约简核算法中,我们将数据随机分配给不同的节点,且节点之间的通信是固定的,不依赖于每个节点上训练数据的大小,而是依赖于网络拓扑结构。实验证明分布式约简核技术可以极大地减少计算负载和内存使用。其次,SVM作为一种机器学习技术,已经成为数据分析的热门工具,特别是在引入软间隔损失函数之后,许多不同的损失函数结构相继被提出,更是拓宽了SVM的应用领域。考虑到0-1软间隔损失函数是最原始的损失函数,此外,它可以产生较少的支持向量。为此,本文提出了一种基于0-1软间隔损失函数的分布式支持向量机(DSVM)方法。此方法的核心是将一个目标函数划分为子目标函数,然后将子目标函数分配给多台计算机进行处理,多台计算机之间相互通信和协作,以找到最优的全局目标函数。通过对大规模数据集进行实验发现,我们提出的分布式算法可以取得与集中式算法几乎相同甚至更稳定的结果。最后,本文对分布式算法的计算性能进行了验证,通过设定不同规模的数据量及不同的参数,探讨所提分布式算法的稳定性及扩展性问题。
其他文献
本报告所采用的文本是Human-Environment Interactions:An Introduction。该书是一本教科书,由Mark R.Welford和Robert A.Yarbrough编写。Mark R.Welford是美国北爱荷华大学地理系主任和教授,以及环境资源管理项目主任。Robert A.Yarbrough是美国乔治亚州南方大学的地理学副教授。环境科学教科书有着独特的语言特
早在1984年,Clunie和Sheil-Small对单叶调和映射与共形映射进行了有关的对比研究,平面调和映射就逐渐发展成为了一个热门的研究方向。调和映射是研究极小曲面的重要内容,而极小曲面在几何学、工程技术方面的应用也具有重要意义,因此深入研究调和映射的相关性质,有利于解决在工程领域中遇到的一些问题。在本学位论文中,我们主要研究平面调和映射线性组合的单叶性和凸性,并得到几个新的结论。两个调和映射
在在线教育需求日益增长的背景下,译者选择了《在线语言教学——在线混合及翻转课堂语言课程的设计和实施指南》一书的第一章作为本次翻译实践的材料。希望通过翻译,将国外在线教育的经验和最新研究成果带给中国的教育工作者。在翻译之前,译者对原文的语言特征进行了分析,原文语言较为直白,句子结构相对简单,适合采用新兴的翻译模式“CAT+MT+PE”(计算机辅助翻译+机器翻译+译后编辑)来提高翻译的质量和工作效率。
《在线语言教学——在线混合及翻转课堂语言课程的设计和实施指南》以教学设计和交际语言教学法的原则为基础,是一本最佳实践、研究和策略的汇编,用于创建以学习者为中心的在线语言教学,在有意义的文化背景下培养学生的能力。这本书是一本较为权威的学术专著,在2020年由劳特利奇出版社出版。本翻译报告以比利时著名语言学家维索尔伦(Verschueren)的顺应论为理论基础。顺应论的重要概念包括做出选择、变异性、商
本篇实践报告的翻译材料是基于无参考译文的英文原版书《帝国叙事:晚期哈布斯堡王朝与奥斯曼帝国的多民族主义观》(Narrated Empires:Perceptions of Late Habsburg and Ottoman Multinationalism)中的节选部分(第三章和第四章)。本书主要是由编辑Johanna Chovanec和Olof Heilo收集了多位作者的论文合成。讲述了欧洲东南
本文以离散网络控制系统为研究对象,分别考虑存在网络频宽受限、网络延迟、外部扰动、数据丢包以及欺骗攻击等复杂情况,运用Lyapunov稳定性理论、动态事件触发机制、比例积分微分(PID)控制方法、基于观测器的控制策略等讨论系统稳定性常用的方法,研究了系统的稳定性及安全性。主要研究内容如下:第一、讨论了基于观测器设计的非线性模糊离散系统的PID安全控制问题。首先,将网络系统建模为一个带有时滞的Taka
随着全球化进程和文化全球化的不断推进,外语的利用率与学习热度达到了空前的高度,这也使得英语教学与创新日益受到人们的关注。译好此类书籍不仅可以使阅读创新类教育书籍变得唾手可得,拓宽中国教育工作者的视野,还能够丰富我国教育创新的理念,吸取国外教育领域的精华,为我所用,其重要性可想而知。此外还可以为相关领域提供参考材料,一定程度上补充国内教育事业的创新短板。《教育与学习中的创造性:教师和教育者的指南》是
近红外光谱(NIR)分析技术是一种基于统计学、数学、计算机科学与化学的快速检测技术。数据分析在光谱统计建模过程中起到重要的作用,通过统计方法的研究,提取隐藏在数据中有价值的信息,分析出待测对象的关键性质特征。由于NIR光谱是一种间接分析技术,需要研究有效的化学计量学方法,构建多目标优化定量分析模型,以提高预测结果的精准性。模型质量对近红外光谱分析的精度有重要影响,需要在样本划分、波段优选、数据预处
鸡蛋因富含多种氨基酸而广受人们欢迎,是人们日常生活中蛋白质的重要来源,在居民消费中占有重要地位。我国是世界上最大的鸡蛋生产国和消费国,截至2020年我国鸡蛋年产量为3512.85万吨,约占世界40%。除此之外,鸡蛋期货于2013年11月8日在大连商品交易所上市,从而鸡蛋期货成为了中国第一个鲜活农产品和畜牧期货品种,其上市不仅丰富了我国期货市场的品种系统,而且也为鸡蛋业规避“鸡飞蛋打”提供了一种有效
投资组合问题是将一定的资金分配到多种资产上,从而尽可能达到收益较大、风险较小的目的,它是金融领域的一个重要课题。马科维茨于提出的均值-方差模型为证券组合问题提供了理论依据。从那以后,各种改进的思路层出不穷,使证券组合理论不断地被完善和发展。本文基于均值-CVa R模型,引入Yager熵补充风险指标,建立均值-CVa R-Yager熵的模糊多目标投资组合,并改进了水波算法,提高了求解投资组合模型的精