【摘 要】
:
随着现代科技发展,人工智能技术的研究受到广泛的关注。基于数据的机器学习是其重要的研究内容,即从收集的数据样本中学习规律,并且使用这些规律对未来观测数据或无法观测的事物进行预测。然而现实环境中存在大量的繁琐复杂的现象与事物,随着收集观测事物的数据信息的增多,“维数的诅咒”随之出现,它指的是,在缺乏简单假设的情况下,估计一个具有多个变量的函数达到一定精度所需的样本量在变量数量上呈指数增长。高维数据虽然
论文部分内容阅读
随着现代科技发展,人工智能技术的研究受到广泛的关注。基于数据的机器学习是其重要的研究内容,即从收集的数据样本中学习规律,并且使用这些规律对未来观测数据或无法观测的事物进行预测。然而现实环境中存在大量的繁琐复杂的现象与事物,随着收集观测事物的数据信息的增多,“维数的诅咒”随之出现,它指的是,在缺乏简单假设的情况下,估计一个具有多个变量的函数达到一定精度所需的样本量在变量数量上呈指数增长。高维数据虽然能给我们提供样本更多的特征信息,但是较高的数据维度在机器学习计算中也带来了问题,因此,针对高维数据的机器学习降维算法研究是现在机器学习领域中的一个热门话题。顺序回归学习在社会科学和信息检索中频繁出现,是一种基于排序信息预测变量的监督学习方法,其训练样本由一组序数标记,用它们来表现不同类别之间的排序。与线性回归问题不同,顺序回归是同时考虑线性回归和分类问题的一种机器学习方法,用于标记序数的类型是有限的,并且序数之间的度量距离没有定义。本文研究了基于顺序回归的支持向量降维算法,提出了顺序回归支持向量降维机(ORDR-U)以及顺序回归排序支持向量降维机(ORDR-M)。顺序回归支持向量降维机(ORDR-U),首先利用隐性阈值支持向量顺序回归机(SVORIM)模型通过递归迭代计算得到降维矩阵,降维矩阵是由多次递归迭代计算得到的映射向量组合而成,该方法在每次求解中得到了支持向量有序回归意义下的最优映射向量,同时由于递归迭代格式的使用克服了传统降维算法中维数限制问题;顺序回归排序支持向量降维机(ORDR-M)是在前述算法基础上改进而得,该算法对映射向量的选取上进行了优化,它充分利用迭代计算优势获取多个映射向量,将更有效的特征所对应的映射向量按照SVORIM模型分类准确率排序组合成降维矩阵,即,获得SVORIM模型分类准确率最优意义下的降维矩阵使最终的分类效果更优。由于顺序回归学习的数据集中存在排序信息,相比于传统的降维算法,这两种算法不仅能更好地保留标签之间的顺序信息,且得益于采用递归迭代优化解决了映射矩阵维数受限的问题。最后用数值实验验证本文算法的有效性。
其他文献
我国在发展社会主义市场经济、推进现代化建设的过程中,政府承担着组织改革、培育市场主体、促进市场发育的任务。公共政策是现代公共管理的重要组成部分,是政府宏观调控社会
Domain理论由D.Scott在20世纪70年代初建立,其目的是为计算机程序设计语言的指称语义学提供数学模型.其中序与拓扑的相互作用,相互结合是这一理论的基本特征.正是这一特征使D
状态估计是配网监控调度中心的核心功能。其目的是根据系统网络结构和量测数据来获取配电系统实时准确的运行状态,以便对配电系统的运行进行调控,从而预防安全事故发生,保证系统安全经济运行。当前较为广泛使用的是基于传统加权最小二乘法的静态状态估计,该方法只能反映单个时间断面的系统状态,无法呈现动态多时间断面的数据特征。卡尔曼滤波的出现可以满足动态系统状态估计要求,并在系统运行趋势预测中占有重要地位。本文对配
中国的A股市场具有我国的特色。本文旨在构建股票上涨期间不同板块交替上行中技术特征的识别方法,用来指导投资者把握不同时间强势板块的轮动,从而指导投资者踏准上涨过程中
对采自内蒙古自治区鄂尔多斯库布齐沙漠对三种样地中379个蜥蜴胃的内容物进行分析,其中草原沙蜥(Phrynocephalus frontal is)47只,密点麻蜥(Eremias multiocellata)48只,丽斑
随着工业化进程的发展,近年来我国水体藻类水华污染严重,大量繁殖的藻类释放出大量有毒的藻毒素。藻毒素是一种肝毒素,它对水环境和人的身体健康已经造成不可忽视的危害。因
自工业革命以来,由于人类的活动大气中CO_2浓度持续增加,导致环境问题日益严重,对城市气候以及生存环境带来了显著影响。因此减排增汇成为可持续发展中的重要内容。城市绿地作为城市重要的自然生态系统,是城市生态系统中所存在唯一的自然碳汇。绿地能够通过其自身的光合作用固碳释氧,从而减缓城市区域内气候恶化的趋势。因此在城市边界内,植物群落的碳汇作用对城市碳循环有积极影响。同时,在城市中的植被也因自身的相关措
河岸带生态系统在陆地与河流相交边界的两侧到不受河水影响的位置,属于陆生生态系统与水生生态系统的生态过渡区。河岸缓冲带在涵养水源和保持水土等方面具有重要的生态服务功能。河岸带生态系统在增加动植物物种种源、提高生物多样性和生态系统生产力、治理水土流失、稳定河岸、调节微气候、美化环境、开展旅游活动等均有重要的现实和潜在价值。河岸带独特的植被、土壤、地形、地貌和水文特性决定生态系统独特性、复杂性与动态性。
随着我国经济的高速发展,城市化水平逐步提升,促使我国的基建业和城市建设日益繁荣。我国的工业发展水平逐步进入中后期阶段,铁矿石作为工业生产主要原料之一,对铁矿石价格进行准确的预测和掌控,可以在铁矿石价格谈判时提供重要参考依据,同时为钢铁企业提供一个反映铁矿石市场情况的指示器。首先,通过分析全球以及我国的铁矿石供需市场的发展现状,明确了铁矿石供需市场的格局。并且从供需、成本、政策、市场类型和金融五个角
最近,垃圾分类成为人们关注的焦点。截止目前我国已有46所城市开始严格执行垃圾分类政策。Reduce,Reuse,Reimagine:Sorting outthe Recycling System(《少排放,重利用,再构想:重整回收系统》)一书对中国当前的垃圾分类有一定的借鉴意义。本翻译实践报告所选材料来自该书的第一章和第九章,第一章主要介绍了再循环生态系统的重要性;第九章主要向人们介绍了垃圾分类的