【摘 要】
:
随着计算机技术的不断进步以及大数据研究和应用的深入,社会各行业朝着无工人化的精细化发展,这种发展趋势需要更加先进的人工智能方法代替过去繁琐和精细的人工劳动。由于待解决问题的限制条件更加复杂,数据维度更高,所以要求大数据处理技术速度更快精度更高。机器学习是当前处理大数据的主要技术,其处理模型的效能很大程度是依托于数据集的特征工程,特征工程主要包括特征提取和特征选择,本工作主要研究后者。面对数据特征维
论文部分内容阅读
随着计算机技术的不断进步以及大数据研究和应用的深入,社会各行业朝着无工人化的精细化发展,这种发展趋势需要更加先进的人工智能方法代替过去繁琐和精细的人工劳动。由于待解决问题的限制条件更加复杂,数据维度更高,所以要求大数据处理技术速度更快精度更高。机器学习是当前处理大数据的主要技术,其处理模型的效能很大程度是依托于数据集的特征工程,特征工程主要包括特征提取和特征选择,本工作主要研究后者。面对数据特征维度为N的数据要进行复杂度为O(2N)的特征选择工作,智能算法实现特征选择是一种可行的方案,本工作选择遗传算法实现智能特征选择。遗传算法凭借着自身优势被广泛的运用到很多领域中,但还是存在着过早收敛和面对大量数据时计算速度慢的缺点。处理特征选择问题时遗传算法要依托于数据集才能确定适应值函数,每一次适应值函数的调用是最耗时的,为了提高其收敛速度必须改进遗传算法。为此,我们进行如下研究:1.对于数据量大、维度高的数据集,为了得到精度高的特征子集,本文运用智能算法中的编码方式对特征赋值权重。2.提出一种矩阵结构的遗传算法,该算法针对传统遗传算法在函数优化问题中的不足进行改进。首先,通过逐行寻优构建父代精英种群,其中每行最优个体移动到所在行的主对角线位置;其次,采用父代精英种群中任意两个个体和交叉产生两个子代个体和,并分别置于关于主对角线对称的位置;最后,对种群全体逐一进行试探变异,若变异结果优于原个体则选择变异结果,否则不变。经过上述三步的若干次循环迭代,最终以矩阵中的最优个体为问题的最优解。通过对若干函数优化问题的实验测试表明,该方法收敛速度很快,全局收敛性能显著提高,可以推广到其它演化算法。3.提出基于多核CPU的并行KNN分类器,并行设计目的是加快计算速度,KNN分类器将作为改进遗传算法适应值函数,分类器对大数据的分类精度作为检验特征子集的评估标准。通过设计多种群的矩阵结构遗传算法,提高了收敛的速度。通过利用多核CPU构建并行KNN分类器,改善了因面对数据集较大而适应函数计算慢的缺点,使得遗传算法优化机器学习成为一种可行性方案,对于进一步扩展演化机器学习研究具有指导意义。
其他文献
英语校本课程资源是校本课程发展的重要保证,是落实英语学科核心素养的有力支持。本文分析核心素养背景下高中英语校本课程资源开发的现实意义、开发原则,并由此对高中英语校本课程资源开发的有效路径进行探索。
粤港澳大湾区建设将引领新一轮大规模产业转移和城镇变迁,粤桂两省文化相近、水陆相接,是产业转移与融合发展的理想对象。文章通过分析粤桂产业转移与人口城镇化进程,发现粤桂产业转移和承接主要集中在第二产业,第三产业的转移和承接相对较弱,且广西人口城镇化进程远远落后于广东。进一步通过构建空间杜宾模型进行产业转移与人口城镇化的空间溢出效应分析,发现粤桂地区产业转移对人口城镇化的空间溢出效应明显,广东经济规模相
<正>7月29日上午,河北省福彩中心召开发布会,发布了《河北福彩责任彩票报告(2021)》(以下简称《报告》)。这是河北福彩自2015年以来连续发布的第7份年度责任彩票报告。河北省福彩中心负责人介绍了《报告》的主要内容以及2021年河北福彩履行社会责任情况。2021年,面对转型发展压力和稳市场、稳网点、稳就业的艰巨任务,河北福彩忠诚践行“扶老、助残、救孤、济困”的发行宗旨,按照“塑品牌、强游戏、稳
习近平总书记“5·31”重要讲话为加强和改进中国国际传播能力建设擎画了新的蓝图,为其开创新境界、进入新纪元夯实了基础。国际传播能力建设在过去的一年中实现了战略升级、知识拓疆以及实践突破等方面的重大飞跃。然而,世界百年未有之大变局与全球交流生态极速变革期一同到来的背景下,国际舆论极端化、意识形态对抗性加剧,以及国际传播平台的数字化,均要求中国国际传播总体问题意识作出适时调试。在国际传播理论研究和实践
绿色发展是中国探索超越资本主义现代化道路的重要尝试。新时代推动绿色经济发展,必须坚持以马克思主义政治经济学为根本,树立马克思主义自然价值理念,秉持人与自然共生的价值伦理;坚持以科技创新引领绿色经济发展,通过绿色技术解放与发展"生态生产力",激发企业的绿色化改革动力,建构成熟完善的绿色消费市场,增强绿色发展的经济制度创新能力,最终实现中国经济社会发展的"绿色化"转型。
按照山东省储能电站示范项目政策,建立新增风光电配储能、火电机组配储能以及电网侧独立储能电站3种类型储能电站典型模型,并对其盈利模式进行详细论证。结果显示:光伏电站建设储能系统将导致系统收益率下降1.83%~3.66%;火电厂建设电储能调峰电站效益较好,系统资本金内部收益率为16.85%~21.14%,其租赁价格与光伏电站自建储能系统具有较大的成本优势;电网侧储能电站项目收益较差,需要进一步挖掘储能
深度学习是全面深化课程改革和落实核心素养的重要路径。构建深度学习课堂需要教师在充分把握学情的基础上,科学设计教学目标,采取有针对性的教学策略,推动学生思维步步深入,引领学生道德成长。
戏剧作为传统的艺术表现形式,在新时期迎来了发展契机。影响戏剧表演的一个主要因素是人物形象的塑造,而戏剧语言是体现戏剧人物的重要表征之一,因此在分析和理解戏剧的时候也要对语言进行精准把握。戏剧语言可分为人物语言和情景说明两种形式,人物语言主要表现人物形象、体现人物心理活动和戏剧冲突,而情景说明则服务于戏剧发展,烘托效果。只有将戏剧语言和人物塑造相融合,才能更好地实现戏剧创作的预期效果。