基于机器学习算法在数据分类中的应用研究

来源 :中北大学 | 被引量 : 0次 | 上传用户:otto0127
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实中的很多实际问题都可以转化为数据信息处理中的数据分类问题,例如气象预报、商品推荐、生物信息、网络检测等,而数据信息处理都是以机器学习为基础进行研究的。随着科学技术的发展,机器学习算法的应用领域也变得十分广泛。本文主要介绍了两种机器学习算法:粒子群算法优化支持向量机和卷积神经网络。其中研究了粒子群算法优化支持向量机在树叶分类和癌症基因分类中的预测,卷积神经网络在图像分类中的应用。(1)基于各种树叶的特征构建一个数据预处理模型:先对各种数据进行归一化处理,采用主成分分析方法从16个特征中提取出3个主成分,再建立粒子群算法优化后的支持向量机,用支持向量机对树叶数据进行分类预测。实验结果表明,相对于遗传算法和网格搜索法寻到的最优参数相比,粒子群算法优化支持向量机具有最高的准确率,高达94.1%,高于其他两种分类方法。(2)将粒子群优化的支持向量机模型应用到癌症基因分类中,通过选取多组不同的实验数据对癌症手术后病人的复发和不复发的基因样本进行预测分类。对于三种不同分类方法对于癌症基因分类的不同分类效果,综合实验结果,粒子群优化支持向量机在三种分类方法中达到最好的分类效果。(3)将卷积神经网络应用到图像处理上,通过优化卷积神经网络卷积层和池化层中的滤波器函数,达到了优化性能的作用,再构造一定结构的卷积神经网络,然后将该模型对图像数据集进行分类处理,在对图像进行最后达到预期的分类结果。
其他文献
桥是社会进步的见证者,社会也因大跨度桥梁的出现而更加繁华,近年来中国的大跨度桥梁的不断建设,推动了桥梁技术的不断创新。结合梁斜拉桥的出现是大跨度桥梁建设的需要,是社
从悖论的起源谈起,给出了悖论的定义,介绍了数学史中三个著名的数学悖论——“希帕索斯悖论”、“贝克莱悖论”和“罗素悖论”,及由此引发的三次数学危机.通过对这三个悖论的分析
随着互联网环境中数据规模的剧烈增长,从海量的数据中提取有意义的信息变得越来越困难。认知计算技术作为人工智能领域的一个重要分支,在如今的互联网环境下能够起到十分重要
南昌市民营企业的发展得益于政府主导的强有力的金融支持。南昌市民营经济发展态势基本良好,但仍有较大的发展空间。通过对南昌市金融支持的现状阐释,分析了企业自身条件和金