【摘 要】
:
随着互联网等技术的快速发展,每天都会产生大量的数据,如何从海量的数据中提取出有用的信息成为人们面临的新的挑战,数据挖掘技术在这种需求下应运而生。分类作为数据挖掘重要的
论文部分内容阅读
随着互联网等技术的快速发展,每天都会产生大量的数据,如何从海量的数据中提取出有用的信息成为人们面临的新的挑战,数据挖掘技术在这种需求下应运而生。分类作为数据挖掘重要的分支,在图像分类、语音识别等领域中有着重要的应用。近年来,如何利用已知样本来提高分类算法性能的研究与应用引起了学术界和工业界越来越多的关注。但是,随着目前实际应用中对分类算法鲁棒性、适应性以及分类准确率要求的不断提高,传统的分类算法已不能满足应用的需要,需要更深入的理论分析。本文主要对基于核函数Fisher判别分析的数据分类算法进行系统的研究,具体的研究工作如下:(1)针对传统的线性分类,将K均值算法和Fisher判别结合起来,提出了一种新的循环Fisher判别算法:首先用K均值算法进行初始化,然后用Fisher判别进行循环迭代,该算法在线性划分中取得了较好的效果。(2)在非线性分类算法KFD中,针对核函数的选取,本文在信息增益率准则下使用纠正重复取样t测试,比较了九种常用核函数的分类性能,指出了在没有先验条件下,RBF核函数具有最优的分类能力。(3)在KFD算法RBF核函数参数的优化问题中,从理论上分析了从0到时的变化规律,并用实验对该结论进行了验证。(4)在求RBF核函数参数的优化问题上,提出了一种求最优RBF核函数参数的“三分法”,弥补了交叉验证法和梯度下降法等优化算法的不足。(5)针对传统KFD算法的不足,本文系统研究了加权的核函数Fisher判别算法(WKFD),并对几种常用的权值,如质心距离权重、组平均距离权重、Ward距离权重进行了研究比较,得到了较优权值函数。
其他文献
本文以动脉粥样硬化是一种炎症性疾病为依据,着重分析了微生物感染、氧化低密度脂蛋白、细胞因子等因素在动脉粥样硬化发生发展过程中的地位;从核因子κB、过氧化体增殖物激
使用漂白硫酸盐针叶木浆为原料,以经高碘酸钠氧化后制备出的二醛纤维素为基材负载纳米银颗粒,后经高压均质法得到载银量为24.78%的纳米银/纳米二醛纤维素气凝胶.探讨高碘酸钠
曲轴TR镦锻是一种利用专用装置在通用液压机上逐拐进行大型曲轴镦锻的技术。传统的TR镦锻工艺与模具镶块设计主要依赖设计师的经验,并且采用手工设计的方法。在通用CAD平台上
通过温挤压成型实验,研究了M32的钢筋连接套筒在不同温度挤压成型的挤压力的变化,硬度的大小,以及零件表面质量等,发现在600°C-800°C之间挤压完成的工件中,无论是表面氧化程度,还
中国特色哲学社会科学体系,是由学科体系、学术体系、话语体系构成的有机整体。党的十八大以来,以习近平为总书记的党中央高度重视哲学社会科学工作,提出了努力构建全方位、
电路板雕刻机是一种软硬件互相结合的机电产品,它融合了数控技术、CADCAM等重要工业技术,适应了科研机构或个人对制作小批量PCB板的需求。对于硬件部分,它通过控制X、Y、Z方
青铜金刚石砂轮具有异常优良的磨削性能,在难加工材料的磨削、成型磨削、精密超精密磨削、高速高效磨削和磨削自动化中有着广泛的应用前景。但是对其进行精密的整形和修锐却非
Android软件的安全开发主要集中在四大组件的安全上,面向组件的设计与开发使得Android应用程序更加灵活和开放,但是如果不理解或不关注组件安全开发的问题,则会影响到应用程
网络的发展使高校思想政治教育出现了新的载体 ,网络逐渐成为高校思想政治教育的新的重要的载体。网络载体给高校思想政治教育带来了千载难逢的机遇 ,但同时也带来了严峻的挑
通过研究Android应用的安全性问题,根据所设计的防御方案,实现了一个针对Android应用程序的安全加固软件,该加固软件为Android应用程序提供透明的加固服务,实现应用程序的加