最小生成树平滑支持向量机聚类算法研究及其应用

来源 :厦门大学 | 被引量 : 0次 | 上传用户:Melaniemei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(Support Vector Machines,SVM)是在统计学习理论基础上发展起来的一种新的模式识别方法,近年来在其理论研究和算法实现方面取得了突破性进展。SVM聚类方法是一种新的聚类算法,它利用核函数,通过映射把输入空间的样本点映射到高维特征空间中进行处理。其方法在性能上比经典算法有较大的改进,但传统SVM算法随着数据集的增加其时间复杂度呈指数级增加,如何减少该算法的时间复杂度从而应用于实际数据挖掘问题,正是现在研究的热点。本文针对支持向量机的聚类方法进行了研究,提出了最小生成树平滑支持向量机的算法。本文所做的工作主要是:首先,通过支持向量求解算法的分析,结合聚类的特性,提出了将平滑技术引入聚类支持向量点求解的改进算法。该方法通过加入惩罚函数,将有约束的二次优化问题转变为无约束的优化问题,从而利用传统方法进行求解,算法在有效地保持求解支持向量精度的同时,大大提高算法的性能,节省了存储空间,使求解过程的时间复杂度大为减少。实验验证了该算法能够进一步降低优化时间。其次,对支持向量机聚类的标识方法和最小生成树聚类进行了研究,提出将最小生成树应用于聚类标识的方法。该方法通过分析高维聚类数据分布特征改进了距离表达方法,更加合理地体现了特征空间内点的相似程度,使各类样本之间差别增大,增加了聚类的可靠性。此外,最小生成树的聚类标识大大减少了算法的时间度,实验结果表明该算法与其它方法相比,过程更加简单,所用时间更少。再次,将以上两种算法结合,提出了一种新的聚类算法MST-SSVC,通过实验对算法参数做出了分析,与传统算法及支持向量机改进算法的比较表明该算法大大简化了时间复杂度,同时精度基本不变,使得支持向量机聚类算法对实际大数据集的处理成为可能。最后,首次将该方法应用于社会养老保险个人调查数据的聚类分析中,取得了一些有意义的结果,表明利用该算法应用于数据挖掘是可行的。
其他文献
本文针对煤矿企业管理应用以人为本理念存在的问题展开分析,然后提出相关的应用建议,希望可以给有关人士带来一些参考.
“风雪没膝”不通2月17日上海某日报7版《合二为一成大家》中:“这条路风景多变,时而是绿茵茵的草坪,时而是泥泞乱石,时而又是风雪没膝……”上述“风雪没膝”之说不通。风雪
假目标技术手段是对抗高技术侦察与精确打击的有效方法,假目标试验方法则是检验假目标性能的主要手段.本文结合假目标技术发展情况,提出了轻质高强雷达高反射柔性材料的制备,
国际间的学术交流是促进科学发展的重要条件,国内科学数据外流也正是科学交流结果下的正常现象,科学数据共享对促进科学交流与科学发展意义重大,但同时数据共享也为我们带来
期刊
目前,在大部分高校中,计算机基础课程都是一门必修课,一般采用教师理论授课,学生课后练习方式进行计算机的学习,这样就会导致学生对计算机的实际应用能力不强,学习效果不佳.
冷凝式热泵干衣机的开发研究重点在于实现高效率的使水分从衣物中分离并实现凝结,同时通过热泵对衣物加热的热量得到循环利用,达到高效、节能及环保的干衣目的.
网络化控制系统(networked control system,NCS)是集通信网络和控制系统于一体的复杂系统,它借助于通信网络将分布于不同地理位置的传感器、控制器和执行机构连接起来,形成一
随着我国科学技术的快速发展,智能系统的研究与应用越来越广泛。而智能交易系统作为金融市场量化投资的主体,在国外已有30多年的发展历史,目前在国内的金融投资领域范围还有着较为广阔的发展空间。智能交易系统先进的计算机科学技术,对历史大数据进行深度研究并建立模型,优化交易策略及参数,构建出适用于多种交易品种的最优交易策略模型,并可在实际应用中得到有效验证与完善。同时,智能交易系统相对于人为主观交易操作具有
本刊杭州讯第十八届全国人大新闻奖评选结果近日揭晓,新疆人大杂志社报送的重要言论《阳光监督是良方》获评论作品二等奖,新闻稿件《新源县府一文件有违法律精神县人大依法调
事业单位人事劳资管理通常决定单位是否能够可持续发展.因此,应当改革优化劳资管理结构,让其更加人性化、合理化.可通过完善人事劳资制度、应用数据信息管理技术、加强管理人