基于模糊聚类的支持向量机的分类算法研究

被引量 : 0次 | 上传用户:vpvplp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是一种融合了人工智能、数据库和数理统计等学科特点的新兴技术,善于从大量的、复杂的数据中迅速获取新颖、有效的知识。分类是数据挖掘的主要任务之一。目前,流行的分类算法的重要基础是传统的统计学,但当样本有限时,过学习现象常导致分类效果不理想。支持向量机作为一种新兴的统计学习算法,以其优秀的理论基础(结构风险最小化、条件二次优化理论和核空间理论)脱颖而出。 支持向量机是由Vapnik及其领导的AT&T实验室研究小组提出的一种新的非常有发展前途的机器学习算法。它是继神经网络研究之后新的研究热点,并将推动机器学习理论和技术有重大的发展。 本文首先讨论了数据挖掘的基本概念,挖掘任务、挖掘对象、挖掘方法,基本过程以及对数据挖掘理解的一些误区。然后再研究了支持向量机的理论基础及基本概念和要解决的关键技术问题后,又对当前针对分类的各种比较通用的支持向量机训练算法进行了研究,比较了各种算法的优劣。 支持向量机应用于数据挖掘中,有时要处理大规模训练集,针对SVM在处理大规模训练样本集学习时,学习速度慢,存储需求量大的问题,对支持向量机方法与聚类算法的配合问题进行研究,通过剪枝、聚类的方法减小样本空间,提高支持向量机的训练速度。最后把基于模糊聚类的支持向量机算法应用在人才数据挖掘系统中,得到了比较好的分类效果。
其他文献
目的:通过观察方剂调更益经汤配合克龄蒙治疗肾亏血瘀型卵巢储备功能下降,观察其临床疗效及血清促卵泡生成素(FSH)、促黄体生成素(LH)、雌激素(E2)水平、抗苗勒管激素(Anti-M
目前采用一般的物理加固和化学加固方法对脆弱丝织品进行保护存在着一定的缺陷和限制,为此,本工作利用与丝织品具有同源性和亲和性的丝素蛋白对清代丝织品进行加固保护。清代
婺剧是典型的多声腔剧种 ,它在音乐上包容了来源复杂的六种腔调 ,流传于浙江中南部。以婺剧为代表的多声腔剧种更应该被视为流传于同一区域的多种腔调地方戏的统称 ,它在音乐
一般公交规划中公交客流OD预测方法都是基于交通小区的,所以在分配时的OD出发点和到达点都是交通小区形心,这与实际的公交乘客出行特征存在一定误差。该文在交通小区公交客流
目的:通过分析宋立群教授治疗肾性蛋白尿所使用的药物,总结出宋立群教授治疗肾性蛋白尿的基本治疗方法及临床用药规律,为今后中医药治疗肾性蛋白尿提供更有力的理论依据与临床
包膜糖蛋白是病毒毒粒表面的抗原决定簇,是有包膜病毒表面脂质双层膜的重要成分。目前,已发现并正式命名的单纯疱疹病毒包膜糖蛋白共有12个,大部分具有重要功能。本文就单纯
昆山经济技术开发区经过20年的发展,取得了令人瞩目的成就。昆山的发展道路不仅引来的同行的学习和借鉴,而且还得到了理论界的关注与肯定。 昆山开发区走的是一条典型的外
归核化战略从二十世纪八十年代由美国兴起。企业实施归核化战略,采用组织变革和业务重组等方式,以加强或重构核心业务,培养和创造企业核心竞争能力。十几年来,归核化战略已经成为
[目的]股骨颈骨折是常见骨折,随着社会人口老龄化,老年股骨颈骨折发病率日益增加。股骨颈骨折最常见的并发症为骨折不愈合和股骨头坏死,老年患者有其特殊性,并发症发病率也较
中国证券市场体系的不完善制约了中国证券业的发展,造成证券公司盈利低下、缺乏竞争力。本文从分析和阐述资产证券化的实质,即重新打包分割收入现金流,并将其转化为第三方接受的