基于支持向量机的情报数据分类挖掘

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:CHENYF20000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机算法是一种新的统计学习算法,在数据挖掘领域被广泛用来进行分类和预测,其快速、高效和较好的伸缩性使其适合运用在海量情报数据挖掘中。   本文通过对传统支持向量机的深入研究,扩展了支持向量机的功能,使其能够进行分类概率预测,在此基础上设计并实现了一个情报数据分类挖掘原型系统。主要研究内容包括:⑴预处理。对大量不同来源的、含有噪声的情报数据,通过数据装载、数据格式转换、属性子集选择、数据归一化和数据拆分等步骤来获得高质量的挖掘数据源。⑵模型训练。以序列最小最优化训练算法的支持向量机为基础,通过扩展其功能使其能够进行分类概率预测,得到分类概率预测模型。⑶分类预测。利用分类概率预测模型对测试数据进行预测,不仅能够给出分类预测的类标记,而且能够给出所有类别的概率信息。结果表明,该系统对情报数据能够取得比较好的概率预测结果,具有一定的实用价值。
其他文献
本文主要针对当前工作流管理系统在实际应用中集成能力差、柔性差、互操作性不高、模型缺乏对分布式环境的支持等缺点,提出了基于SOA的工作流管理系统。SOA和Web服务作为一种
利用数据的相似性对海量数据进行检索是计算机科学中的一个热点研究问题,在多个计算机领域应用广泛。利用数据的相似性进行检索的方法分为两类,最邻近检索和近似最邻近检索。
随着人类基因组计划的顺利完成,出现了许多高通量技术预测基因功能的方法,但是从这些方法产生的大量的候选基因集合中检测致病基因仍是一个十分艰巨的挑战,如果直接使用生物
随着用工作流的方法管理业务流程的需求的不断增加,人们提出了各种各样的模型和分析方法。而现存的工作流产品缺乏对动态变化所必须的柔性支持,远远不能满足企业的应用需求。
可重构计算成为近年来体系结构研究的热点。该计算方式兼顾生产标准化和应用定制化的优点,填补了传统指令集处理器和定制系统之间的空白。可重构计算的高性能和低功耗的特性
图书馆作为信息资源建设的重要部门,收藏了大量有重要学术价值的音视频多媒体信息资源,其本意是在校园局域网内为全校师生员工提供多样化的信息服务。但是,这些音视频信息资源数
随着面向服务架构(Service-Oriented Architecture,SOA)的发展和应用,Web上出现了越来越多的跨平台的、跨语言的、可扩展的、可靠和安全的服务。当用户提出服务请求后,如何根
对目前问答系统的性能分析表明,用于答案抽取来源的文档的相关性是制约问答系统性能的主要因素。相关文档检索作为问答系统的一个重要组成部分,其检索结果与问题的相关性将直
在企业级分布式应用领域中,传统的分布式应用体系结构绝大部分都是从自身的需求出发,运用各种不同的技术构成相互独立的紧耦合的封闭式系统。这些系统之间缺乏兼容性、互操作
随着信息技术和计算机技术的发展,工作流(Workflow)技术的应用越来越普遍,日常办公的绝大部分流程几乎都要涉及到工作流处理。而传统的办公自动化系统由于没有将业务流程与业