类别不平衡性对代价敏感学习的影响

来源 :中国人工智能学会第12届全国学术年会 | 被引量 : 0次 | 上传用户:hobbysh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类算法通常假设每个类别中的样本数目是大致相当的。然而在真实问题中往往不能满足这样的假设,数据分布常常是不平衡的,一个类别中的样本可能远远多于其他类别。在这种应用问题中,小类别通常是关注的焦点,因此将小类别样本错误分类所带来的代价也更大。这就造成了不平衡的数据分布和不相等的错分代价同时并存的情况。 本文针对类别不平衡性对代价敏感学习算法性能的影响进行了研究。实验结果表明,当不同类别的错分代价差别相对较小时,原始的数据分布更有利于进行代价敏感学习;只有在错分代价差别足够大时,类别不平衡性才会影响代价敏感学习算法的有效性,此时应使用平衡的数据分布。
其他文献
电力需求预测是电力系统规划、经济运行和调度管理自动化的基础。多主体(Multi-Agent)技术是近年来发展迅猛并在科研和工程技术领域不断取得应用成果的重要研究方向。 本
会议
CIFPA提出了一种新的Agent交互协议规约方法,它建立在比较完整的Agent通信语义体系之上,结合了对话游戏和社会约定方法,能够支持灵活的Agent交互协议规约。 本文以一个协
大粒度软件构件是构造复杂软件系统的基础。当前的构件不仅粒度小、耦合紧密,而且被分解配置到不同的计算层次中,在同一层次的不同构件的分解块又混杂在一起,导致构件边界不
会议
知识是形态知识、内容知识和效用知识的三位一体,传统的知识库建设着重于知识的形态和内容,忽略了知识的效用,造成信息服务质量低下。 本文以信息-知识-智能转换理论为基
为了简化对HTML文件的信息抽取问题,将格式不规范的HTML文档转换为严格的XML文档已经很有必要。本文利用链表结构的二叉树实现了将HTML转换为XML。
本研究提出了基于领域知识的复杂决策问题形式化方法。该方法利用问题分类知识和问题结构知识明确问题的结构,通过树状知识表示方法将这一结构表达出来,从而实现问题的形式化
本研究将基于案例的推理方法应用于某型航空发动机故障诊断专家系统,在案例库的组织上采用归纳索引法建立了层次结构的故障索引树,并从灰色关联理论出发,提出了灰色贴近度这
本研究分析了语义Web服务匹配流程,得出语义Web服务匹配的关键问题之一在于领域本体的匹配。分析基于本体的经典的语义Web服务匹配算法─分类树匹配算法,得出该算法的最大缺
网构软件将成为软件的一种主流形态,这是目前软件发展的趋势。但作为新出现的软件形态,尚有许多关键技术和核心问题需要突破和解决。 本文对Internet开放、动态和多变环境
小波聚类是基于小波变换的一种新的聚类方法。帧差分是相邻图像序列分析的重要方法之一。本文首次提出了一种结合帧差分和小波聚类的视频运动目标检测算法,在视频帧差分基础
会议