基于重采样和集成选择的适用于实体识别的多分类器系统

来源 :数据采集与处理 | 被引量 : 0次 | 上传用户:wang3398218
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实体识别常利用分类器根据记录对的字段相似度向量将记录对分为匹配、不匹配和可能匹配,因此分类器的准确性与实体识别的准确性直接相关。为提高分类准确性,本文基于重采样和集成选择技术构建一个多分类器系统。充分利用实体识别的特点,在分类之前发现分类困难的样本,并使重采样比率在一个区间内变化,生成一组重采样样本;然后用重采样后的样本训练分类器构建一个并行多分类器系统,强调分类器之间的差异度和稀疏度,从该多分类器系统中选择最优分类器子集,即最优的重采样比率组合,分别用非线性规划和极值方法求解该集成选择模型。实验结果表明
其他文献
随着苏里格气田生产的进行,千余口节流器生产井进入递减期,音速雾化喷管对低产气井的排水采气效果需进一步验证。在对音速雾化原理研究的基础上,结合苏里格气田井下节流工艺
<正> 1 基本概念基因芯片技术是随着人类基因组计划的逐步实施和分子生物学的迅猛发展应运而生的一门新的基因分析技术,它综合了分子生物学、半导体微电子、激光、化学染料和
会议
文章以2000年全国人口普查数据为基础,建立预测模型,并在参数假定分析基础上预测中国人口的变化,再根据模型数据推算中国未来人口老龄化的发展趋势,预测结果显示,到2020年左
碳达峰与碳中和愿景的提出为我国低碳/脱碳发展明确了新方向,也对科技创新和技术发展提出了新要求。世界各国均将科技创新作为碳中和目标实现的重要保障。我国实现碳中和目标
近年来,凡口铅锌矿与中南大学合作,不但利用SURPAC矿业软件建立了矿体实体和块体模型,而且还利用地质统计学中的变异函数对矿体变化进行研究,运用克离格法推估矿体品位、计算矿体
为获得飞机的纵向飞行品质参数,分析了时域法和频域法的优缺点,并针对某大型客机的纵向试飞数据特点,实践了相应的数据预处理过程,修正了试飞数据。分别建立了合适的时域气动
对宁夏南部山区马铃薯种薯繁育推广体系建设现状和问题进行分析,提出了宁南山区马铃薯种薯繁育推广体系的发展对策:选育和推广优质马铃薯品种,提高马铃薯产量和产品品质;提升
在VB的程序开发中,使用标准的SQL语句结合Connection对象对数据库中的数据进行操作,对表中的数据进行检索和统计,方法非常方便。最常用的是Select语句,该语句用来从数据库表
同煤浙能麻家梁煤矿副井井筒在冻结段施工过程中,使用溜灰管下灰时,利用吊盘固定式分灰器对混凝土进行二次搅拌,解决了混凝土离析问题,提高了工程质量,同时节省了砌壁辅助时