基于多示例的集成学习理论与应用研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:huohuonan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多示例学习是继监督学习、无监督学习、强化学习之后的第四类机器学习框架。与以往的三大学习框架不同,多示例学习的训练数据中样本与示例是不同的概念。多示例学习作为一种新型的学习模式,近几年来受到学者们的高度重视,并成为研究的热点,广泛的应用于机器视觉、图像处理等应用领域。本文比较系统地研究多示例学习,将其与集成学习相结合,探讨基于多示例的集成学习理论和方法,并将其应用于目标跟踪和验证码识别这两个领域。本论文具体工作如下:(1)本文首先深入研究了多示例集成学习基础理论和基本原理,然后详细介绍三种具有代表性的MILBoost算法理论,以及阐述这三种算法分别应用于目标检测、跟踪和识别三个方面的优点和应用过程中存在的局限性,为后续目标跟踪和验证码识别工作做好充足准备。(2)针对多示例学习目标跟踪算法自适应获取正包时,正包中的正示例可能不具备辨别性,而且还易受到无益或有害示例的干扰,故不能很好的提取目标的鉴别性特征,影响了跟踪算法的稳健性。因此提出一种基于核密度估计的权重示例选择方法。先依据距离目标近的样本贡献大;而距离远的贡献小的原则,设置示例的权值大小,随后建立核密度估计函数来精简正包中的示例,剔除正包中无益示例或者有害示例,最后利用精简后的样本数据对MILBoost算法进行训练学习,实现对目标的实时跟踪。(3)针对某网站动态验证码字符种类多,形状和大小差异大,以及该验证码引入时间维度增加识别难度等特点。本文采用MILBoos t算法来识别动态验证码,然而在识别过程中会出现由部分匹配而导致误识别的现象,在此基础上使用重合面积比较方法降低误识别,最终成功地识别了该网站的所有不同类型的动态验证码,并在所有类型的验证码上都取得了较高的识别率。
其他文献
随着信息技术发展,电子商务成为当今计算机和商务领域的一个热门话题,随之企业间的合作与交流也更加广泛。Internet技术的发展和普及大大促进了电子商务的发展。随着企业间互
在目标检测与跟踪过程中,往往会出现外界环境的干扰以及目标自身变化等情况,这大大增加了检测与跟踪的难度,降低了算法的性能。本文在对目标检测与跟踪技术国内外研究现状进
集成了传感器、微机电系统和网络三大技术的传感器网络作为一项新型的信息采集和处理技术,日益受到国内外的高度重视,在环境监测、国防军事、医疗卫生、反恐安全等领域具有广
随着计算机技术和软件技术的发展,具有高度自治性和灵活性的实时嵌入式系统在航天、航空、航海、通信和网络设施等领域的应用越来越广泛。这些嵌入式系统往往具有较高的长时
随着IP网络的进一步发展,新的、要求更高的业务流层出不穷,正是由于它们的出现对现有的网络提出了如更高的传输效率、动态的路由调整、灵活的网络控制能力、信息传输过程的可
医疗影像存储与传输系统的主要功能是存储、传输和管理医疗影像数据,但应用三维重建和交互技术能辅助医生更直观方便地观察和操作医疗影像数据,进而更好地辅助医生进行诊断,
随着Internet的飞速发展和普及,在我国高校学分制的实行以来,越来越广泛的要求学生进行自主选课,学生选课系统也从原始的手工填表过渡到网络选课。本文在综合考虑以往的选课系统
在航空电子系统中,系统内各个模块之间进行着大量的数据传输,传统的ARINC429总线通信卡依赖通信平台处理机来完成控制与处理工作,增加了系统开销,降低了传输速率,系统可靠性
移动代理(Agent)技术涉及到计算机网络、分布式系统、通信技术、操作系统、计算机语言以及人工智能等诸多领域,为了更好地利用好移动Agent技术,必须解决好迁移、通信、编程语
最近几年,对等计算(Peer-to-Peer,简称P2P)迅速成为计算机界关注的热门话题之一,财富杂志更将P2P列为影响Internet未来的四项科技之一。 Peer-to-Peer(P2P)作为以文件共享