序列学习的主动学习问题研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:yangpin1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
序列学习是机器学习中的一大类问题。其研究的对象是序列型的数据。传统的关于序列学习问题的研究主要集中在如声音信号、DNA序列等这种简单的序列,近年来又出现了针对序列元素内容较复杂情况时的研究,例如最大熵马尔可夫模型。有监督机器学习的特点是根据一个经人工标注从而承载了人的知识的数据集进行学习,目前比较成熟的机器学习算法都需要一个数量可观的已标注的训练数据集,而标注工作的代价往往是巨大的。因此,在保持和提高学习效果的前提下,如何尽量减少人工标注的工作量,就成为近年的一个研究热点。 本文提出一种应用于最大熵马尔可夫模型的主动学习方法,它通过人机协作的方式,在一个被部分标注的训练集的基础上由计算机寻找出最需要被标注的数据,然后由人来标注,如此迭代进行下去到一定程度。应用这种方法可以解决在复杂序列上的主动学习问题,从而达到在大大降低人工工作量的基础上仍然较好的完成序列学习的目的。 本文对所提出的主动学习的最大熵马尔可夫模型进行实验,其实验结果较好的说明了主动学习的最大熵马尔可夫模型的正确性和重要意义。本文还将展示一个基于主动学习的最大熵马尔可夫模型开发的原型系统,它很好的展示了主动学习人机协作的工作方式,可以在此原型系统中完成主动学习的工作过程。
其他文献
中国通信网宽带化和IP化的趋势,带来了多媒体通信业务的不断膨胀。然而,不可否认的是,一段时间内,窄带必将和宽带化的进程并进,窄带业务仍然有着广泛需求。本文首先对窄带视
无线传感器网络由于其低成本,低功耗等特点,近年来被大量地应用在大规模的数据采集应用中。随着其应用场景的不断增加,一些问题也随之而来。在一个由大量传感器节点组成的无线传
随着计算机技术的发展,很多研究领域不断地交叉和融合。在微电子技术领域,一些研究者提出使用并行计算机互连网络技术解决单一芯片上多个内核的集成问题,这一技术称为片上网络(N
学位
RSA算法在公钥密码体制中占有重要的地位,它广泛应用于各种高安全性的智能卡应用领域。RSA是目前比较成熟的公钥加密算法。但在智能卡等资源受限的系统中,完成数值较大的RSA密
磁盘阵列(RAID)作为一种提高存储子系统可靠性和性能的技术,已经得到了广泛的应用。特别是近些年来存储系统网络化、规模化等发展趋势,使多容错编码变得更加重要。 在阵列系
蜂窝移动通信系统中一个必不可少的过程便是越区切换过程。TD-SCDMA系统中接力切换过程与其他系统的软切换、硬切换不同。利用智能天线和上行同步技术,在精确定位UE的情况下,
在以各厂商和开源社区为代表的业界努力推动下,随着J2EE技术的推广,越来越多的企业应用系统将J2EE技术作为分布式应用的解决方案首选。每个企业应用系统都需要某种形式的安全措
随着计算机网络技术的发展及其应用领域的不断扩大,家庭网络技术已经由最初的概念框架过渡到了部署与应用阶段。家庭网络具有分布地区广、设备类型复杂、标准不统一、占用大量
伴随着Internet技术获得的巨大成功,IP技术成为未来信息网络的支柱技术之一,以IP为核心的分组化和以移动通信为核心的无线化已成为电信网络演进的主流方向。而软交换技术的出