条件随机场的协同学习序列分类技术研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:nastar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着信息技术的飞速发展,信息技术进入到了云时代,随之而来的是大数据的发展与应用,因此,大数据分析技术的研究价值越来越大,其在信息技术应用中的地位也更为重要。序列数据是一种广泛收集与应用的数据表达形式,对序列数据的分析技术在数据分析领域也受到了更多的关注与研究,尤其是序列数据分类工作是一个十分重要的数据分析内容。   条件随机场模型作为一种基于条件概率的判别式模型,应用于序列数据分类中有着重要的实际意义。序列数据分类分析任务主要是利用有标签数据训练机器学习模型,然后对序列数据的序列结构进行预测与分类。条件随机场被证明是一个有效的序列分析工具,这是因为在训练数据完备的条件下,条件随机场能够有效的结合序列数据的数据上下文关系。然而在实际应用中,有标签的训练数据常常是难以获得的。基于以上的需求,本文提出一种条件随机场的协同学习方法。本文的研究内容与研究特点主要有:   (1)在序列数据中,介于序列数据的特点——数据的上下文之间是相关联的,面向序列数据的分类方法也应当结合数据的上下文之间的关系。针对这种现象,本文提出了基于条件随机场的序列数据分类方法,将自然语言处理中的上下文相关的概念引入到序列数据分类中,以提高序列数据分类的精度。   (2)通过统计分析我们观察到,模型的建立需要完备的训练数据的支持,然而在实际中,通常难以获取有标签的训练数据,人工标注训练数据又不是实用的方法。针对这种现象,本文提出了条件随机场的协同学习方法,利用多个模型的协同训练的方式,弱化对训练数据规模的需求。   本文做了大量的基于真实序列数据的实验,实验的结果充分证明,条件随机场在序列分类方法中具有很大的优势,同时条件随机场的协同学习方法在有限的训练数据集上比条件随机场更准确。
其他文献
生物体内的新陈代谢过程完成了生命体基本的物质转换和能量代谢等功能,是生物体存在的基础。通过对生物体代谢系统的研究和分析,人们可以对生物体代谢系统的性质和行为进行定性
随着计算机的广泛应用,传统的软件开发方法已经无法满足社会的要求,基于构件的软件开发方法己被广泛接受,并逐步成为解决软件危机、提高软件生产率和确保软件质量的有效途径
软件测试是保证软件质量的重要而有效的手段,已成为软件工程中重要且不可或缺的一个环节。随机测试以其无偏性,自动化高,速度快和易于实现等优点使其成为近年来软件测试领域的一
Android系统是目前最受欢迎的智能手机操作系统,吸引大量的应用程序开发者为其开发应用程序。由于应用程序开发者良莠不齐,致使Android市场上存在大量的恶意应用程序,如何快速准
现代数字信号处理器经常采用超长指令字体系结构。与通用处理器普遍采用的超标量体系结构相比,超长指令字将调度任务交由编译器完成,这对编译器的后端优化提出了挑战。   BW
本文先介绍了在互联网环境下传统关系数据库技术遇到的挑战,认真分析了互联网应用(特别是博客类社交应用)的具体特征:数据量巨大,有明显的数据热点;并发请求量巨大,但是访问模
作为体现服务机器人智能化水平的重要功能之一,物体检测与识别是机器人视觉领域一个开放的研究课题。由于问题的复杂性,在机器人上实现实时可靠的物体检测与识别系统仍然是一个
随着计算机的不断普及和互联网技术的不断发展,网络安全事件呈现出发生频率高、事件危害大、种类多样化等特点,入侵检测作为一种主动的防护技术,愈加的受到网络安全防护人员
近年来,多媒体技术得到长足发展,已经被广泛应用到人类生产生活之中。多媒体技术以其多样性和趣味性得到推崇。将多媒体技术结合网络通信用于教学工作,将是个不错的选择和尝
现代卫星远程教育是我国非常重视的长期发展战略。我国幅员辽阔,地区差异大,教育发展不平衡。以内蒙古的情况为例,农牧区的教学资源、教学手段和信息化程度,与城市相比存在巨