【摘 要】
:
标注数据的获取一直是有监督方法需要面临的一个难题,针对中文口语理解任务中的意图识别研究了结合主动学习和自训练、协同训练两种弱监督训练方法,提出在级联框架下,从关键
【机 构】
:
内蒙古师范大学计算机与信息工程学院,中国科学院语言声学与内容理解重点实验室(中国科学院声学研究所)
【基金项目】
:
国家自然科学基金资助项目(10925419,90920302,61072124,11074275,11161140319,91120001,61271426);中国科学院战略性先导科技专项(XDA06030100,XDA06030500);国家863计划项目(2012AA012503);中国科学院重点部署项目(KGZD-EW-103-2);内蒙古师范大学“十百千”人才培养工程项目;内蒙古自然科
论文部分内容阅读
标注数据的获取一直是有监督方法需要面临的一个难题,针对中文口语理解任务中的意图识别研究了结合主动学习和自训练、协同训练两种弱监督训练方法,提出在级联框架下,从关键语义概念识别中获取语义类特征子集和句子本身的字特征子集分别作为两个"视角"的特征进行协同训练。通过在中文口语语料上进行的实验表明:结合主动学习和自训练的方法与被动学习、主动学习相比较,可以最大限度地降低人工标注量;而协同训练在很少的初始标注数据的前提下,利用两个特征子集进行协同训练,最终使得单一字特征子集上的分类错误率平均下降了0.52%。
其他文献
目的:探讨表格式伤口护理记录单在伤口专科护理门诊的应用效果,规范专业内容,体现专业价值,提高工作效率。方法:根据相关法律法规,结合伤口专科护理内容,自行设计表格,经过临床
多普勒雷达发射的电磁波通过运动目标的反射后产生多普勒频移,利用雷达反射波与发射渡叠加后形成的拍频,可以精确地测定运动物体的速度。
无论是书籍还是电影,《哈利·波特》中那些由魔法棒、水晶球组成的奇幻魔法世界都很令人向往。小星星们,你们人水晶球里看到什么?学业,未来?还是一只张牙舞抓的怪兽?或者养只哈
<正> 为华东电网计算机负荷自动调度的要求,1985年2月,上海发电设备成套设计研究所承接了上海闵行电厂11号机组锅炉—汽轮机协调控制系统的工程设计与调试项目。该系统的设计
目的探讨精索静脉曲张不育症患者彩色多普勒超声的诊断价值。方法用彩色多普勒超声观测38例精索静脉曲张不育患者的精索静脉内径和血液反流持续时间,结合精液质量评估患者的
针对传统单目标的核相关滤波器(KCF)跟踪算法在目标尺度变化的跟踪中存在的问题,提出了一种基于相关滤波器(CF)和尺度金字塔的多尺度核相关滤波器(SKCF)跟踪算法。首先通过传
<正>如果把怀有梦想的创业者比作"种子",那么,众创空间就是"土壤"。其核心价值在于为创业者提供一个智慧汇集、资源汇集交互的平台,并通过这个平台快速找到发展方向,找到志同
《我与世界只差一个你》是一部反映现实的爱情喜剧,讲述两位都市女性因为恋爱从迷失自我之后又找回自我的故事。作品从切入大龄女性婚恋问题这一社会热点问题出发,以女性视角呈现多元化社会不同的婚恋观,弘扬主流价值,倡导女性独立自强。创作阐述从四个方面进行探讨,在剧本选材及主题上,作品以都市女性的婚恋问题入手,始终坚持正向立意,弘扬社会核心价值,对当下普遍流行的拜金主义、杯水主义作了辛辣的嘲讽。结构上采用双线
流动儿童少年义务教育问题涉及教育机会的平等和教育过程的平等,平等权利的实现就是从社会排斥走向社会融合,社会政策作为对社会资源的有权威性的再分配,是对现实社会问题的
目前,常用的情感词典为通用情感词典。对于这些情感词典会存在如下缺陷,如词的情感区分度不够,对于不同数据集适应性欠佳。针对以上问题,基于情感词的情感确定性,提出一种新