【摘 要】
:
目前由于特定任务域语料的稀疏并且难以收集,这严重阻碍了对话系统的可移植性.如何利用在线收集的少量训练语料,实现语言模型的快速自适应,从而有效提高对话系统在新任务域的
论文部分内容阅读
目前由于特定任务域语料的稀疏并且难以收集,这严重阻碍了对话系统的可移植性.如何利用在线收集的少量训练语料,实现语言模型的快速自适应,从而有效提高对话系统在新任务域的识别率是本文的目的所在.本文对传统cache模型修正后,提出了基于历史单元衰减的cache语言模型,以在线递增方式收集语料进行自适应,并与通用语言模型进行线性插值.在对话系统中,以对话回合为历史单元,也可称为基于对话回合衰减的cache语言模型.在两个完全不同任务域--颐和园导游与火车票订票任务域进行的实验表明,在自适应语料不到1千句时,与无自
其他文献
改革开放30年来,我国高校内部管理体制不断完善,为建立现代大学制度打下了良好的基础。为了建设具有中国特色的高等教育强国,促进高校科学发展上水平,我国高校内部机构设置及运行
在多年学习、使用、翻译与参与评审几种规范IT名词集的基础上,本文将系统分析方法用于对此类名词集的定名与评价.其基本方法,一是从名词集中拆分出基础要素--名词元;二是提出
报道了硅灰石与盐酸反应在PH≥2条件下的反应模式,并从反应产物颗粒形态、粒径分布、表面电位、比表面积等性质及反应动力学规律来证实这种反应模式。
穿插在江西广丰早白垩纪红盆中的碱性基性岩,K-Ar年龄为40.6 Ma,基性岩中辉石有基质、斑晶二种类型三个世代,早世代辉石斑晶为巨晶、堆晶,是"Ⅱ型包体";晚世代辉石斑晶为小斑
Linux系统对少数民族文字的支持需要建立在国际化机制基础上,本文在总结现有Linux国际化框架层次结构基础上,分析了X核心系统国际化的一些关键问题,并以增加藏文支持的实践为
在世界经济企稳回暖,中国经济强劲增长的背景下,位于浙江杭州的开氏集团有限公司更是一路高歌。最近4个月,全公司每月实现利润5000多万元,上交税收2000多万元,预计11月将实现利税1
目前,在计算机中汉字有多种代码页,汉字的多代码页并存现象将长期存在.为了实现汉字多代码页并存,需要汉字代码页自动识别技术的支撑.屏幕实时解释引擎是目前各种在线字典、
分级识别的策略在模式识别领域中提出相当长的时间了。尽管人类可以训练地使用这个策略进行识别 ,但对语音识别而言 ,缺少一个有效的系统化的方法来实现它。本文给出了我们最近在这方面做的一些研究工作 ,使用了子空间划分原理来实现一个分级识别器 ,并用树型结构来组织多个识别器。实验结果表明 ,该方法与传统方法相比 ,误识率降低 10 %。我们将在未来的研究工作中 ,测试全部汉语音节 ,并将该方法扩展到连续语
在湖泊中存在三种三角洲类型,即正常三角洲,辫状三角洲和扇三角洲。它们均由三角洲平原、三角洲前缘、前三角洲三部分所组成。陆相地层具有强烈的旋回性,只要将基准面看成海平面
赣东加里东变质混合岩带,是以混合岩体为主体,受韧性剪切带控制的多相、多型、递增变质带,是受区域深构造控制的热变质带.该带产有茅排式金矿.通过对该带金地球化学特征和地