【摘 要】
:
人机口语对话技术使得人机交互更加简单自然。然而,要生成一个人机口语对话系统,需要耗费大量的人力物力。如何自动的搜集限定领域语言模型的训练语料以及构建人机口语对话系统
【出 处】
:
中国科学院研究生院 中国科学院大学
论文部分内容阅读
人机口语对话技术使得人机交互更加简单自然。然而,要生成一个人机口语对话系统,需要耗费大量的人力物力。如何自动的搜集限定领域语言模型的训练语料以及构建人机口语对话系统的知识库,是当前的两个研究难点。本文针对这些问题,重点对日常对话聊天领域开展研究,提出了半自动扩展语言模型训练语料和构建口语对话知识库的方法。论文的主要内容和贡献如下:
1.从词级扩展的层面,提出了一种词类扩展方法,并通过实验说明了该方法对语音识别系统的贡献。
2.提出了一种半自动生成一阶谓词知识表示的方法。该方法利用了依存句法分析。首先对句子去停用词,然后对句子进行句法分析,再根据分析结果和关键词表将句子转换成一阶谓词形式,最后生成谓词知识库。实验表明,采用该方法生成的知识库具有很高的检出率。
3.将词类的思想用在口语对话知识库上。根据句型将文本进行分类,同类句型只保留一句,其它以同类词的形式存入词类查询表,并且进一步进行词类扩展。采用该方法可以大大缩小知识库的规模,提高系统的处理速度。
4.运用词类语料扩展和一阶谓词知识表示方法,改进了语音地球仪系统。
其他文献
作为智能交通系统(Intelligent Transport System)的关键技术和重要组成部分,智能车辆(Intelligem Vellicle)被认为是解决路面交通问题的一个有效途径。它是集成了环境感知、
同步现象是复杂系统的一个基本特征,普遍存在于自然系统和人工系统中,如:生物、工程、机械等.由于其所具有的巨大潜在应用,同步已经成为非线性科学领域的一个研究热点.本文对
经济和社会的发展,使得汽车进入寻常百姓家庭已经成为现实,随之而来的城市交通问题也日益突显出来。因此,采用新的科学方法和技术于段来解决城市交通管理问题,就成为当务之急
农业是国民经济的基础,粮食又是农业的基础。我国是一个人口大国和农业大国,粮食安全是关系到我国经济安全和国计民生的大问题。我国粮食产量充足,但是在粮食储藏过程中,由于
随着社会经济的快速发展以及工业化、城市化进程的不断加快,城市用水量急剧增多,导致污水排放量也相应增加,从而加剧了淡水资源短缺和水环境污染的程度。出水氨氮(NH_4~+-N)是水体重要的污染物之一,可以作为评价水体质量的一个重要指标,氨氮超标会使水体富营养化和环境污染。因此,为了减少氨氮浓度超标带来的危害,对污水中氨氮的测量和研究变得至关重要。由于实际的污水处理厂中氨氮的测量方法操作繁琐,测量精度低
随着植物根系相关研究的逐步深入,现有的根系观测方法在实现无损、原位、完整、高精度等方面已经不能满足研究的需求,迫切需要更好更精确的观测方法。CT技术的不断发展,为植物根
系统辨识是根据系统的输入输出数据来建立描述系统的数学模型的理论.近年来,多变量系统的辨识问题引起了控制领域的广泛关注.多变量系统模型种类繁多,辨识方法远比单变量系统辨识
飞行控制系统是无人机系统的核心部分,无人机各项性能在很大程度上取决于飞行控制系统的性能。无人机是一个高度非线性、快时变、强耦合的复杂系统,其精确模型很难获得,且运行环
本文针对星图中的目标定位问题,从设备姿态求解和大气折射率计算两方面进行了研究。在设备姿态求解方面,以依巴谷星表作为导航星表,使用了一种基于角距的星模式识别方法获得
随着现代信息网络技术的飞速发展,电子商务作为经济活动的一个新热点,正在影响着整个社会的经济运行结构。在电子商务环境下,客广是企业的重要资源与财富,是企业生存与发展的基础