基于条件随机场的口语理解研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:ss501love
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的飞速发展,用户对人机交互质量和人机对话系统的性能需求随之增加。在人机对话系统中需要利用到口语理解技术,该技术的发展水平对人机对话系统的性能起着至关重要的作用,因而需要寻找到合适的口语理解方式,以便促进人机对话系统的发展。口语理解过程涉及到自动语音识别技术,该技术在神经网络声学模型的发展带动下取得了很大进展。由于系统因素的影响,在自动语音识别时也可能出现一些识别错误问题,这些错误可能会因为不规则口语的存在而更明显。本文主要是对目前的口语理解问题进行了研究,通过对这些问题的分析提出了基于条件随机场模型的稳健性口语理解方法。本文的主要工作及创新点如下:1.语音识别性能的不理想造成的识别错误以及不符合文法的口语输入往往造成口语理解性能下降。针对此问题,本文提出一种改进口语理解稳健性的方法。该方法通过在训练数据集中人工加入错误文本噪声进行语料扩充,送入条件随机场口语理解模型进行训练,用得到的模型对具有噪声的未知数据集进行口语理解。2.针对口语理解语句中词与词向量之间的关系对口语理解的性能所产生的影响,提出了一种基于词嵌入的改进口语理解方法。首先用word2vec对口语理解语句进行词嵌入处理,得到语句中所有词的向量。通过计算词向量之间的相似度,从而得到每个词之间的相似度,再经过聚类,得到一个初始模糊分类。然后将这个初始模糊分类作为一个特征,与其他的特征一起送入条件随机场进行口语理解训练,得到最终的分类结果。最后对所建立的模型在汉语交通查询领域进行实证。实验结果表明,本文建立的这种方法显著优于先前的基于规则的方法,此外相比数据驱动算法而言,可以显著降低开发成本,性能却没有受到影响。
其他文献
随着矿山多媒体通信技术的发展,其对监控质量、图像无线传输等高级功能的要求日益迫切,从而对多媒体通信终端提出更多更高的要求。针对国内矿用多媒体通信终端存在的图像压缩质
数据的采集和处理是无线传感器网络(Wireless Sensor Networks,WSN)的基本服务机制,随着WSN的应用深入各个领域,其所收集处理的数据包含大量有价值的敏感信息,但由于无线传感
随着通信产业的飞速发展,各种新的技术和标准不断出台。由我国自己提出的TD-SCDMA标准就是目前国际公认的3G三大标准之一。自提出并得到国际电信联盟的确认以来,TD-SCDMA标准
当前卫星地球站系统的多样性和设备专业性都很强,决定了不同的分系统多由不同的厂家提供。这样对各个设备进行监控的管理软件互不兼容,同时操作维护及系统升级都相当的不方便
为了缓解无线通信日益发展与频谱资源不足的矛盾,本文将MIMO技术和智能天线技术相结合,提出MIMO智能天线。MIMO智能天线就是在基站和移动台两端同时使用多根智能天线的技术。
人脸作为人体重要的特征之一,有着非常强的区分性、恒定性和个体差别。包含了人脸检测、识别和追踪等。因为人脸优势明确,它有不接触、全过程简明及距离适中等技术上明显的优
基于视频的运动目标检测与跟踪是计算机视觉领域的一个重要研究方向,在安防监控、智能交通、机器视觉导航等诸多领域有着广阔的应用前景。就智能交通领域而言,交通监控视频提
OFDM技术是一种多载波传输技术,由于它具有极强的抗多径衰落能力和极高的频谱利用率,其己经被广泛应用于无线局域网等无线高速数据传输系统中,OFDM也被视为第四代移动通信的
互联网和Web2.0的兴起带来了丰富的Web应用服务,但是提供服务的各网站的认证系统互相独立,用户的认证信息不能在各网站间共享。所以用户在享受便利的互联网应用时,需要记忆大
微博上的虚假信息和谣言等通过因特网进行传播,不仅阻碍着人类社会的网络化发展进程,并且对我们社会稳定发展造成很大的影响。因此,通过将谣言等在因特网上的扩散过程的具体