基于模糊理论的关键词识别算法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:fengyunwoaihui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关键词识别是从一段连续的语音流当中识别出特定的一个或若干个关键词的技术,是连续语音识别的一个分支。关键词识别技术相对于连续语音识别来说具有耗时短、准确率高等特点,在很多领域具有广泛的应用前景,越来越受到人们的重视。本文主要面向汉语小词汇量的基于隐马尔可夫模型的关键词技术。由于关键词识别不受说话人及说话方式的限制,往往在一段连续的语音流中出现若干与关键词发音相近的易混淆的非关键词,或者关键词之间的发音相似,使系统的识别率下降得很快。针对这样的问题,本文采用自行录制的语音,从对语音信号的预处理开始,采用短时平均能量法和短时平均幅度法对语音信号的始点与末点进行粗判,去除语音信号的无声段。提取10维MFCC倒谱系数及其一阶差分参数作为特征矢量,对关键词和词表外词采用连续隐马尔可夫模型进行建模。训练阶段,采用Baum-Welch算法进行重估迭代。在关键词检出阶段,采用帧同步Viterbi搜索算法,得到若干候选关键词。在关键词确认阶段,为了避免与关键词发音相似的非关键词取代真正的关键词及因为反词模型的选取不够完善而引起的误识,在确认之前采用模糊c均值聚类的方法,引入隶属度原则,以关键词模型和反词模型为聚类中心,对候选关键词进行聚类,根据隶属矩阵确认候选关键词隶属于哪一类,将聚类在反词模型周围的候选拒识掉,在确认阶段,采用聚类后得到的更具代表性的反词模型,应用似然准则对关键词进行最后的确认。另外,还对关键词混淆网络进行了研究与实验,并作为与引入模糊理论的关键词识别的对比实验。实验表明,引入模糊聚类后,整个系统的识别率有了明显的提高,说明了算法的有效性。针对聚类过程中产生远离聚类中心的野点的问题,使用了一种改进的模糊c均值聚类方法,使聚类的效果更好更准确。
其他文献
学位
HSUPA技术是在WCDMA R6版本中提出的,目的是针对上行链路分组业务进行优化和演进。HSUPA是继HSDPA后,WCDMA标准的又一次重要演进。利用HSUPA技术,上行用户的峰值传输速率可以
由于移动通信快速发展的要求以及移动IPv4的局限性,移动IPv6已经开始发展,但移动IPv6的安全性是阻扰其应用的一个主要原因。IPSec协议能提供良好的安全保障,但是由于安全域、
伴随着计算机技术的发展,与之密切相关的人机交互技术向着愈来愈人性化和简单化的方向前进。手势是一种包含了最多信息量的人体语言,有着自然、友好、有效等天然优势,凭借着
目前X射线无损检测方法包括单能量X射线检测方法和双能量X射线检测方法。单能量X射线检测方法是将单一能量的X射线穿透被测物体,利用不同物质对X射线衰减不同,实现对物体的无损
随着无线通信的快速发展,定位业务日渐成为通信系统必备的基本功能,高速率通信也是人们的迫切需求。区别于现有的无线定位技术,本课题研究小组提出了一种载有二维空间方向信
学位
合成孔径雷达(SAR)是现代遥感领域的一项重要技术,能够全天时、全天候、远距离地对地面景物进行高分辨成像,具有重要的军用和民用价值。经典的SAR成像模式包括条带式、聚束式
由于高分辨雷达一维距离像(HRRP)能很好地反映目标的径向距离分布细节,近年来,HRRP作为目标检测、跟踪和识别的特征信号受到了广泛重视。同时,由于多传感器数据融合能利用各
全方位视觉(Omnidirectional Vision)是近几年被重点关注的视觉感知技术,该技术通过鱼眼镜头捕获一帧广角图像来获得三维空间中全部景物的图像信息(其中方位角可达360°,天顶角可
随着电子技术的发展,各种摄像设备已广泛普及。由于外部环境的影响或非专业拍摄等因素,摄像设备容易发生不同形式的不规则运动,导致视频存在抖动。视频抖动会直接影响视频的