汉语连续语音识别中不同基元声学模型的复合

来源 :电子与信息学报 | 被引量 : 18次 | 上传用户:oqo235
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文研究由不同声学基元训练的声学模型的复合。在汉语连续语音识别中,流行的基元包括上下文相关的声韵母基元和音素基元。实验发现,有些汉语音节在声韵母模型下有更高的识别率,有些音节在音素模型下有更高的识别率。该文提出一种复合这两种声学模型的方法,一方面在识别过程中同时使用两种模型,另一方面在识别过程中避开造成低识别率的模型。实验表明,采用本文的方法后,音节错误率比音素模型和声韵母模型分别下降了9.60%和6.10%。
其他文献
该文提出了一种从背景移动红外图像中自动检测运动目标的算法。该算法首先采用图像灰度互相关度量的匹配算法对连续的6帧序列进行配准,用第1帧和第4帧配准,第2帧和第5帧配准,第3帧和第6帧配准,然后用配准后的图像对分别做差分运算,再将3个差分图像按像素相乘,在运动目标处得到了非常尖锐的相关峰。这为进一步自动跟踪目标提供了一个跟踪窗口的中心点。实验结果验证了该方法的有效性。
本文提出了一种抑制Wigner-Ville分布(WVD)交叉项的新方法。首先对多幅具有不同时-频分辨率的谱图进行叠加,然后对叠加结果进行阈值处理,确定WVD自项在时频平面的支撑区域。最后,用该区域的示性函数乘以WVD得到一个新的时频分布。不同于传统的抑制交叉项的核函数方法,该方法抑制交叉项的同时,保持WVD了高时频聚集性。实验结果表明,该方法对由多个LFM信号构成的多分量信号和非线性调频信号都非常
在前期纱网材料沙障铺设机研究的基础上,针对其整机结构中的核心部件及智能控制方面进行了优化改进设计,实现了在流动沙丘上铺设纱网沙障机械化作业,创新性解决了纱网材料沙
应用低密度奇偶校验(LDPC)码译码消息的密度进化可以得到码集的噪声门限,依此评价不同译码算法的性能,并可以用来优化非正则LDPC码的次数分布对。该文首先以Rice信道下正则LDPC码为例,讨论了不同量化阶数及步长时BP,BP-based和offsetBP-based3种译码算法的DDE(DiscreteDensityEvolution)分析,接着在offsetBP-based译码算法的DDE分析
数字城市是数字地球建设计划的核心组成部分,是集成了地理信息系统、大比例尺地图测绘、计算机等相关技术后把城市的历史、现在和未来的状态利用信息技术进行数字化虚拟实现的城市工程项目。本文在国内外数字城市的研究与发展现状的基础上,揭示出3维数字城市建设是未来城市建设的必然趋向,分析了建立城市3D模型的数据来源以及获取方法,并给出了数字城市3D模型实例及其实现的关键技术,最后探讨数字城市3维建模的方法。对数
将Hi-Nicalon纤维在H2O 14 kPa;O28 kPa;Ar 78 kPa的模拟气氛环境中,分别加热到1300、1400、1500、1600℃,保温1h。测试各处理温度样品的断裂强度,通过扫描电子显微镜(SEM)观察
基于SketchUp 6.0,ArcGIS软件平台,研究了地下空间信息3维可视化的实现过程,强调利用ArcEngine接口功能函数、3维几何对象Multipatch实现某些规则地下空间信息的参数化3维建模。对于AutoCAD数据,采取数据格式转换与ArcEngine编程两种方式实现数据3维可视化及入库。另外,从空间信息管理系统的角度,阐述了地下空间信息系统的结构、数据库组织管理及功能实现,并结合相