快速口音自适应的动态说话人选择性训练

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:liongliong573
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决语音识别系统实用中的说话人口音快速自适应问题,提出了一种动态说话人选择性训练方法。基于说话人选择性训练方法,采用基于Gauss混合模型似然分数计算的置信测度选择训练用说话人,改变训练用说话人的绝对数目选取方式,提高了选取的效能并拓展了选取标准的推广性。根据各个训练用说话人同被适应说话人的不同似然程度,加权地合成动态说话人选择性训练的语音模型,提高了自适应训练的效果。实验表明:该方法使识别率从80.16%提高到84.12%,相对误识率降低了19.96%,在实用中提高了基线系统的识别性能。 In order to solve the problem of rapid adaptation of speaker accent in speech recognition system, a dynamic speaker selective training method is proposed. Based on the speaker selective training method, the training speaker is selected based on the confidence measure of the likelihood score of Gauss mixture model to change the absolute number of training speaker selection, which improves the efficiency of selection and expands the generalization of the selection criteria . According to the different likelihoods of each speaker in training and the adapted speaker, the speech model of dynamic speaker selective training is weighted to improve the effect of adaptive training. Experiments show that this method improves the recognition rate from 80.16% to 84.12% and the relative misrecognition rate decreases by 19.96%, which improves the recognition performance of the baseline system in practice.
其他文献
为了在提高重建图像质量的同时不增加系统开销,提出一种将改进的图像平滑与加权零块判决准则结合的算法。图像增强能有效去除在获取原始图像阶段引入的随机脉冲噪声、Gauss噪
许多研究资料证明 ,支原体感染可引起外周血T淋巴细胞亚群异常和 T细胞功能低下 ,但小儿支原体肺炎外周血淋巴细胞凋亡特性及与 T淋巴细胞亚群改变间的关系尚未见有报道。为
如今美国政府头上顶着一个巨大无比的国债“堰塞湖”,不知道何时决口;如果决口,犹如黄河决堤,一泻千里,民生涂炭。
[摘要]目前,我国许多基层单位还没有设置专门的档案管理机构,文书档案管理工作存在较大的漏洞,在一定程度上制约了基层单位的可持续发展。对此,本文立足于我国街道文书档案管理现状,在简要分析街道文书档案管理重要性的基础上,重点探讨了街道文书档案管理存在的问题与对策,以期对街道文书档案管理改革提供参考借鉴。  [关键词]街道文书档案管理;存在问题;发展建议  所谓的文书档案,就是在社会的行政管理活动中,由
1994年3月~1999年6月,我院应用持续腰池引流治疗颅内出血性疾病108例,收到满意效果.现总结如下.
为了解决多天线系统的识别模糊问题,提出一种基于系统输出信号二阶统计的正交频分复用多天线(OFDM-MIMO)系统盲信道估计算法。该算法从频域角度出发,从而将有限冲击响应信道
我国石油企业在长期生产经营中倡导、积累,经过筛选提炼成的,由一系列石油企业价值观、信念、仪式、符号、处事方式等组成的特有的文化形象即为石油企业文化,它是企业的灵魂