维吾尔语大词汇语音识别系统识别单元研究

来源 :北京大学学报(自然科学版) | 被引量 : 0次 | 上传用户:spiderkiss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
维吾尔语是一种黏着语,单词不太适合作为维吾尔语大词汇连续语音识别系统识别单元。针对维吾尔语大词汇连续语音识别系统中的识别单元选择问题,设计更适合维吾尔语的子词识别单元,提出维吾尔语单词和子词相结合的组合识别单元构建方法,并对单词、子词和组合识别单元的语言模型和语音识别性能进行评价。实验结果表明,所提出的识别单元在单元数量、语言模型复杂度等方面表现出更加优越的性能,并且使识别系统的单词错误率比基于单词的系统相对减少22%。 Uyghur language is a cohesive word, the word is not suitable as a Uyghur vocabulary recognition unit for continuous speech recognition system. Aiming at the selection of recognition units in the continuous speech recognition system of Uyghur Great Vocabulary, a more suitable sub-word recognition unit in Uyghur language is designed, and the method of construction of combined recognition unit combining Uyghur words and subwords is proposed. The word, sub-word and combination Recognition unit language model and speech recognition performance evaluation. The experimental results show that the proposed identification unit shows more superior performance in terms of the number of units, the complexity of the language model, etc., and reduces the recognition system’s word error rate by 22% relative to the word-based system.
其他文献
早熟高产玉米新品种中江玉5号是由江苏中江种业股份有限公司选育而成的,本文介绍了该品种亲本及杂交种选育过程和特征特性,总结了中江玉5号的栽培技术,以期为东北早熟玉米品
1 播种与育苗阜阳地区一般不早于九月上旬播种,由于洋葱种子细小,发芽时不易出土,所以床土要疏松、肥沃、保水力强。播种前一般不进行种子处理,而播干的种子。苗床撒播要均匀而稀
<正>由中华国际医学交流基金会、北京大学医学部风湿免疫学系主办,北京大学第三医院(含海淀院区)、北京大学人民医院、北京大学首钢医院、北京积水潭医院、山西大医院、中日
针对目前因避雷器选型或安装位置不当引起的雷电过电压损坏电器设备的问题,提出了金属氧化物避雷器选型时主要参数的选择方法,并具体分析了其在系统中的安装位置,然后通过实
钟嵘《诗品》评曹植诗“情兼雅怨”,由此引出“雅”这一美学概念来体味曹植五言诗作。本文从三个方面来阐释曹植诗歌的“雅”。其一,对《诗经》中“小雅”的继承;其二,与社会现实
目的:评价尿纤维连接蛋白(fibronectin,Fn)在诊断膀胱移行细胞癌中的应用价值,并界定其临床参考值。方法:采用ELISA法检测55例膀胱移行细胞癌患者、34例其他泌尿系疾病患者及29例