面向短时语音的维吾尔语-汉语语种识别方法研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:ArchrSaber
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人们效率最高的沟通交流方式,也是社会交际的载体。语音也是是各个国家和各个民族之间的纽带,让人们交流更快捷方便。近年来,语种识别技术广泛应用在各个领域,例如:作为混合语音识别系统的前端区分混合语音,作为机器翻译中的前端处理,应用于多语种信息服务等。同时,随着一带一路倡议的提出,新疆越来越多的得到各地的关注。因此,本文的研究目标为:面向维吾尔语与汉语的语音,利用底层声学特征对语种识别任务开展相关研究,旨在建立一个能在短时语音条件下具有良好性能的语种识别模型。首先,由于目前还没有一个公用的基于维吾尔语-汉语的语种识别数据集,因此本文构建了一个用于维吾尔语-汉语语种识别的数据集,并对数据集的来源与基本信息、数据集的数据清洗和预处理过程做了介绍。并且提出了一种最大限度的保留语种区分性信息的静音检测处理方法。基于音调扰动方法,提出了一种可以弥补说话人数量过少、说话人男女分布不平衡的数据增强方法,并结合噪声扰动对数据集进行了增强。其次,如何从底层声学信息中更有效的提取语种可区分性特征是语种识别课题中的关键。基于此问题,本文开展了基于GMM-ivector框架的维吾尔语汉语语种识别研究,搭建了基于GMM-ivector的维吾尔语-汉语语种识别系统,通过实验的方式确定了模型的参数以及实现细节。最后基于搭建的GMM-ivector系统,验证了WCCN噪声补偿技术对系统的性能影响,并通过实验的方式对比了CDS、SVM、LDA等主流后端分类方法在短时语音的语种识别系统上的性能优劣。再次,基于GMM-ivector系统在短时条件下的性能不佳问题,开展了基于深度学习的维吾尔语-汉语语种识别系统研究。搭建了基于Resnet-50的深度学习语种识别系统,并通过对比的方式验证了深度学习下的语种识别系统在短时长条件下的性能要优于GMM-ivector系统。针对Resnet-50基线系统存在的问题对模型进行了改进,提出了Resnet-LSTM与Resnet-Attention两个改进模型,并综合不同时长下的测试语音片段对改进模型进行了评估,实验结果表明,改进的Resnet模型提高了短时语种识别任务的分类性能。最后,本文从语音的不同声学特征入手,开展了基于MFCC特征与基音周期特征的组合模型研究。将基音周期特征与MFCC特征直接进行拼接后训练了Resnet语种识别模型,证明了基音周期特征在语种识别任务中的有效性。然后对MFCC特征与基音周期特征分别进行建模,并在后端使用融合分类网络对模型进行了融合,得到了基于多特征的组合模型。实验结果表明,多特征的组合模型可以大大提高短时语音下的维吾尔语-汉语语种识别任务的分类性能。
其他文献
管理层收购(也称MBO)是指管理层通过大量购买公司股票,从而达到控制公司的目的的一种行为。一直以来,我国企业尤其是国有企业大都面临管理效率低,代理成本高的问题,于是管理层收购就成为了国有企业改制的一大方式。十六大以来,政府也鼓励在确保国有资产不流失的情况下,对国有企业进行私有化改制。曾经的TCL作为一个地方性国有企业,从1997年便开始进行产权改制,在2015年成功地完成了管理层收购,它的案例非常
纳米材料,包括金属,金属化合物以及碳纳米材料等,因为比表面积大、催化性能优异、吸附能力强、电子传导能力高、生物兼容性好等性能,使得纳米材料的技术开发和实际应用得到了
水凝胶是一种具有高含水率的重要软材料,其独特的三维网络结构和多孔性,能够高度模拟天然软骨组织细胞外基质,为细胞粘附、增殖、迁移以及营养物质传输等过程的实现提供了合适的3D微环境。因此,水凝胶在软骨和骨组织的修复与重建中具有巨大的应用潜力。处于高度分化的关节软骨是生物体内重要的承重组织之一,长期处于高载摩擦磨损、复杂的应力应变负载和无规律的多向运动等苛刻工作环境。因此,应用于软骨组织工程的水凝胶支架
硫化氢是恶臭气体中的一种,而且污染日益严重。传统的利用氧化铁脱硫工艺存在着吸附材料寿命短、再生困难等问题。转轮浓缩吸附是一种可进行连续处理废气的工艺,正好为克服吸附剂再生困难的缺点提供了新的思路。本课题拟采用陶瓷基纤维纸作为载体负载氧化铁作为吸附剂,在固定床上开展其性能的研究,为进一步将吸附剂应用于转轮设备提供参考依据。主要结论如下:1)采用浸渍法分别制备出SW型和L型两种吸附剂,并利用XRD、S
20世纪末21世纪初,吸收和借鉴了西方先进影像理念的宝莱坞电影工作者创作出一批在美学和内容上挑战了印度主流电影的影片——新概念印度电影。影片对性别和性的展现推翻了主流电影保守且敏感的标准,对歌舞片段的改良打破了宝莱坞模式的美学原则。此外,现实主义作品的延续和普世价值观的打造助力新概念印度电影在世界影坛中逐步占据一席之地。新世纪内地电影市场引进的新概念印度电影始终保持着上佳的票房和口碑,影片于异质文
随着集成电路的快速发展,电流传输器(the second current conveyor,CCII)已广泛应用于集成电路中,在一些基本的运算电路、滤波器以及振荡器中都用到了电流传输器。但由于电流
建设美丽中国,全面建成小康社会,实现中华民族伟大复兴的中国梦,重点与难点都在广大农村地区。实现乡村振兴,关键在于提高农业产业化水平,协调推进农村各项事业均衡发展。发展乡村旅游产业,不仅有利于保护农村生态环境,优化农村产业结构,增加农民经济收入,还能健全公共基础设施,弘扬传承乡土文化,优化乡村基层治理,有力推动社会主义新农村建设。随着我国社会主要矛盾变化,城镇化建设进程加快,人民生活水平提高,乡村旅
城市作为人类生存的重要聚居地,本应该是环境优美、生态宜人的,但由于自然界的生态资源被过度开发和消耗,社会长期存在的不合理生活和实践方式,经济发展与生态发展之间的不平衡等问题,导致我国城市的生态环境问题尤为突出,阻碍了生态城市建设的步伐,严重制约了我国社会主义现代化事业的发展。习近平生态文明思想是中国特色社会主义理论体系的重要组成部分,其主要内容包括生态文明经济观、文化观、民生观和政治观。本文以习近
酸度是评定溶液性质一项重要的物理化学参数,在工业生产、科学研究、医疗、食品等很多领域,酸度都是不可缺少的监测指标。在某些特殊生产工艺中,往往需要高酸度介质条件,但目
岩浆通道成矿系统作为近年来提出的成矿假说,对于解释岩浆硫化物矿床的岩浆起源,成矿元素的分配和富集,成矿物质的上升运移、以及就位成矿整个过程,指导铜镍铂族矿床的找矿勘