【摘 要】
:
人机语音交互是一项可以使人与计算机进行对话的技术,而语音合成——将输入的文本转换为语音则是人机语音交互技术中的典型[1]。近年来语音合成技术在学术界和工业界均进展显著并日趋成熟,在可懂度、音质及听感方面已取得了明显成效,但自然度尚未达到真人语音水平。随着人们的智能化生活需求与日俱增,语音控制、语音翻译、语音导航等智能语音系统不断投入应用,相关技术需求日益旺盛,引领着语音合成技术的发展方向。探索新方
论文部分内容阅读
人机语音交互是一项可以使人与计算机进行对话的技术,而语音合成——将输入的文本转换为语音则是人机语音交互技术中的典型[1]。近年来语音合成技术在学术界和工业界均进展显著并日趋成熟,在可懂度、音质及听感方面已取得了明显成效,但自然度尚未达到真人语音水平。随着人们的智能化生活需求与日俱增,语音控制、语音翻译、语音导航等智能语音系统不断投入应用,相关技术需求日益旺盛,引领着语音合成技术的发展方向。探索新方法以提升语音合成的自然度和表现力成为当务之急。本文针对维吾尔语音合成技术进行研究,首先回顾了维吾尔语音合成系统的研究现状并针对存在的问题开展了如下研究工作:由于缺乏公开的维吾尔语音合成语料,本研究建立了所需的维吾尔语音合成语料库及语音库。在此基础上根据维吾尔语的语法结构、韵律层结构和语音特征,研究了维吾尔语音转换系统的前端文本处理问题。通过文本处理厘清了从语言层到语音层的映射关系。为提高文本分析模块的鲁棒性而构建了知识库、规则库及树库。以韵律短语划分为背景,研究了词性调整方法以及韵律词和韵律短语的划分技术问题。为了实现基于隐马尔科夫模型(HMM)的维吾尔语音合成系统并构建其框架,本研究根据维吾尔语的语言特征统计了所有可能音素的上下文属性集和问题集,并对其进行了优化和实验验证。运用改进系统训练流程和音素时长模型的方法调整了韵律短语节奏,从而提高了合成语音的自然度。通过研究神经网络输入端的语言特征和输出声学特征,构建了训练模型框架,并运用不同的神经网路模型进行了对比试验。基于HMM的维吾尔语音合成系统自然度虽然达到了应用标准,但其与实际应用需求仍有一定差距。为了获取更高自然度的合成系统,本研究尝试了神经网络方法。运用主观和客观测试方法,对合成语音质量进行了评测,发现基于Bi LSTM(双向长短期记忆神经网络模型)的维吾尔语音合成系统,在连续性和流畅性方面明显优于基于参数合成方法构建的语音合成系统,其自然度达到了应用标准的令人满意的指标。在具备语音自然度较高的合成系统的基础上,为了进一步提高合成语音的情感表现力而研究带有情感特征的文本,以韵律短语为单位对输入文本进行情感分类,从而获取了上述文本的情感语言特征。最后,将基于Bi LSTM的维吾尔语音合成系统成功应用于主要由语音识别、语音合成和机器翻译等三大模块组成的维吾尔语-汉语音翻译系统中,提高了该系统合成语音的自然度。本研究除改善了维吾尔语翻译系统合成语音的自然度,从而在维吾尔语音合成领域实现了应用价值外,也可以为哈萨克、柯尔克孜等语言的语音合成研究与应用提供借鉴。
其他文献
灾难性地表过程常会对人类生存和生活环境带来重大威胁,因而其长期以来是地理学的重要研究内容,其中有关灾难性地表过程的发生机制和发生规律及其准确预测已是当前研究的重点。近几十年来,因全球变化引起的区域环境变化及相关的灾难性地表过程对人类生活和社会发展产生了重大影响,现实案例不胜枚举。青藏高原东北缘是早期人类活动的主要区域和进军高原的主要扩散通道,区域内史前文化高度发达,同时其自然环境又高度脆弱、极具过
网络借贷是金融与科技融合背景下依托信息技术诞生并兴起的新型金融业态。在网络借贷模式下,投资者与借款者绕过金融中介直接进行交易,有助于降低金融交易成本和金融服务门槛,满足多元化的投融资需求。但与此同时,由于网络借贷具有线上化、匿名交易、跨地域等特点,网络借贷投资者与平台、投资者与借款者、平台与借款者之间均存在信息不对称。如果缺乏有效的信号传递机制、科学的风险管理方法和及时的外部监管政策,网络借贷市场
代理理论分析框架分别强调了股权与债权激励在缓解股东-管理层以及债权人-管理层代理问题中的重要性。然而无论是理论界还是实务界均过度关注股权激励,而关于债权激励的研究相对较少。2008年金融危机以惨痛代价暴露了股权激励的缺陷。为了维护债权人利益,加强金融风险防范,国际金融稳定委员会(Financial Stablity Board,简称FSB)出台文件引导商业银行执行高管延付薪酬这一债权激励措施。响应
2004年,Andre Geim和Konstantin Novoselov成功剥离出单层石墨烯,在化学、材料科学、凝聚态物理和电气工程等领域掀起了单层材料研究的热潮。二维(2D)石墨烯因其独特的物理和化学特性而受到了广泛的关注。然而,石墨烯固有的零带隙限制了其在逻辑电子器件中的应用,促使研究人员在元素周期表中的其他位置寻找具有丰富物理特性和广泛应用前景的其他二维材料。因此,具有较大带隙的新型二维材
病毒作为水生生态系统中数量最多的生物体,广泛分布于海洋、湖泊、河流等水环境,在调节微生物群落组成和结构、元素的生物地球化学循环、遗传物质的水平转移以及气候变化等方面具有重要作用。针对海洋病毒宏基因组学的研究,揭示了海洋浮游病毒的高度多样化和极其丰富的物种组成。而针对淡水生态系统的病毒群落研究还较少。湖泊是揭示全球气候变化与区域响应的重要信息载体,是陆地表层系统各要素相互作用的节点,浮游病毒在淡水湖
<正>《义务教育数学课程标准(2022年版)》对尺规作图教学明确指出:经历尺规作图的过程,增强动手能力,能想象出通过尺规作图的操作形成的图形,理解尺规作图的基本原理与方法,发展空间观念和空间想象力。尺规作图是初中阶段的一个重点和难点,在中考系统复习阶段已完成对基本尺规作图的归类整理,那么中考专题复习如何才能切实达到“想象出图形,探索作图方法,理解作图原理,发展学生空间观念和空间想象力”?下面笔者结
近年来,由于N掺杂能够改变应用广泛的多孔碳材料的表面性质,新兴的N掺杂碳负载型催化剂的设计引起了科研工作者的关注,并且已经取得了很大的进步。与未修饰的碳材料负载型催化剂相比,由于氮的引入能够改变金属-载体之间的相互作用,N掺杂碳负载型催化剂通常在许多非均相催化反应中显示出优异的催化性能。从已有的研究报告中可以发现,针对这类催化材料而言,氮物种的可控制备,活性位点的确定以及催化剂结构与活性之间规律性
数学课堂中,教师要根据学生的认知起点、知识之间的衔接、高阶思维的培育精心设计问题链进行关联教学,具体有三条途径:发现关联,确立路径“延伸线”;揭示关联,激活方法“衔接点”;完善关联,促成思维“生长链”。
处在世界百年未有之大变局中,尤其是面对以新冠肺炎为代表的等诸多不确定性因素,如何使经济社会持续健康发展,是各国要应对并妥善解决的重要问题。在众多选项中,技术的创新与运用被摆在了突出位置。然而,技术转变为现实生产力是一个复杂的动态演进过程,其核心内涵是技术资本化。因此,本文聚焦中国技术资本化,以中国技术资本化的实现路径为研究对象和研究主题,剖析中国技术资本化的发展机理,并在此基础上以期通过对技术资本
南北朝后期到唐初贞观时期是书法史演进的一个关键阶段,最终南北两种书风被统一为“唐法”。但唐法的实质如何,其形成原理如何,南北书风统一的本质是怎样,都还值得研究。自秦汉的政教体系规定了不同书体的尊卑层级之后,书写模式就一直有“公范”与“自遣”两种发展方向,两者之间有复杂的离合关系。曹魏“禁碑令”之后,章程书、行狎书等“自遣性”更强的书写模式开始繁荣。到南北朝时期,南方基本是在“自遣”的道路上行进,而