【摘 要】
:
随着计算机技术的飞速发展,语音合成(Text-to-Speech,TTS)已经成为人机交互中不可或缺的一部分,并且在人机交互中扮演着重要角色。而目前针对于中文情感语音合成的研究还在萌芽阶段,大部分的研究还是中文语音合成,缺乏情感的加入。本文将研究基于循环神经网络的中文的情感语音合成。研究内容主要有如下工作:1.提出了一个基于循环神经网络的端到端的中文语音合成方法。该方法解决了在资源受限的条件下,经
论文部分内容阅读
随着计算机技术的飞速发展,语音合成(Text-to-Speech,TTS)已经成为人机交互中不可或缺的一部分,并且在人机交互中扮演着重要角色。而目前针对于中文情感语音合成的研究还在萌芽阶段,大部分的研究还是中文语音合成,缺乏情感的加入。本文将研究基于循环神经网络的中文的情感语音合成。研究内容主要有如下工作:1.提出了一个基于循环神经网络的端到端的中文语音合成方法。该方法解决了在资源受限的条件下,经过模型的训练生成梅尔频谱图,梅尔频谱图通过声码器合成中文语音的方法。在实验中,使用“标贝数据集”对模型进行训练,最终得到的结果与真实语音相比,平均意见评分为4.1,与真实语音评分接近。2.提出了一个基于变分自动编码的情感语音合成方法。该方法在中文情感数据集较少的情况下,通过变分自动编码技术学习其情感并生成情感特征,进而与语音合成技术相结合,生成带有情感的语音。在实验中,使用小样本情感数据的“CASIA数据集”,对变分自动编码进行训练得到情感特征,结合前面的语音合成,最终得到的合成情感语音与真实情感语音相比,情感平均意见评分平均为4.0,与真实语音差别不大。3.设计并实现了中文情感语音合成并将其应用于服务机器人。该应用提供有声朗读的功能,用户可在浏览器界面对服务机器人进行文本输入,机器人会根据用户的文本以及情感等按钮的选择,进行带有情感的朗读。浏览器界面简洁明了,满足用户的易操作性。
其他文献
在《行成于思》一书中,作者形象地写道:“管理是什么?像一个方块,似一个圆弧,合在一起就像清朝时代作为货币流通的铜钱:内方外圆。”现再来细细揣摩品味,觉得该给管理起个名字,叫作:“方圆合一,方为其中。”彼得·德鲁克说:“管理就是原则。”也就说,管理的本质是方的,其中最为本源的东西,就是:标准化、流程化、格式化。
石墨烯作为一种新型的表面等离激元材料,在中远红外和太赫兹波段具有重要的应用。与传统的金属表面等离激元相比,石墨烯表面等离激元在红外波段电磁场局域化程度更高,传播损耗更低。更重要的是,可以通过外加栅压实现对谐振频率的动态调节,这突破了金属表面等离激元难以动态调控的限制,为发展宽波段红外吸收光谱技术提供了有效的解决方法,极大地推动了该领域的发展。本文针对制备纳米结构的方法比较耗时且费用高的问题,提出采
当今世界经济的发展与民众的生活水平提高是相互依存的,国富则民强,民强则带动各行各业百花齐放,其中作为国民制造业中的汽车行业自然首当其冲迅猛发展。但是经济高速发展,汽车业高速发展同时会带来一系列的隐形问题,如能源缺乏,交通拥挤,环保堪忧等。响应习近平总书记近年来一直倡导节约资源,绿化减排,大力推行循环经济标准化的号召,政府也推行了一系列针对性的政策计划。伴随着政府政策的有序推行,我国汽车行业汽车车型
当今社会,随着情感计算理论的快速发展,通过计算机识别人体的情绪状态已经成为研究热点。相比基于用户的语音语调、姿势动作和面部表情等数据进行情感分析,基于多生理信号的情感识别技术可更真实地获取参与者内在表达。但是,对基于生理信号的情感识别领域的软件系统来说,还存在一些不足,通过观察和研究主流生理信号采集装置的配套软件发现:(1)软件系统功能局限于信号实时采集、显示、存储和预处理,缺少使用情感诱发素材(
《离散数学》作为计算机类专业学生的必修课程,对逻辑思维以及抽象思维有较高的要求,致使在学习过程中会遇到一些困难。为此,设计开发一个在线学习系统并将其应用于《离散数学》很有必要。一方面,在线学习系统可以对学生的学习起到辅助作用;另一方面,教师可以通过该系统了解学生的学习情况,进而调整教学方案,实现个性化教学。论文主要研究了离散数学在线学习系统的交互技术,并进行系统设计与实现。主要工作包含以下三个方面
本文以认知诊断在自动问答系统中的应用为研究对象,通过问与答的方式完成认知诊断,推荐给用户需要加强训练的题目和薄弱的知识点,从而达到弥补用户有漏洞的知识结构的目的。用户还能使用自动问答系统询问有认知缺陷的薄弱知识点,强化对知识点的理解和认知诊断的效果。另一方面,可视化展示薄弱知识点的关系,可以帮助用户掌握知识点矩阵,辅助认知诊断在问答系统中的应用,而知识图谱可以完成这一任务。故本文以领域知识图谱为载
面临全球温室效应的问题,我国采取积极应对的态度,提出力争在2030年前我国二氧化碳排放达到峰值,力争在2060年前实现碳中和。但大量高能耗,重污染,高碳排的企业在经济环境的推动下,不断地挑战着大自然的容忍极限,对环境可持续发展造成了重大威胁。随着2017年全国发电行业碳排放权交易市场的建立,对我国发电行业节能减排有了更高的要求,其中对火电企业的排放标准更是严格要求,火电企业不得不增加环保投入进而控
伴随着深度学习方法的飞速发展,人脸表情识别方法同样获得了快速发展,但是其仍旧面临着不少难题。对于不同的人类个体来说,即便是表达相同类别的表情,也会存在一定的差异,并且在实际生活中,人们在表达表情的同时还会伴随着言语,这些言语会造成口型的变化从而带来视觉差异,这种情况造成的表情类内差异性问题会严重影响到识别的准确率。同时,表情是一个动态变化的过程,以往使用二维卷积神经网络对单帧图像进行特征提取,忽略
随着计算机技术的迅猛发展,与计算机安全相关的攻防技术也在不断演变进化。本文关注的是众多攻击技术中的ROP攻击(Return–oriented Programming),攻击者控制源程序的返回地址来间接操控程序的走向,从而执行特定的攻击(一般是获取控制权限)。目前,ROP攻击通常利用的是系统内静态库和动态库中的短指令工具链(gadget),通过拼接这些gadgets,完成特定目标的攻击。而针对它的检
近几年来高送转现象是我国资本市场上的一大焦点,我国上市公司接二连三的推出高送转的股利政策,不仅中小投资者热衷于购买高送转股票,甚至还出现了高送转概念股。而在实施高送转的公司当中发现创业板公司占据了绝大多数,由于创业板公司股本规模普遍小于主板公司,又由于属于高新技术企业,具有高成长性的特点,可以利用高送转在快速扩大公司股本规模的同时,向外界传递利好信号。其实高送转的本质是把未分配利润和资本公积转增股