【摘 要】
:
将篇章层面的文本转换为准确、生动的合成语音,涉及了语言计算、韵律建模、语音合成等一系列技术问题。而这些问题的解决,一方面需要制定一个更具科学性的韵律描述方案,用以做为语言学与声学间的信息交互接口,进而构建语音合成系统的语言学、语音学计算模块;另一方面还将依赖具有丰富标注信息的言语数据库,由此提供定性分析与定量计算的实际样本。因而,言语数据库及其韵律标注,构成了合成系统研究的基础。本文选取新闻播报语
【机 构】
:
北京交通大学 信息科学研究所,北京 100044 中国传媒大学 国家语言资源监测与研究中心有声媒体
论文部分内容阅读
将篇章层面的文本转换为准确、生动的合成语音,涉及了语言计算、韵律建模、语音合成等一系列技术问题。而这些问题的解决,一方面需要制定一个更具科学性的韵律描述方案,用以做为语言学与声学间的信息交互接口,进而构建语音合成系统的语言学、语音学计算模块;另一方面还将依赖具有丰富标注信息的言语数据库,由此提供定性分析与定量计算的实际样本。因而,言语数据库及其韵律标注,构成了合成系统研究的基础。本文选取新闻播报语料为研究/加工素材,综合考虑计算建模需求及样本的特点,制定了一套新闻播报言语数据库的韵律标注内容及其标注规范。本文对语篇的停顿、重音、语气、语调的标注规范进行了具体的阐述;通过对言语数据库构建及韵律标注的具体实施,证实了所制定的韵律标注规范的科学性。
其他文献
汽轮机油系统是汽轮机的重要组成部分,在运行中出现故障将严重影响机组的安全,因此保障油系统的安全运行,加强汽轮机润滑油系统污染控制及管理显得尤为重要。论述了基建期间的汽轮机润滑油污染防护及生产期间的汽轮机润滑油监督管理及完善的技术措施。
本文首先简要回顾了2008年中国南方电网所辖区域出现的持续大范围严重的低温、雨雪冰冻灾害情况,并深入剖析了目前能量控制中心EMS(EnergyManagementSystem)不能很好地应对突发极端自然灾害造成的大面积停电事故的原因,然后以2003年8月14日的美加大停电事故为例,详细阐述了电网在线可视化调度与预警技术,分析了如何应用这项技术实施电力系统紧急控制,提高调度员在电网处于异常紧急运行状
本文分析了广西电网结构对南方电网500kV主通道安全造成的具体不利影响。通过各年度定量的220kV电网分区电力平衡分析,提出广西电网结构优化的可行目标和方向。针对“十一五”各年度广西电网的具体规划网架,提出各年度广西电网网架结构调整的候选方案。动态地评估广西电网和南方电网在“十一五”期间网架结构、负荷和电源分布、运行方式等方面存在的问题和特点,提出了操作性强的广西电网2007年、2008年和201
1000kV交流特高压输电是目前电压等级最高、技术最先进、建设难度最大的交流输电技术。在我国1000kV线路设计没有直接可供采用的设计原则和设计标准。为满足工程建设需要,合理确定技术原则和建设标准,需要全面研究和分析与工程建设有关的关键技术和设计方案。本文结合1000kV晋东南~南阳~荆门特高压交流试验示范工程的建设,介绍我国第一条单回路特高压交流架空输电线路的主要设计原则和特点,如导线选择、地线
国家电网公司特高压杆塔试验基地是目前世界上规模最大、试验能力最强、试验设备最先进的特高压杆塔试验研究基地,本文详细介绍了试验基地的建设目标、试验基地主要技术指标及特高压杆塔试验情况。
课题组成功完成了第一个具有完全国内自主知识产权的碳纤维导线及配套技术的研发与应用技术的研究,包括碳纤维复合芯导线的研制、生产、检测、设计、施工、运行等环节,对于实现电网升级改造、提高电网输送能力与效益具有重大意义。自主研发产品的导线高温拉断力、复合芯抗压性能、复合芯抗弯性能等关键指标显著优于国外技术产品,达到国际领先水平。首次将碳纤维复合芯导线应用于500kV超高压架空输电线路,解决碳纤维导线应用
我国首个特高压交流试验示范工程-1000kV晋东南至南阳至荆门输变电工程已成功建成并正式投入运行。本文立足试验示范工程建设的全过程,介绍了工程的总体情况和基本特点,阐述了工程在建设管理、科研攻关、工程设计、设备研制、施工建设及调试运行等方面的创新实践和取得的重大成果。推广应用工程经验,对推动电力工业科学发展具有重要意义。
多口音英语学习者口语语音库(CELSCOM:Chinese EFLLearners speech corpus with multi-accents )旨在收集和建立中国不同方言区英语学习者的英语口语语音,一方面为英语语音识别提供 训练音库,另一方面为研究不用口音的英语与标准英语的语音特性的差异。本库在设计功能语句库录音文本时,将焦 点位置、词性、词重音位置等作为条件综合考虑,并且将口语化的篇章作
人在说话的时候有各种各样的发音方式,如不同的语言;带情感的发音;快速与慢速、大声与小声等等。如果不做任何处理,直接用传统的说话人识别方法来处理,结果会比较差。因此,本论文研究如何降低由人的发音方式不同而导致的说话人识别性能下降。首先,进行多发音方式数据采集的设计,选择现实生活中常见的发音方式做研究;接下来在模型域提出基于多发音方式背景模型融合和模型补偿的改进系统方案;最后给出基线系统和改进系统的实
本文主要讨论语速的测算和分类问题,试图建立一套能够自动检测语速变化类型的有效方法,以便消除语速对韵母时长的影响,使得规整后的韵母时长能更好地反映语句的韵律节奏特性,以增强韵母时长的可预测性,从而提高对连续语流中韵母时长的预测精度。通过数据对比分析,本文提出以小句作为语速的测算单元,以其实际时长和预测时长的比值作为语速的测算指标,并在此基础上将小句语速区分为快速、中速和慢速三种类型。统计结果表明,消