论文部分内容阅读
语音是信息交互的重要方式之一。二十世纪九十年代以后,国内语音技术进入了飞速发展时期。随着汉语语音编码、语音识别、语音转换等技术的快速发展,相关产品已经在许多领域得到了广泛应用。语音已经突破了以声音为唯一介质、以听说为主要方式来传递信息的阶段,语音正快速与文字、图像融会在一起,通过智能终端、互联网等媒介以更方便、更快捷的方式表达和传递信息。人们以语音进行交流时,韵律隐含着文字所不能表达的信息,因此在语音合成系统中韵律建模具有重要地位。在嵌入式文语转换系统中,由于资源限制无法获得十分符合语境的基元,使合成语音的自然度难以得到改善。本文对语音分析与文本分析相结合获取韵律信息的方法进行了探索和研究,在服务器上进行基于语音的韵律提取及韵律信息标注工作,而在手机、PDA等智能终端进行韵律信息解析及语音合成工作。本文以提高合成语音的自然度为目的,从原始语音出发获取语句的韵律信息,主要进行了三项工作:首先对汉语连续语流进行基本语音学处理,然后根据汉语连续语流韵律特征的声学表现对韵律信息进行提取,最后对从语音获得的韵律信息进行标注。对连续语流的基本语音学处理主要进行了基于音节的语音切分、基频提取和基频曲线平滑的工作。对韵律信息的提取主要是对韵律边界进行判断,对声调进行识别,对重音和语调进行判别。声调识别和语调判别分别采用了HMM技术,重音判别则采用了神经网络,经听辨测试,认为提取的韵律信息基本符合人们的听觉判断。最后,根据韵律信息表述的需要对SSML1.0进行了扩展,并应用于韵律信息的标注。