【摘 要】
:
本文根据近些年语音合成技术研究的情况,提出了一种基于参数距离的合成语音自然度客观评价方法。该方法采用计算同一发音人的自然语音和合成语音之间韵律特征参数的差距,使用DTW算法对两种语音的基频序列进行时间弯折对准处理,并对影响自然度的四个因素进行了线性加权,然后对客观评测结果与主观评测(MOS)的结果进行了比较。实验数据表明,本文提出的基频曲线失真测度与MOS之间具有很强的相关性。
【机 构】
:
清华大学计算机系,北京,100084 人机交互与媒体集成研究所,北京,100084
论文部分内容阅读
本文根据近些年语音合成技术研究的情况,提出了一种基于参数距离的合成语音自然度客观评价方法。该方法采用计算同一发音人的自然语音和合成语音之间韵律特征参数的差距,使用DTW算法对两种语音的基频序列进行时间弯折对准处理,并对影响自然度的四个因素进行了线性加权,然后对客观评测结果与主观评测(MOS)的结果进行了比较。实验数据表明,本文提出的基频曲线失真测度与MOS之间具有很强的相关性。
其他文献
本文对基于拉马克进化的拉马克克隆选择算法进行了研究。文章提出了"获得和传授"的概念,并且在SCSA基础上,提出了基于拉马克进化理论的新算法,即拉马克克隆选择算法(LCSA)。实验结果表明,经过对一些高维的多峰函数测试,LCSA相比于SCSA具有更高的效率和更好的可靠性。
本文对基于多重训练和交叉验证策略的BP神经网络信用评价模型进行了研究。文章采用多重训练和交叉验证策略,克服了针对小样本建立BP神经网络模型易陷入局部极小和出现"过训练"的缺陷。根据已有的企业信用评分指标体系,建立了合理、可靠的BP神经网络信用评价模型。
本文针对骨髓细胞图像的特点,采用连续小波变换对图像进行了处理,在消除原始图像噪声的同时,从不同的角度检测出图像的主要边缘。采用两级神经网络,利用基于神经网络的PCA算法获得图像的三个主分量,采用模拟退火算法和BP算法进行细胞的分类识别,获得了较好的识别效果。
本文给出了城市交叉口多相位信号配时的模糊控制方法,根据改进BP学习算法,利用多层神经网络分别实现了控制器的模糊化、模糊推理、模糊判决模块。结果表明,本文所设计的模糊神经网络控制器能有效地减少单交叉口平均车辆延误,具有较强的学习和泛化能力,是实现交通系统智能控制的一条新途径。
本文从资本市场中交易者与价格存在的相互影响出发,借鉴人工神经网络建模原理,提出了资本市场结构模型(CMSM),并对价格的演变过程给出了完整的计算方法。经对模型的拟合能力进行分析,表明该模型能达到很高的拟合精度。
本文对基于Hopfield网络的异常检测方法进行了探讨。本研究提出了一种在异常检测中用反馈神经网络构建程序行为的特征轮廓的思想,给出了神经网络算法的选择和应用神经网络的设计方案。实验表明,在异常检测中用反馈神经网络构建程序行为的特征轮廓,能够大大提高检测系统对偶然事件和入侵变异的自适应性和异常检测的速度。
本文对神经网络在工程车辆自动变速控制中的应用进行了探讨。本研究结合工程车辆的工作特点,通过基于径向基的人工神经网络对三参数自动换挡规律进行了系统建模和控制,并利用车辆传动试验台换档控制试验的数据对径向基网络进行训练。结果表明,该方法能够根据车辆运行状态确定最佳挡位。
本文分别利用线性鉴别分析、主成分分析和独立成分分析得到人脸图像的有效代数特征,以支持向量机作为人脸的分类器,有效的避开了人脸识别的小样本局限。该方法在ORL人脸数据库上进行识别,取得了优异的识别效果,并且对人脸的姿态,表情有一定的不敏感性。
本文提出了一种基于局部和全局混合的图像立体匹配方法。该方法首先采用基于窗口的局部算法进行初步匹配,从初步匹配结果过滤出错误匹配点,再采用全局的遗传算法对错误匹配点重新进行匹配,最终得到完整正确的匹配结果。实验证明,该方法较好地克服了以前算法的一些不足之处,计算速度快,匹配效果好。
本文在深入研究Laplacian-Gauss算子边缘检测方法及▽2G算子与(e)2f/(en)2算子性能分析的理论基础上,提出了一种新的检测的算法。实验结果表明,该算法在计算量增加不大的基础上提高了检测精度。