基于子带VQ及ANN的话者确认系统的设计

来源 :电路与系统学报 | 被引量 : 0次 | 上传用户:tiantianweb9737l
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
话者识别系统的时间鲁棒性是影响话者识别系统实用化的关键问题之一。为了提高系统的时间鲁棒性,本文提出了基于子带矢量量化(SBVQ)及人工神经网络(ANN)的话者模型。将语音文本的有效频段划分为几个子带,分别求取于带上的矢量量化码本(SBVQ码本),利用BP型人工神经网络(BPNN)对训练数据在各个子带上的量化误差进行拟合,即可训练出话者模型(SBVQ码本及BPNN的极值矩阵、确认阈值)。该话者模型反映了不同频段对话者识别系统性能的不同影响,并可将时间间隔等因素对系统性能的影响局限在某个子带内从而提高模型的时间鲁棒性。实验表明,本文提出的(SBVQ+BPNN)话者模型具有较好的时间鲁棒性。 The time robustness of speaker recognition system is one of the key issues affecting the practical use of speaker recognition system. In order to improve the time robustness of the system, this paper proposes a speaker model based on Subband Vector Quantization (SBVQ) and Artificial Neural Network (ANN). The effective frequency band of the speech text is divided into several subbands, and the vector quantization codebook (SBVQ codebook) is obtained from the band respectively. The BP neural network (BPNN) is used to quantize the quantization error of training data on each subband Fitting, the speaker model (SBVQ codebook and BPNN extremum matrix, threshold of acknowledgment) can be trained. The speaker model reflects the different effects of inter-speaker identification system performance in different frequency bands and can limit the impact of time intervals and other factors on system performance within a certain sub-band to improve the time robustness of the model. Experiments show that the (SBVQ + BPNN) speaker model proposed in this paper has better time robustness.
其他文献
阅读能力的高低决定着学生语文水平的高低,对于初中语文来说,阅读教学向来都是语文教学这一科目的重点之一.但是目前广泛存在于初中语文课堂的阅读教学仍旧是一种比较传统的
会议
2011—2012年度的“广厦奖”共有73个项目喜获殊荣。获奖项目的规划设计水平、环境质量、工程质量、住宅性能不断提高,影响力不断扩大。作为“广厦奖”评选委员会副主任委员,
一、福建省龙眼生产的現状和問題 龙眼是福建的特产。福建龙眼的产量占全国龙眼总产量的一半以上。据1979年统计,全省栽培面积达16.94万亩,占全省果树总面积的14.18%;总产69
在信息分享充分的时代,互联网为我们提供的吴炯的资料少之又少,一个技术工作者似乎很难引起舆论的兴趣,他们也为自己的不受干扰而窃喜,他最为人熟知的是,2006年末,媒体报道关
科技发展日新月异,各校均已实现多媒体全面覆盖.多媒体不仅能激发学生的学习兴趣,有效创设问题情境,而且能培养学生的创新精神与实践能力,实现多媒体技术赋能初中英语课堂教
随着社会经济的不断发展,我国教育界作为思想的先驱也一直在与时俱进,为社会输出全面发展型人才已经成为了学校的第一要务,对于儿童的教育也不再像过去那般只局限于学习成绩.