【摘 要】
:
本文提出了一种广播语音的说话人切分聚类方法.该方法将切分和聚类循环进行,最后同时得到切分和聚类结果,克服了先切分后聚类的传统方式中,切分的错误会累加到后面的聚类性能
【机 构】
:
中国科学院自动化所高技术创新中心,北京,100080
【出 处】
:
第八届全国人机语音通讯学术会议(NCMMSC8)
论文部分内容阅读
本文提出了一种广播语音的说话人切分聚类方法.该方法将切分和聚类循环进行,最后同时得到切分和聚类结果,克服了先切分后聚类的传统方式中,切分的错误会累加到后面的聚类性能中的缺点.采用各态遍历的HMM模型,其中每一个状态代表一个说话人,每个状态的概率密度函数用GMM模型描述.在没有类别数先验信息的前提下,预估足够大的类别数,平均切分语音进行初始化;根据得到的模型,通过Viterbi方法切分语音,得到新的切分结果;然后重新训练模型,并聚类合并说话人模型,保证混合数信息不变;不断重复上述过程,直到Viterbi打分降低.实验结果表明,该方法可以保证聚类和切分的性能良好.
其他文献
产业环境趋冷时,三一恰站在通往1000亿的门槛上,它需要通过组织架构调整和国际化来冲过这一关唐修国的一条腿受伤了,打了绷带走路的时候需要借助双拐。不过“休息”对他来说
本文提出了可应用于资源受限系统的汉语声学模型.应用该模型,可以大大降低存储空间,在保证识别率基本不变的前提下,减少了识别时间.在550个命令词组成的词表的实验室环境的识
租房宝本质上做的是房屋租赁的“按揭”业务,用户在此平台上用信用卡便捷地支付房租,然后再分期还款。租房宝还可以向房东谈判,适当降低房租,帮助租户节约租金。租房宝已经与支付
在噪声鲁棒语音识别研究中,并行模型结合方法因其能够满足非平稳噪声环境且理论上使模型接近背景环境匹配模型而成为语音识别噪声鲁棒性研究的重要方法之一。本文提出了利用
本文研究了广播电视环境下的说话人跟踪检测技术.论文的主要工作集中在两个方面:音频数据的切分和目标人检测.提出了基于熵的音频跳变点检测方法,切分后的语音片断通过说话人
本文提出了一种改进的最大似然线性回归说话人自适应方法一线性预测最大似然线性回归说话人自适应方法.由于LPHMM相比于经典的HMM充分利用了语音信号的时间相关性信息,能更充
1969年“定位”理论由特劳特先生首次提出1972年美国权威营销传播类刊物《广告时代》刊登了特劳特和阿尔·里斯的系列文童《定位时代来临》,定位观念从此进入人们的视野;1981年
“干经济”是近现代以来持续了数百年的经济发展模式,其核心是以工业理性、经济理性来完成埘经济资源的分配。也正因为如此,人类这几百年来强调的是理性、效率,人本身只等于一个
为了提高语音识别系统的鲁棒性,本文提出了一种特征参数规整的优化算法.整个算法由环境选择、MFCC差分扩展、均值方差规整(MeanandVarianceNormalization,MVN)和ARMA滤波器平