基于高斯混合模型的说话人跟踪系统

来源 :第八届全国人机语音通讯学术会议(NCMMSC8) | 被引量 : 0次 | 上传用户:wysnl2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文介绍一个应用于互联网监控的说话人跟踪系统,本系统基于高斯混合模型,通过线性自适应得到目标说话人的统计模型.为了能更精细地定位出目标说话人的位置,本系统采用一种对输入的语音段先根据语音特征距离测度细切分后根据说话人得分合并的机制.通过对不同信道的语音进行测试,系统的鲁棒性和识别性能良好.
其他文献
期刊
租房宝本质上做的是房屋租赁的“按揭”业务,用户在此平台上用信用卡便捷地支付房租,然后再分期还款。租房宝还可以向房东谈判,适当降低房租,帮助租户节约租金。租房宝已经与支付
在噪声鲁棒语音识别研究中,并行模型结合方法因其能够满足非平稳噪声环境且理论上使模型接近背景环境匹配模型而成为语音识别噪声鲁棒性研究的重要方法之一。本文提出了利用
本文研究了广播电视环境下的说话人跟踪检测技术.论文的主要工作集中在两个方面:音频数据的切分和目标人检测.提出了基于熵的音频跳变点检测方法,切分后的语音片断通过说话人
会议
本文提出了一种改进的最大似然线性回归说话人自适应方法一线性预测最大似然线性回归说话人自适应方法.由于LPHMM相比于经典的HMM充分利用了语音信号的时间相关性信息,能更充
会议
1969年“定位”理论由特劳特先生首次提出1972年美国权威营销传播类刊物《广告时代》刊登了特劳特和阿尔·里斯的系列文童《定位时代来临》,定位观念从此进入人们的视野;1981年
“干经济”是近现代以来持续了数百年的经济发展模式,其核心是以工业理性、经济理性来完成埘经济资源的分配。也正因为如此,人类这几百年来强调的是理性、效率,人本身只等于一个
为了提高语音识别系统的鲁棒性,本文提出了一种特征参数规整的优化算法.整个算法由环境选择、MFCC差分扩展、均值方差规整(MeanandVarianceNormalization,MVN)和ARMA滤波器平
本文提出了一种广播语音的说话人切分聚类方法.该方法将切分和聚类循环进行,最后同时得到切分和聚类结果,克服了先切分后聚类的传统方式中,切分的错误会累加到后面的聚类性能
会议
建立疾病数据库,整合医生资源,为用户提供移动的自诊或在线问诊服务,未来用户可像在淘宝上购物一样得到医疗健康咨询服务。北京春雨天下软件有限公司的第一款“自查+问诊”的健康