文本无关的话者识别中基于SVM的判别策略研究

来源 :第七届全国人机语音通讯学术会议 | 被引量 : 0次 | 上传用户：zsj1502

【摘要】

：

在话者识别中,判别策略常采用固定阈值作为门限对匹配结果进行判断,然而固定阈值在开放环境下健壮性较差.为解决阈值设定问题,本文通过分析匹配值间的特征,提出用SVM替代阈值作为判别决策的方法.在实验室环境下,结合GMM进行文本无关的话者实验,得到较好的结果.

【作者】

：

陈峰赵铁军尚福华李生

【机构】

：

哈尔滨工业大学计算机科学与技术学院

【出处】

：

第七届全国人机语音通讯学术会议

【发表日期】

：

2003年9期

【关键词】

：

话者识别文本无关阈值设定判别策略

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

电话语音库的设计与实现

语音数据库是语音识别技术研究的基础.当语音技术的研究进入实用化阶段时,对语音库的建设也提出了更高的要求,因此,建立大规模、高质量的电话语音数据库是这一领域的关键性问题.本数据库是国家863支持的项目,采用自动方式收集长达数据百小时的电话语音数据,力争更全面地体现不同电话信道、不同地方口音、不同年龄段说话人的特点.本文详细讨论了自动电话数据采集系统的构建、录音文本的设计、数据采集方案的设定、数据的后

会议

电话语音识别语音数据库电话数据采集

汉语自然语流中的音高变化

对取自汉语单人10000句话的录音语料分析得到:①与汉语音节音高变化的相关因素是多方面的,并且具有很大的随机性;②汉语双音节词的音高组合结构相当稳定,但它在基频轴上的位置和音高域与基在韵律短语中的前后位置,重音等级有关;③在短语水平上,呈现出明显的音高下倾趋势.本文除报告这些观察结果外,同时讨论汉语合成系统中音高控制的策略.

会议

自然语流声高变化语音合成声学分析

基于神经网络的汉语语音重音标注研究

本文描述了用人神经网络技术来标注汉语语音合成中的音节(字)和韵律词两级重音,提取音节和韵律词的特征矢量时主要考虑了韵律特征是有层次性的特点,针对音节和韵律词的特征空间设计并分别训练了一个神经网络,实验证明对音节重音的标注正确率达到了83.08﹪,对韵律词重音的标注正确率达到了78.24﹪.

会议

人工神经网络汉语语音重音标注语音合成

语音音色变换的现有技术分析

本文论述了如何利用现有技术对语音的音色进行变换,使源说话人的声音通过这种变化听起来像目标说话人发出的声音.我们对语音变换中的声学特征提取、特征对齐和特征分布建模的各种方法进行了论述.对基于混合高斯模型的均方误差最小准则下的连续语音变换方法进行了详细分析.并且讨论和比较了最新的研究结果.

会议

语音音色变换技术语音变换声学特征提取

元音、辅音粗判自适应电话语音增强方法

本文研究了一种简单有效的自适应语音增强方法:将语音粗略分割成元音与辅音段,在时域和频域分别进行处理.对于具有短时周期性的元音,采用时域平滑技术可以取得很好的降噪效果;对于具有随机特征的辅音,频域谱减法降噪简单可靠;根据可靠的时域降噪结果自适应地实时估计噪声谱,大大提高了谱减法的性能和整套降噪系统的性能.此外,本文还研究了一种利用子波整体信息的波形平滑技术,进一步提高了性能和可靠性.实验中,我们在N

会议

语音增强噪声抑制元音降噪辅音降噪

基于独立成分分析的数据驱动时域滤波技术

数据驱动的时域滤波是一类很有前景的提高语音识别系统鲁棒性的方法,线性区间划分(LDA)和主成分分析(PCA)已经被成功地应用.本文提出了一种新的采用独立成分分析(ICA)的数据驱动时域滤波技术.独立成分分析是一种子信号处理方法,它能将线性混和的统计独立信号进行分离.本文建议的算法可以有效地提取出语音信号的调制谱中1至16Hz的感知频率成分.通过语音识别实验表明,相对于LDA和PCA,基于ICA的时

会议

语音识别时域滤波技术独立成分分析语音信号处理

VoIP的QoS问题在WIN2000中解决方案浅析

提高网络带宽利用率和保证传输质量是相互矛盾的两个方面.随着网络技术和IP业务的迅速发展,当今网络信息传输越来越多样化,相应也出现了许多有不同传输要求的服务业务,使这一矛盾显得更加突出.如何有效利用现有带宽为不同传输要求的业务提供保质保量的服务逐渐成为专业人士关注的的焦点.VoIP QoS技术作为一种能管理带宽并提供服务质量的机制无疑成为该领域中研究的热点.本文从Win2000的QoS的工作原理分析

会议

语音优先技术VoIP QoS技术网络传输

语音编码中的一种线谱对加权量化矢量快速搜索算法

在实现CDMA2000 1X基站系统中的增强可变速率编码器(EVRC)算法的基础上,提出了一种针对线谱对(LSP)加权量化矢量的简便而实用的快速搜索算法.利用原始算法的分析结果,从LSP原始码本构造了新码本,利用原始码本和新码本实现了快速搜索.理论分析可以使搜索时间减少到原来的14.6﹪,实际测试结果表明,在使EVRC算法总处理时间比原来减少大约11﹪的条件下,优化结果仍能保证解码端的音质无明显下

会议

语音编码加权量化矢量搜索算法EVRC算法

基于裁剪门限改进的Katz平滑算法

平滑算法是统计语言模型中解决数据稀疏性问题的有效且非常重要的技术,在现有的众多平滑算法中,基于Good-Turing折扣方法和Back Off的预测方法的Katz平滑算法应用最为广泛传统的Katz平滑算法在计算折扣系数时要求一次事件必须出现,对所有语料库这一条件并非一定满足,并且当对高阶n元对进行裁剪时问题尤为严重.本文从Katz推导折扣系数公式的约束条件出发,扩展了约束条件,推导出仅依赖于语料中

会议

语音识别语言模型平滑算法裁剪门限

一种新的说话人识别信道补偿技术

在说话人识别系统中,训练语音与测试玉音的话机类型失配会使说话人识别系统识别性能显著下降.本文在说话人模型合成和话机归一化基础上提出一种新的信道补偿方法,结合模型和分数两个方面对系统进行信道补偿.NIST1999说话人识别评测库上的实验表明,采用新的信道补偿方法使系统在等错误率和最小检测代价上比仅采用倒谱均值减的基线系统分别降低了39.4﹪和20.9﹪,而且优于只采用说话人模型合成或话机归一化补偿的

会议

说话人识别说话人确认话机失配信道补偿说话人模型合成话机归一化

文本无关的话者识别中基于SVM的判别策略研究

与本文相关的学术论文