【摘 要】
:
本论文主要的研究内容是基于隐马尔可夫模型的说话人识别的改进和应用。说话人识别是根据人的声音来识别人的一种生物认证技术,有非常好的前景。而隐马尔可夫模型则是在说话人
论文部分内容阅读
本论文主要的研究内容是基于隐马尔可夫模型的说话人识别的改进和应用。说话人识别是根据人的声音来识别人的一种生物认证技术,有非常好的前景。而隐马尔可夫模型则是在说话人识别领域应用最广泛,效果最好的一个模型。 作者从说话人识别的各个角度进行了研究,实现了包括语音采集、特征提取直到产生识别结果的在内的说话人识别系统。在该系统的基础上,做了下列几个方面的改进研究: 1.得分计算方法的改进:语音中有很多的特征能够反应说话人识别的性能,但是所占的比重不一样,传统的说话人识别得分计算同等对待所有特征。引入假设检验原理到说话人识别中,建立反模型,可以消除掉无关因素的影响。本文中讨论了两种反模型的建立方法。考虑到这两种模型可以优势互补,提出了一种结合的方法,改进了性能。 2.训练方法的改进:HMM用密度函数来模拟特征的分布,但是这种模拟和实际情况有一些偏差。另外,基于最大似然准则的说话人识别只用说话人自己的数据来训练,不能有效刻画说话人之间的差异。而基于最小分类错误准则(MCE)的方法能解决上述两个问题。本论文讨论了MCE方法并在闭集说话人系统中实现并做了改进。 3.内嵌语音识别的说话人识别在实际情况下的应用:说话人识别的性能现在还不能满足实际环境的要求,而语音识别的发展已经比较成熟。所以,融合说话人识别和语音识别来进行身份认证是一种能满足实际要求的可行方法。论文讨论了各种融合的思路,并基于离散数字音简单地实现了融合。
其他文献
基于案例的推理(Case-Based Reasoning,简称CBR)以完全不同于基于规则的推理(Rule-Based Reasoning,简称RBR)的方式在人工智能(ArtificialIntelligence,简称AI)的众多技术中
随着Internet技术和WWW服务的发展,Web网络流量和网页访问延迟日益引起人们的关注,对这两个问题的解决影响了Internet的持续发展.代理缓存技术是解决这两个问题的最常用方法.
该文以研发机群计算软件为主要内容,利用Java开发一个跨平台的、基于消息机制的并行编程环境JNOW,为机群计算技术的研究提供新的思路.论文的工作主要集中在以下三个方面:1从
该文密切围绕水下目标识别这一核心问题,以实际工程应用为背景,主要采用时频分析与非高斯信号处理方法,对水下目标特征提取和分类算法这两个关键环节,展开了下列研究工作:(1)
世界经济的平稳增长以及机动车价格的大幅度下跌导致了最近几年机动车的私人拥有量在不断的上升。而我们在享受机动车带来的便利的同时,交通事故的增加也在困扰着我们。故此,
随着信息技术的迅猛发展,各个部门积累了海量数据,迫切要求从这些数据中自动地采掘有价值的信息和知识以支持决策。于是数据采掘技术应运而生。关联规则采掘是数据采掘中的一个
该文分析并比较了各种基于树结构的多维数据分布方法,给出了基于k-d树结构的分布方法的详细设计方案,指出设计基于传统索引结构的数据分布方法是解决并行数据库系统数据分布
该课题主要研究以对象数据库为后台的在线服装博物馆系统模型的特征、功能和结构.借助该实验室网络数据库研究所已经成功完成的"服装文化多媒体数据库"课题项目,该课题在理论
该文讨论了软件内建自测试中类测试模板的设计与实现.类测试模板是面向对象软件测试模板中最基本的测试模板,它通过各种前台界面和分析模块收集生成类测试用例需要的信息并存
web上有海量的数据信息,怎样对这些数据进行应用,成了现今数据库技术的研究热点,数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题,充分利用有用的