【摘 要】
:
说话人识别作为生物特征量识别技术,在司法鉴定、信息安全、人机智能等领域具有重要意义。本文借鉴传统语音信号分段方法,以符合人耳感知规律原则,研究新型频段划分方法,并从
论文部分内容阅读
说话人识别作为生物特征量识别技术,在司法鉴定、信息安全、人机智能等领域具有重要意义。本文借鉴传统语音信号分段方法,以符合人耳感知规律原则,研究新型频段划分方法,并从语音信号的非线性入手,运用混沌技术研究语音信号的特征提取,建立语音的混沌特性模型表征信号的空间运动状态。主要研究内容如下:提出基于Mel尺度的小波包分解技术。小波包分解的灵活性可同时满足语音信号对不同时域、频域信息的要求。将符合人耳听觉感知机制的Mel尺度融合到小波包分解中,为语音信号频段划分提供更有效的方法。与传统小波包对比可得,Mel尺度小波包划分的各子带信号时频信息更丰富,凸显了不同语音信号间个性化特征属性。针对语音信号的混沌性判定问题,采用互信息法确定最佳延迟时间,饱和关联维数法选取嵌入维数,并重构语音时间序列的相空间。采用基于Wolf的最大Lyapunov指数法判定语音时间序列的性质,仿真实验表明语音信号具有混沌性。为体现语音特征的总体性,采用分形维数表征语音信号混沌运动的内在结构特点,提出语音信号的盒形维数特征辅助其他特征参数以提升说话人特征的鲁棒性。针对子带语音信号线性相关性及混沌特性,提出基于线性模型和非线性模型的特征参数提取方案。构建基于小波包的时域频域自回归模型,表征低频能量特征。采用Volterra自适应预测技术建立语音混沌时间序列的声学模型,提取Volterra滤波器权矢量参数作为说话人特征,仿真实验表明了该方案预测精度高于线性预测模型。融合时域频域自回归模型和Volterra自适应模型的特征,采用HMM进行说话人识别。仿真实验表明本文提出的特征提取方法有效提高了说话人识别正确率,达到了预期效果。
其他文献
随着网络的发展,网络资源呈现突飞猛进的增长,这给WEB用户带来了诸多不便,搜索引擎应运而生。然而不同背景、不同目的、不同时期的用户的信息需求往往是不同的,搜索引擎面对
近年来,随着手持设备技术的发展和无线通信技术的更新,移动支付得到迅速的发展,频繁地出现在人们的视野中,然而许多人并没有接受这个新兴的商务模式,关键在于人们对移动支付安全性
Web服务提供了跨平台、操作系统、编程环境的良好的互操作性,可使用松散耦合的集成模式实现异构系统之间的柔性集成,比传统的DCOM、RMI和CORBA要好得多。它还能在帮助简化B2B
语音情感识别是情感计算研究中的重要课题,在智能化的人机交互界面设计、提高语音识别的准确性和情感翻译等方面有着广泛的应用前景。而可视化作为模式识别中的一种新方法,也
工程内业资料是工程建设过程中形成的各种形式的资料,它包括工程质量资料、试验报告、检测报告、施工原始资料。内业资料是反映工程质量的客观见证,同时也是竣工验收、创优评审
数据仓库包含大量的历史数据,为决策者提供综合信息,它既能反映部门的宏观状况,又包含了许多业务细节数据。同时,数据仓库需要支持复杂的多维分析和即席查询,并注重存储空间
随着新能源开发利用进程的加快,风力发电成为当今社会很热门的一个话题。我国风力资源极为丰富,风能利用一直很受政府重视,风电场的建设也在日趋扩大。在风电场的实际运行中,风电机组相关工作人员需要通过Internet远程访问风电机组获得所需实时信息,实行远程诊断与远程维护,保证风电场的正常运转。在各类用户与风电机组交换信息的过程中,监测数据与控制命令在基于TCP/IP的网络上很容易被未授权的用户窃听和篡改
心电信号是一种弱电信号,在信号采集、A/D转换和放大过程中,会受到来自系统内部和外界的各种干扰。计算机网络具有连接方式多样、终端分布不均匀性和网络的开放性等特点,存在着
随着互联网和Web技术的飞速发展,传统的图书馆正在向数字化和网络化过渡,各种各样的数字资源层出不穷,给科技文献检索和查新工作带来了诸多不便。需要构建一个能够整合各种异构
由于本文致力于移动无线网络(MANET)中的安全问题与博弈论方法相结合的研究工作。MANET由于其特性,面临着多方面的,各种具有挑战性的安全问题,从底层硬件问题,软件问题,信道