基于多域分析的说话人识别研究

来源 :山东理工大学 | 被引量 : 0次 | 上传用户:lkjall
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是一种通过声音进行身份认证的技术,该技术在国家安全和商业中有重要的应用价值,因此对其进行深入研究与实现具有极其深远的意义。在理想的实验条件下,可以控制语音的采集环境和传输信道,使语音数据拥有较高的信噪比和匹配的信道条件,从而保持说话人识别系统较高的性能。但是在现实场景中,语音采集过程容易混入环境噪声,并受到不同程度的信道干扰,系统的识别性能难以保证。因此,如何削弱环境噪声和信道干扰等因素的消极作用,提高说话人识别系统在复杂环境下的鲁棒性,是当前该领域的重要研究目标之一。目前,针对说话人识别系统鲁棒性的研究主要从特征域、模型域和得分域三个方面开展。在特征域,重点研究目标是从语音中获取代表说话人、兼具可分性和抗噪性的特征参数。在模型域,重点研究目标是训练出稳健的说话人匹配模型,并通过信道补偿方法解决注册模型和测试语音的信道失配问题。在得分域,重点研究得分分布问题,通过得分规整使匹配得分尽可能少的受到环境噪声和信道干扰等因素影响。以上针对说话人识别系统的多域研究已取得较多进展,但是现有的许多算法依然存在局限性,面对复杂的应用环境,有必要弥补当前算法的不足,进一步提高说话人识别系统的鲁棒性。本文主要从特征域和得分域着手,针对说话人识别中的鲁棒性算法展开研究,主要工作和创新点如下:(1)分别构建了基于GMM-UBM、GMM-SVM和IVector-PLDA模型的说话人识别系统,在此基础上进行了针对特征域和得分域的研究。(2)在特征域,本文重点研究了噪声环境下相对鲁棒的幂律归一化倒谱系数(Power-Normalized Cepstral Coefficients,PNCC),并对PNCC原有的算法做了改进,加入动态差分参数,在特征后端利用倒谱均值减(Cepstral Mean Subtraction,CMS)和倒谱方差规整(Cepstral Variance Normalization,CVN)方法进行补偿。在噪声环境下,改进的PNCC比MFCC和原PNCC有更好的性能。(3)在得分域,研究了目前已有的得分规整方法,并针对其局限性,提出了一种基于对数似然值归一化(Log-likelihood Normalization,LLN)的得分规整算法,能够有效扩大目标说话人和非目标说话人得分的差距,有利于提升在统一阈值下系统的判决性能,并且不需要使用预先的开发集,可以在系统后端进行,对多种系统具有良好的普适性。(4)将MFCC、改进的PNCC特征和GMM-SVM、IVector-PLDA模型组成的多系统得分进行了融合,并应用LLN得分规整,有效利用了表征说话人的信息,实现了多域中优势的融合。实验表明,多系统得分融合比单一的说话人识别系统性能更好,加入LLN方法后,多系统得分融合的性能得到进一步提升。
其他文献
齿轮箱可以调节转速,在重载、高速、化学腐蚀等条件下长时间工作,齿轮会发生磨粒磨损、疲劳磨损、齿轮折断最终导致齿轮箱报废。若在齿轮失效之前及时更换发生故障的齿轮,可以在保证安全的情况下最大限度利用资源,为了探究齿轮缺陷出现以后,不同载荷条件下齿轮磨损状态,以及缺陷点附近磨损迁移变化情况,本文利用油液分析技术辅助以振动波形分析,对不同负载下的缺陷齿轮磨损衰退过程的演变进行研究。本文通过SOLIDWOR
智能车是未来车辆发展的重要方向,其技术涉及面广,包含车辆、控制、通信、计算机等多个领域的关键技术。在城市道路环境中,通常应用视觉检测、精确定位等方法就能够很好地满足自动驾驶车辆的环境感知需求,但在车辆拥挤的城区路况中车道线被拥挤的车流所遮挡,而车辆定位也会因城区道路的多路径效应严重影响其定位精度。在城区结构化道路车辆拥挤的情况下,常规的方法无法满足自动驾驶汽车安全行驶需求,本文基于视觉检测技术,通
烧结钕铁硼作为常见的永磁材料之一,是由钕、铁、硼组成的四方晶系晶体,具有很高的磁能积。该材料的优点是制作成本低廉、体积小、能量密度高等;但其缺点也很明显,脆性大、难加工、热稳定性差。烧结钕铁硼属于典型的难加工材料,采用传统的加工方法加工困难。国内外学者对烧结钕铁硼的加工方法和加工后的磁学性能研究较少。本研究针对烧结钕铁硼材料的特点,利用电火花加工的非接触式加工方式,将磁场作为辅助手段,实现烧结钕铁
随着我国经济的迅速发展,电力需求量越来越大,电网的电压等级、系统容量等正逐年增加,尤其是近年来特高压输电工程的发展,对电力系统的供电可靠性提出了更高的要求。电力系统运行经验表明,大多数输电线路事故是由于雷击输电线路或杆塔引起跳闸所致的。降低输电线路的接地电阻是降低雷击跳闸率的有效措施。对于接地电阻超标的杆塔,许多降阻措施具有良好的降阻效果,但是在施工时需进行长距离开挖、占用杆塔周围大量土地,有时需
在碰撞发生时,汽车车身中的薄壁结构在瞬间增大的冲击力下发生压溃变形,有效的吸收了绝大部分能量,从而达到保护驾驶员的目的。因此,提升薄壁结构的耐撞性具有重要的研究意义。结构仿生学近年来在工程领域得到了广泛的应用。受樟子松的启发,本文结合结构仿生学的思想,设计了新型多胞薄壁结构,采用理论分析和有限元模拟的方法对该类结构在轴向加载作用下的耐撞性进行了研究,并对耐撞性较好的薄壁结构进行了多目标优化设计。考
金属零部件的失效往往源于磨损、腐蚀和划伤等表面损伤,因此,实现对零部件表面损伤的修复对资源的节约和经济的可持续发展具有重要意义。铜合金因其具有导热性好、高温易氧化以及对激光吸收率低的特性,使其零部件的修复存在很大的局限性。电火花沉积技术(Electro-spark deposition,ESD)由于具有对母材热输入小、成形层与基体呈冶金结合并且便携易操作的特点,常被用于零部件的表面修复。本课题首先
碳纤维/环氧树脂基复合材料长期以来以其比强度高、比模量大、热膨胀系数低、可设计性强、抗疲劳性好、耐腐蚀和结构尺寸稳定等特点被广泛应用于卫星飞行器的本体结构、太阳能电池板和天线等多功能结构件以及无人机和微电子设备等领域。碳纤维复合材料已成为衡量一个国家科技发展水平的重要指标之一。然而由于其导热和耐高温性能较差等缺点,越来越难以适应电子信息时代高频率和高集成化发展的要求。另外,纤维增强环氧树脂基复合材
作为一种金属复合材料,泡沫铝具有高比强度、高能量吸收性能的特性,这些特性可使其用于汽车制造业、航空航天等领域。然而,在制备泡沫铝材料的过程中需要对铝熔体进行增粘,而增粘过程中长时间的搅拌会造成铝熔体的过度氧化,且加Ca增粘生成的大量复合氧化物会降低材料的塑性。因此,本文在熔体发泡法制备泡沫铝的基础上,拟使用无增粘发泡技术,以发泡混合体替代单一发泡剂,实现泡沫铝材料在铝熔体无增粘状态下的发泡成形,主
当今世界经济快速发展,而能源与社会发展息息相关,由于传统化石能源在使用过程中会带来环境污染问题,因此,燃料电池、风能、光伏发电等清洁能源发电系统逐渐成为各国的研究重点。其中,又以光伏发电发展最为迅速,而并网逆变器是光伏发电系统的核心部件之一,在能量转换过程中具有重要作用。并网逆变器根据有无隔离变压器,可以分为隔离型逆变器和非隔离型逆变器,其中,工频隔离变压器成本高、体积大,而高频隔离变压器需要引入
随着电致发光材料的不断发展,有机发光二极管(OLED)材料因节能、成本低、发光稳定、效率高等优势被广泛应用于照明、显示等领域。第一代发光材料为传统荧光材料,根据自旋量子理论其激子利用率最高仅可达到25%。为了解决发光效率低的问题,科研工作者研发了第二代磷光材料,通过掺杂重金属增强单重态与三重态间的旋轨耦合强度,基于磷光材料制作的OLED内量子效率可以达到100%。磷光材料性能虽好,但重金属储量有限