耳语音检测技术研究

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:liusheng123321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在生物学的定义中,会说话和能够借助工具是人和其他动物最本质的差别。语言也是自人类诞生以来所依赖的重要的交流工具,语言具有自然且方便,简洁且明了,准确且高效等优点。语音是语言的外在表示方式,能够最直观的体现我们的思维活动,语音由人的发音器官产生,承载着非常丰富的信息,是人们思想表达和情感交互的重要方式。在人们探索语言追本溯源的过程中逐渐形成了语音学,语音学是语言学的分支之一,它旨在探索人类的语言声音,本文所讨论的耳语是语音学的分支之一。耳语发音模式的语音被叫做耳语音(whisper),又称之为悄悄话,是日常生活中最普遍的信息交互形式之一。对比正常的发音方式,耳语的发音模式较为独特,当用耳语发声时发声器官不会产生振动,而是一种特殊的摩擦激励发声模式。近代由于通信设施和科技手段的不断完善和发展,耳语的应用也更加的广泛,从最开始的理论研究发展到当下的实际应用。正因为耳语发音的独特性,使用耳语音的交流方式可以在很好的保护个人隐私的情况下,同时保证不会干扰到其他人的正常活动[1],所以研究耳语音具有重要的研究意义。本文围绕耳语音检测技术展开讨论,耳语音端点检测是耳语音识别的预处理部分,它非常大的影响了耳语音识别系统的精确度,本文针对耳语音在静音和在噪声背景下分别使用能零比(Energy to Zero Ratio,EZCR)和经验模式分解(Emperial Mode Decomposition,EMD)的方法实现了耳语的端点检测。本文作者通过观察语音时域和频域的基本特征提出了三种具有优良区分性的基本声学特征音高、音强和共振峰;通过对上述特征的分析,提出元音的可能存在方式具有两种,一种是正常音中的振动形式,第二种是耳语音中的无振动的存在形式。并利用三种特征借助机器学习分类算法和高斯混合模型(Gaussian Mixture Model,GMM)统计学分类算法来区分正常语音和耳语音两种语音声效模式,比较了8种分类算法的分类性能,得到K近邻的分类算法分类性能最优的结论。同时编译了离线训练的耳语音检测网页展示软件。研究了不同的时长段3s,4s,5s,6s,混合时长的语音对检测结果准确度的影响,并且得到不同时长的语音段对于耳语音和正常语音的分类结果基本上没有影响的结论。最后,分别利用百度API和HTK(Hidden Markov Model Toolkit)工具箱实现了特定品质语音的识别和耳语音孤立词的识别工作。
其他文献
化石能源的不可再生性决定了发展可再生能源将成为人类社会发展的必要途径,其中太阳能被认为是21世界最有潜力的新能源之一。然而太阳能能流密度低、辐射不稳定等固有缺陷,使得太阳能利用的经济性还不能与常规化石能源相竞争。本文以太阳能耦合燃气-蒸汽联合循环的系统为研究对象,研究槽式太阳能集热器与常规燃气-蒸汽联合循环的综合利用特性,实现不同品位能源的互补利用,旨在提高太阳能的利用率,降低化石能源消耗和污染物
随着我国经济的快速发展,大数据及人工智能等技术的发展越来越快。在这样的环境下,制造业作为国家的支柱产业,也应跟随时代的发展进行升级。李克强总理于2015年3月首次提出“中国制造2025”的远大计划,他强调改革创新是中国经济升级发展的根本。企业应在此环境背景下,努力提升企业的核心竞争力以及品牌知名度。格力电器作为制造业中家电行业的代表企业之一,始终坚持自主研发、自主生产,于2016年实施去库存政策,
随着我国经济体制的改革,资本市场结构一直都在不断地调整优化,新三板市场成为继主板、中小板和创业板后多层次资本市场建设中的重要组成部分。尽管相对于其他板块新三板市场
沙洋县居江汉平原与鄂西北山区结合部,西北高东南低,干旱频繁,降水时空分布不均,北旱南涝,是鄂中受旱涝威胁最严重区域之一。基于县域内洪涝干旱自然灾害的防治,沙洋县历来重视水利工程的建设,有着丰富的水旱灾害治理经验。沙洋县水务局是沙洋水利建设与管理的主导力量,在沙洋县水利发展与治理方面发挥了重要的作用。从特殊的自然水文出发,分析沙洋在新中国成立前及新中国成立以来的水旱灾害历史。尝试运用历史文献法、社会
近年来光伏并网发电产业扩展迅速,然而随着大规模光伏并入电网,孤岛问题变得越来越突出,于是,孤岛的检测识别及其孤岛保护的研究正扮演着举足轻重的角色。当前,孤岛检测在逆变器并网的发电系统领域的技术主要分为以下两种:被动式和主动式。众所周知,经常有多台光伏逆变器并入电网,所以多逆变器并网的孤岛检测和识别也日益引起人们关注。因此,本文在分布式光伏发电多逆变器并网的基础上,研究如何更有效的、更好的区别孤岛状
高尿酸血症及痛风的发病率在逐年攀升,而临床上主要用作治疗高尿酸血症及痛风的药物,如别嘌呤醇、非布索坦等,存在一系列的副作用。防病胜于治病,开发出天然无毒副作用的保健
近年来,在微机技术、信号处理技术、生物、人工智能等交叉学科相互结合和迅猛发展下,协同控制群体运动的技术也取得了极大进展,并成为不同领域研究人员研究讨论的热点问题之
学位
刘慈欣的科幻小说叙事,集“科学性”“文学性”和“幻想性”等要素于一身。既有对于科学技术理论细腻的描绘,也有属于普通文学对科技和人文多元化角度的深入思考。与以往的中国科幻小说相比,刘慈欣科幻小说的叙事内容,具有明显的“硬科幻”特征。不同性格、年龄和性别的人物,都被打上了标签化的烙印,给人以一定程度的“硬化”感。而在故事的发展变化中,则巧妙嵌入“硬”科学理论作为情节的基本支撑。对比刘慈欣早期与中后期的
局部时变信号广泛存在于视频监控、工业控制、电力系统、水下信号传输等现实世界中,如何降低连续局部时变信号的带宽和节点电能消耗,同时高效稳定地进行信号传输一直是研究的